ES创建mapping时字段别名

ES默认是动态创建索引和索引类型的mapping的，但是在学习的时候还能这样用，在生产中一定是手动制定mapping！在生产中经常会遇到这样的需求，想用某个字段进行统计，又想对该字段进行模糊查询，解决这种需求的方法就是对该字段创建别名！

mapping结构如下：

 {

     "settings" : {

         "index" : {

             "analysis" : {

                 "filter" : {

                     "english_keywords" : {

                         "type" : "keyword_marker",

                         "keywords" : [

                             "topsec"

                         ]

                     },

                     "english_stemmer" : {

                         "type" : "stemmer",

                         "language" : "english"

                     },

                     "english_possessive_stemmer" : {

                         "type" : "stemmer",

                         "language" : "possessive_english"

                     },

                     "english_stop" : {

                         "type" : "stop",

                         "stopwords" : "_english_"

                     }

                 },

                 "analyzer" : {

                     "english" : {

                         "type" : "custom",

                         "filter" : [

                             "lowercase",

                             "english_stop"

                         ],

                         "tokenizer" : "standard"

                     },

                     "ik" : {

                         "filter" : ["lowercase"],

                         "type" : "custom",

                         "tokenizer" : "ik_max_word"

                     },

                     "html" : {

                         "filter" : [

                             "lowercase",

                             "english_stop"

                         ],

                         "char_filter" : [

                             "html_strip"

                         ],

                         "type" : "custom",

                         "tokenizer" : "standard"

                     },

                     "lower" : {

                         "filter" : "lowercase",

                         "type" : "custom",

                         "tokenizer" : "keyword"

                     }

                 }

             },

             "number_of_shards" : "1",

             "number_of_replicas" : "0"

         }

     },

     "mappings" : {

         "test" : {

             "_all" : {

                 "enabled" : false

             },

             "properties" : {

                 "name" : {

                     "type" : "keyword"

                 },

                 "age" : {

                     "type" : "keyword",

                     "fields" : {

                         "cn" : {

                             "analyzer" : "ik",

                             "type" : "text"

                         }

                     }

                 },

                 "address" : {

                     "type" : "text"

                 }

             }

         }

     }

 }

字段age的"type" : "keyword"，不分词，然后起个别名cn，对它使用ik分词器进行分词！插入四条数据

用age字段对数据进行统计的时候，需要用不分词的age，并且需要使用全匹配规则，语句：

 {

   "query": {

     "bool": {

       "must": [

         {

           "term": {

             "age": "北京市海淀区西二旗中关村西门"

           }

         }

       ],

       "must_not": [],

       "should": []

     }

   },

   "from": 0,

   "size": 10,

   "sort": [],

   "aggs": {}

 }

结果：

使用age的分词age.cn进行统计是有问题的，运行的结果说明对age的别名age.cn进行分词，查询条件必须匹配分词器对age的内容进行分词的结果进行匹配，

 {

   "query": {

     "bool": {

       "must": [

         {

           "term": {

             "age.cn": "北京市海淀区西二旗中关村西门"

           }

         }

       ],

       "must_not": [],

       "should": []

     }

   },

   "from": 0,

   "size": 10,

   "sort": [],

   "aggs": {}

 }

结果：

 {

   "query": {

     "bool": {

       "must": [

         {

           "term": {

             "age.cn": "北京市"

           }

         }

       ],

       "must_not": [],

       "should": []

     }

   },

   "from": 0,

   "size": 10,

   "sort": [],

   "aggs": {}

 }

结果：

如果使用match来统计的话也会有问题，会把不正确的数据也统计出来，使用 match进行统计会把查询条件与内容进行匹配，根据匹配度进行打分，分数高的说明匹配度高，会排在上面

 {

   "query": {

     "bool": {

       "must": [

         {

           "match": {

             "age.cn": "北京市海淀区西二旗中关村"

           }

         }

       ],

       "must_not": [],

       "should": []

     }

   },

   "from": 0,

   "size": 10,

   "sort": [],

   "aggs": {}

 }

结果：

下面就是按匹配度打分排名的结果

 {

   "query": {

     "bool": {

       "must": [

         {

           "match": {

             "age.cn": "北京市昌平区"

           }

         }

       ],

       "must_not": [],

       "should": []

     }

   },

   "from": 0,

   "size": 10,

   "sort": [],

   "aggs": {}

 }

结果：

总结：统计就用term，不分词，全匹配；模糊查询就用match，分词，不用全匹配！

若有不正之处，请谅解和批评指正，不胜感激！！！！！欢迎大家留言讨论！！！

ES创建mapping时字段别名的更多相关文章

mysql创建表时字段类型选择与优化
一.选择原则 1.应该尽量使用可以正确存储数据的最小字段类型 2.选用简单的数据类型,例如:一个是尽量用mysql内置的字段类型来存储日期和时间:另一个存储IP地址尽量用整型:能用整型的尽量不用字符串 ...
ES 创建mapping
mapping的写入与查看首先创建一个索引: curl -XPUT "http://erp2.es.kd1.pagoda.com.cn:80/erp_stock_index"{&q ...
Spark2.2+ES6.4.2（三十二）：ES API之index的create/update/delete/open/close（创建index时设置setting，并创建index后根据avro模板动态设置index的mapping）
要想通过ES API对es的操作,必须获取到TransportClient对象,让后根据TransportClient获取到IndicesAdminClient对象后,方可以根据IndicesAdmi ...
关闭ES动态创建mapping
使用ES的默认配置会使我们在索引不存在于mapping中的字段时,会自动创建. 这无疑会给我们带来困扰. 在我们不想要某个字段被搜索的时候,我们可以在开始关闭动态创建mapping. 执行如下操作: ...
MySQL 创建表时，设置时间字段自己主动插入当前时间
MySQL 创建表时,设置时间字段自己主动插入当前时间 DROP TABLE IF EXISTS `CONTENT`; CREATE TABLE `CONTENT` ( `ID` char(20) N ...
Es创建索引、设置和修改Mapping
Http接口操作示例如下: 1.创建索引: 2.删除索引: 3.创建mapping: 4.查看mapping:
[Elasticsearch] ES 的Mapping 设计在实际场景中应用
背景项目中有个需求是需要几个字段作为标签,统计各个标签的文档数量,同时支持分词后的全文检索功能. 原有的mapping设计: curl -XPUT http://ip:9200/meta_es_me ...
es的mapping设置
自定义mapping的api PUT test_index { "mappings": { #mappings关键字 "doc": { #type " ...
ElasticSearch 学习记录之ES查询添加排序字段和使用missing或existing字段查询
ES添加排序在默认的情况下,ES 是根据文档的得分score来进行文档额排序的.但是自己可以根据自己的针对一些字段进行排序.就像下面的查询脚本一样.下面的这个查询是根据productid这个值进行排 ...

随机推荐

C语言实现牛顿迭代法解方程
利用迭代算法解决问题,需要做好以下三个方面的工作: 一.确定迭代变量在可以用迭代算法解决的问题中,我们可以确定至少存在一个可直接或间接地不断由旧值递推出新值的变量,这个变量就是迭代变量. 二.建立迭 ...
"《算法导论》之‘图’"：不带权二分图最大匹配（匈牙利算法）
博文“二分图的最大匹配.完美匹配和匈牙利算法”对二分图相关的几个概念讲的特别形象,特别容易理解.本文介绍部分主要摘自此博文. 还有其他可参考博文: 趣写算法系列之--匈牙利算法用于二分图匹配的匈牙利 ...
菜鸟玩云计算之十九：Hadoop 2.5.0 HA 集群安装第2章
菜鸟玩云计算之十九:Hadoop 2.5.0 HA 集群安装第2章 cheungmine, 2014-10-26 在上一章中,我们准备好了计算机和软件.本章开始部署hadoop 高可用集群. 2 部署 ...
Linux进程管理 - ps，top，pstree，signal，kill，killall举例演示
ps:将某个时间点的进程运行情况撷取下来 [root@www ~]# ps aux <==观察系统所有的进程数据 [root@www ~]# ps -lA <==也是能够观察所有系统的数据 ...
Linux权限与命令间的关系
极重要!权限与命令间的关系: 我们知道权限对於使用者帐号来说是非常重要的,因为他可以限制使用者能不能读取/创建/删除/修改文件或目录! 在这一章我们介绍了很多文件系统的管理命令,第六章则介绍了很多文件 ...
shell脚本调用python脚本的路径问题
脚本的相互调用中,只有在同一级目录下才可以使用__file__参数去获取路径名,(在shell里使用pwd也同样),否则,使用的就是主文件(最开始运行的脚本程序)的所在位置,是错误路径:一定要注意当期 ...
C++开发基础
硬件配置: 586以上PC兼容机或品牌机,配有彩色显示器.鼠标.键盘,内存不小于20MB,硬盘自由空间不少于60MB.推荐配置为内存32MB或64MB(或以上),硬盘自由空间500MB 以上. 软件 ...
How tomcat works 读书笔记十七启动tomcat 下
在上一节中,我们程序的起始位置还是Bootstrap,现在我们通过bat文件来启动这个类. 在分析catalina.bat之前,我们先看看几个简单的我们能用到的dos命令. 基础知识 1 rem 注释 ...
HI258摄像头旋转配置问题
{0x28, 0x04}, //Full row start y-flip {0x29, 0x01}, //Pre1 row start no-flip {0x2a, 0x02}, //Pre1 r ...
一种WPF在后台线程更新UI界面的简便方法
WPF框架规定只有UI线程(主线程)可以更新界面,所有其他后台线程无法直接更新界面.幸好,WPF提供的SynchronizationContext类以及C#的Lambda表达式提供了一种方便的解决方法 ...

ES创建mapping时字段别名

ES创建mapping时字段别名的更多相关文章

随机推荐

热门专题