分词测试

分词后倒排索引结果:可以通过http://127.0.0.1:9200/_analyze 测试

{
"analyzer":"ik_max_word",
"text":"我爱广州小蛮腰"
}

match匹配

1.match会条件分词去索引里面找 命中一个满足就返回

插入2条测试数据

文档1: 我爱广州小小蛮腰

文档2: 我爱成都

索引 文档
[文档1,位置0-1][文档2,位置0-1]
[文档1,位置1-2][文档2,位置1-2]
广州 [文档1,位置2-3]
[文档1,位置3-4]
[文档1,位置4-5]
[文档1,位置5-6]
成都                       [文档2,位置2-3]

2.搜索:我爱

默认搜索条件会跟索引一样进行分词 搜索可以指定分词或者指定不分词

我爱分词为 [我:0-1] [爱:1-2]   2个索引都命中

根据索引可以找到文档1,2

3.搜索:我爱我家

分词为:[我:0-1][爱我:1-2][我家:2-3]

[我:0-1] 命中3个文档 则返回三个文档

match_phrase

必须每个索引都命中同时 索引位置相邻才返回

1.搜索我爱命中文档 1 2

2.搜索我爱我家[我:0-1][爱我:1-2][我家:2-3]   虽然前面2个命中第三个没命中 则什么都搜索不出来

什么是索引位置相邻才返回?

比如搜索我爱成都,我们自己换了分词规则 搜索分词变为 [我:0-1][成都:1-2][爱:2-3] 虽然都能命中索引 但是索引位置不相邻 则不会命中

可以使用slop指定跨多少位置 比如以下就是允许跨1个位置  则可以查询出数据

{
"query":{
"match_phrase":{
"productName":{
"query":"我爱我家",
"slop":"1"
} }
}
}

项目中遇到搜索不到数据的解决方式

如果出现搜索不出来数据 但是没有 按上面规则来进行判断

1.首先看搜索不出来的文档的分词规则

2.然后测试搜索分词跟他是否一致

使用以下api可以查询到指定文档指定字段的分词结果:

GET /${index}/${type}/${id}/_termvectors?fields=${fields_name}

使用以下api查看搜索结果

get http://127.0.0.1:9200/opcm3/_validate/query?explain

{
"query":{
"match_phrase":{
"productName":{
"query":"纯生"
}
}
}
}
{
"valid": true,
"_shards": {
"total": 1,
"successful": 1,
"failed": 0
},
"explanations": [
{
"index": "opcm3",
"valid": true,
"explanation": "productName:\"(chun c) (sheng s)\""
}
]
}

可以理解为(chun or c) and (sheng or s)

elasticsearch match和match_phrase匹配原则(十)的更多相关文章

  1. ES查询-match VS match_phrase

    我们以一个查询的示例开始,我们在student这个type中存储了一些学生的基本信息,我们分别使用match和match_phrase进行查询. 首先,使用match进行检索,关键字是“He is”: ...

  2. es match、match_phrase、query_string和term的区别

    (一)text字段和keyword字段的区别 以下给出一个例子: 首先建立一个索引和类型,引入一个keywork的字段: PUT my_index { "mappings": { ...

  3. 第一章——第三节 intent的匹配原则

    问题 一.三种匹配原则 二.匹配的原理 三.隐式启动Activity,如何判断跳转的Activity是否存在. 判断Intent是否可行的两种办法.

  4. 【Spring】15、spring mvc路径匹配原则

    Ant path 匹配原则 在Spring MVC中经常要用到拦截器,在配置需要要拦截的路径时经常用到<mvc:mapping/>子标签,其有一个path属性,它就是用来指定需要拦截的路径 ...

  5. mysql 联合索引匹配原则

    读mysql文档有感 看了mysql关于索引的文档,网上有一些错误的博客文档,这里我自己记一下. 几个重要的概念 1.对于mysql来说,一条sql中,一个表无论其蕴含的索引有多少,但是有且只用一条. ...

  6. Android IntentFilter 匹配原则浅析

    1 Intent分为两大类,显式和隐式. 显式事件,就是指通过 component Name 属性,明确指定了目标组件的事件. 比如我们新建一个Intent,指名道姓的说,此事件用于启动名为" ...

  7. struts2配置 匹配原则 配置各项默认

    struts开发流程 1,引入jar包 2,配置web.xml 3,开发action类 4,配置struts.xml   版本: 2.3 引入jar文件 commons-fileupload-1.2. ...

  8. mysql 最左前缀匹配原则

    1.在mysql建立联合索引时会遵循最左前缀匹配的原则,即最左优先,在检索数据时从联合索引的最左边开始匹配,示例:对列col1.列col2和列col3建一个联合索引 KEY index_col1_co ...

  9. ant path匹配原则

    ant path匹配原则 又称路径匹配原则,spring中的相关策略类org.springframework.util.AntPathMatcher 路径模式使用了apache ant的路径样式 ap ...

随机推荐

  1. opensStack

  2. 05、ListActivity的使用

    第一个好处:处理共同的操作,避免代码重复 假设我要写第二个界面我也是需要使用到mapView,那你都要去查找一个mapView.都要获取一个Map的一个地图. 第二个好处:代码规范(方便阅读,真实开发 ...

  3. 最大正方形 同luogu1387

    这道题下面这么写就够了(n<=100)暴力,枚举 #include<bits/stdc++.h> #define ULL unsigned long long #define MAX ...

  4. HDU 3007 最小圆覆盖 计算几何

    思路: 随机增量法 (好吧这数据范围并不用) //By SiriusRen #include <cmath> #include <cstdio> #include <al ...

  5. 4CSS颜色和背景

    ---------------------------------------------------------------------------------------------------- ...

  6. post提交表单的数据查看方式(不是很理解,但要会看,可以找人商讨下,比如崔老师,自己再看一遍HTTP基础)

  7. OFDM同步算法之Park算法

    park算法代码 训练序列结构 T=[\(C\) \(D\) \(C^{*}\) \(D^{*}\)],其中C表示由长度为N/4的复伪随机序列PN,ifft变换得到的符号序列 \(C(n) = D(N ...

  8. 研磨JavaScript系列

    JavaScript是一种基于对象和事件驱动并具有相对安全性的客户端脚本语言.同时也是一种广泛用于客户端Web开发的脚本语言,常用来给HTML网页添加动态功能,比如响应用户的各种操作.它最初由网景公司 ...

  9. Windows下apache+tomcat负载均衡

    Windows下apache+tomcat负载均衡 网上已经有很多的资料,但是很多都比较零碎,需要整合一起才能搭建出理想的负载均衡,正好前段时间搭建了windows与linux下的负载均衡,在此记录, ...

  10. [ SHOI 2001 ] 化工厂装箱员

    \(\\\) \(Description\) 传送带上按顺序传过来\(N\)个物品,一个有\(A,B,C\)三类. 每次装箱员手里只能至多拿十个,然后将手中三类物品中的一类装箱,才能接着拿或接着装箱, ...