42.query string分词
主要知识点:
1、queery string 分词
2、38节中搜索结果解析
3,测试分词器
 
 
一、query string分词
query string必须以和index建立时相同的analyzer进行分词
query string对exact value和full text的区别对待
比如我们有一个document,其中有一个field,包含的value是:hello you and me,建立倒排索引。
我们要搜索这个document对应的index,搜索文本是hell me,这个搜索文本就是query string,默认情况下,es会使用它对应的field建立倒排索引时相同的分词器去进行分词和normalization,只有这样,才能实现正确的搜索。
比如,我们建立倒排索引的时候,将dogs --> dog,结果你搜索的时候,还是一个dogs,那不就搜索不到了吗?所以搜索的时候,那个dogs也必须变成dog才行。才能搜索到,所以必须是相同的分词器。不同类型的field,可能有的就是full text,有的就是exact value。
 
 
- GET /website/article/_search?q=2017 3条结果
- GET /website/article/_search?q=2017-01-01 3条结果
- GET /website/article/_search?q=post_date:2017-01-01 1条结果
- GET /website/article/_search?q=post_date:2017 1条结果
 
 
1、GET /_search?q=2017
搜索的是_all field,document所有的field都会拼接成一个大串,进行分词,其中2017-01-02会进行分词成2017、01、02,所以用_all 搜索2017时能把三个docuemnt都搜索出来。
 
 
2、GET /_search?q=2017-01-01
同样道理,query string会用跟建立倒排索引一样的分词器去进行分词(会把2017-01-01 分成2017、01),再进行搜索时,3个文档都有2017,所以会是三个结果。
 
 
3、GET /_search?q=post_date:2017-01-01
 
 
搜索特定的field,post_date,会作为exact value去建立索引,2017-01-01没有被分词,只有doc1中才有2017-01-01,所以只有一个结果
 
 
4、GET /_search?q=post_date:2017
这是es 5.2以后所做的一个优化,具体原理以后会学到。
 
 
三、测试分词器
 
 
GET /_analyze
{
"analyzer": "standard",
"text": "Text to analyze"
}
执行结果是:
{
"tokens": [
{
"token": "text",
"start_offset": 0,
"end_offset": 4,
"type": "<ALPHANUM>",
"position": 0
},
{
"token": "to",
"start_offset": 5,
"end_offset": 7,
"type": "<ALPHANUM>",
"position": 1
},
{
"token": "analyze",
"start_offset": 8,
"end_offset": 15,
"type": "<ALPHANUM>",
"position": 2
}
]
}
 
 
 
 
42.query string分词的更多相关文章
- 37.query string、_all metadata
		主要知识点 1.query string基础语法 2._all metadata的理解 一.query string基础语法 1.GET /test_index/test_type/_sear ... 
- Elasticsearch由浅入深(七)搜索引擎:_search含义、_multi-index搜索模式、分页搜索以及深分页性能问题、query string search语法以及_all metadata原理
		_search含义 _search查询返回结果数据含义分析 GET _search { , "timed_out": false, "_shards": { , ... 
- How to get the query string by javascript?
		http://techfunda.com/Tools/XmlToJson http://beautifytools.com/xml-to-json-converter.php https://www. ... 
- nodejs笔记三--url处理、Query String;
		URL--该模块包含用以 URL 解析的实用函数. 使用 require('url') 来调用该模块. 一.parse函数的基础用法 parse函数的作用是解析url,返回一个json格式的数组,请看 ... 
- <原>ASP.NET 学习笔记之HTML helper中参数何时会是路由参数,何时又会是query string?
		HTML helper中参数何时会是路由参数,何时又会是query string? @Html.ActionLink("Edit", "Edit", new ... 
- query string parameters 、 Form Data 、 Request Payload
		微信小程序ajax向后台传递参数的时候总是报400错误 然后看了一下network 发现是query string parameters,但是我写的header如下 header:{ "Co ... 
- springMVC接收参数的区别form data与query string parameters与request payload
		在AJAX请求中,我见过有三种form表单数据类型提交. 第一种:form data, 第二种:query string parameters,第三种:request payload. 在google ... 
- http 请求参数之Query String Parameters、Form Data、Request Payload
		Query String Parameters 当发起一次GET请求时,参数会以url string的形式进行传递.即?后的字符串则为其请求参数,并以&作为分隔符. 如下http请求报文头: ... 
- asp.net query string 及 form data 遇到的编码问题
		当遇到此问题时,脑海里闪过的第一个解决方案是设置 web.config 的编码.但一想,就某一个页面的需求而导致其他跟着妥协,不是好的解决方案.于是网上搜索答案,下面做个小分享,遗憾的是研究不够深入, ... 
随机推荐
- 开源 免费 java CMS - FreeCMS1.8 留言管理
			项目地址:http://code.google.com/p/freecms/ 留言管理 管理当前管理网站的留言数据. 1. 回复留言 选择须要回复的留言.然后点击"回复". 注意: ... 
- selenium清空默认文字
			默认输入框 鼠标点击上去还有文案 直接用 clear不可以 
- C++著名程序库的比较
			转载出处:http://www.acejoy.com/ace/thread-3777-1-1.html 1.C++各大有名库的介绍——C++标准库 2.C++各大有名库的介绍——准标准库Boost3. ... 
- Mongo 中间件 pre find 修改query
			需求:在所有find查询的时候,默认添加查询参数 name:bennman //创建一个query中间件 myMid.js module.exports = function(schema){ //这 ... 
- B1051 受欢迎的牛 tarjan缩点
			就是一道tarjan缩点的板子,之前在洛谷做过.但是我发现一个事,就是函数里面有一句话: void tarjan(int x) { dfn[x] = low[x] = ++tot; str[++top ... 
- Java-MyBatis:MyBatis
			ylbtech-Java-MyBatis:MyBatis 1.返回顶部 1. MyBatis 本是apache的一个开源项目iBatis, 2010年这个项目由apache software foun ... 
- java-com-util-common-service:BaseService.java
			ylbtech-java-com-util-common-service:BaseService.java 1.返回顶部 1. package com.shineyoo.manager.util.co ... 
- SpringMVC使用POST方法传递数据,却出现Request method 'GET' not supported?
			转自:https://segmentfault.com/q/1010000011245770 问题:没有使用get获取当前页面解决方案: @RequestMapping(value = " ... 
- [JavaEE] JBoss主要版本下载链接一览
			URL: http://teddysun.com/260.html JBoss在2006年被 RedHat 收购.在各种 J2EE 应用服务器中,JBoss 是最受欢迎而且功能最为强大的应用服务器.不 ... 
- JVM内存模型和GC垃圾回收
			JVM 内存区域 1.程序计数器 这是一块较小的内存空间,它的作用可以看做是当前线程所执行的字节码的行号指示器,指的是上次代码被执行的地方,线程私有. 2.Java 虚拟机栈 它是 Java方法执行的 ... 
