Elasticsearch从入门到放弃:再聊搜索
在前文中我们曾经聊过搜索文档的方法,Elasticsearch 一般适用于读多写少的场景,因此我们需要更多的关注读操作。
Elasticsearch 提供的 Search API 可以分为 URI Search 和 Request Body Search 两大类。从名称上可以直观的看出,URI Search 是使用URI的参数传递参数给 Elasticsearch,Request Body Search 则是将参数放到 Body 中进行传递,下面我们具体来看一下。
URI Search
首先我们来看 URI Search 的一些参数。
- q 指定查询语句,其使用的是 Query String Syntax
- df 指定默认字段,如果不指定,则会查询全部字段
- Sort 对哪些字段进行排序
- from/size 用于分页
此外,我们还可以通过在请求体中指定 profile 参数来查看查询是如何被执行的。
你可以在Kibana中执行下面的查询来看一下 Elasticsearch 的查询是怎样执行的。
GET /movies/_search?q=2012
{
"profile": "true"
}
GET /movies/_search?q=title:2012
{
"profile": "true"
}
GET /movies/_search?q=2012&df=title
{
"profile": "true"
}
在上面这组查询中,当我们指定了查询字段时, Elasticsearch 使用的 query type 是Term Query。

与之对应的还有 Phrase Query。
Term
如果我们的查询条件是 title:(Code Review),那么它使用的就是 Term Query,它等价于查询 title 中存在 Code 或 Review 的文档。
Phrase
如果我们的查询条件是title:"Code Review"这样用引号引起来的,那么它使用的就是 Phrase Query,它等价于查询同时存在 Code 和 Review 的文档,并且 Code 出现的顺序必须在 Review 之前。
这里你可能会有疑问,为什么 Term Query 前后需要加括号,这是 Elasticsearch 中的分组概念,如果想要像我们说的那样,在 titile 字段中查找存在 Code 或 Review 的文档,那么就必须把它们作为一个分组进行查询。这里你可以自己动手试一下不加括号的情况,看一下 Elasticsearch 会如何执行。
Term Query 中还提供了很多种查询语法,例如我们可以只用 AND、OR、NOT 这样的字符进行布尔操作(需要注意它们都必须大写),也可以使用加号或减号表示 must 和 must not 的概念。同时区间、通配符、甚至是正则表达式查询。
Request Body Search
介绍完 URI Search,我们再一起学习一下 Request Body Search,其实在 Elasticsearch 中,Request Body Search 是更加常用的查询方式。因为它能够支持更多高阶的使用方法。
在 Request Body Search 中,我们同样是用 from 和 size 来进行分页,默认的是从0开始,返回10个结果。
排序的方法也是使用 sort,一般建议在“数字型”或“日期型”字段上进行排序。
对于一些字段比较多的文档,我们并不是每次查询都需要全部的字段,这时候就可以在 body 中加上 _source 字段来进行过滤。_source字段可以支持通配符,例如_source:["name*"],查询中就只会返回字段名是 name 开头的字段。
前面我们聊了 Term Query 和 Phrase Query,在 Request Body Search 中,我们使用 Match Query 来进行类似的操作。
GET /movies/_search
{
"query": {
"match": {
"title": "Lord Rings"
}
}
}
在这个例子中,Elasticsearch 会帮我们查询的是 title 中有 Lord 或 Rings 的文档,如果想要查询 Lord 和 Rings,我们需要用到 operator 来进行修改。
GET /movies/_search
{
"query": {
"match": {
"title": {
"query": "Lord Rings",
"operator": "and"
}
}
},
"profile": "true"
}
如果要使用 Phrase 查询,只需要把上面的 match 替换为 match_phrase 即可。
在 Phrase 查询中,可以使用 slot 参数来指定可以插入在中间的单词数量。
GET /movies/_search
{
"query": {
"match_phrase": {
"title": {
"query": "Lord Rings",
"slop": 2
}
}
},
"profile": "true"
}
总结
本文我们学习了 Elasticsearch 的两种查询方法:URI Search 和 Request Body Search 。这里更加推荐使用 Request Body Search,因为它可以支持很多高阶用法,这里我们只介绍了一些比较常用的查询方法,包括 Term Query 和 Phrase Query,也介绍了一些字段的用法,包括分页、排序、过滤字段等。当然,Elasticsearch 的 Request Body Search 还支持很多其他参数,由于篇幅限制,就不再一一介绍了,大家在使用时可以自行查阅官方文档。
最后多说一句,关于 Elasticsearch,我也是刚刚接触,欢迎志同道合的同学一起交流。
Elasticsearch从入门到放弃:再聊搜索的更多相关文章
- Elasticsearch从入门到放弃:分词器初印象
Elasticsearch 系列回来了,先给因为这个系列关注我的同学说声抱歉,拖了这么久才回来,这个系列虽然叫「Elasticsearch 从入门到放弃」,但只有三篇就放弃还是有点过分的,所以还是回来 ...
- Elasticsearch从入门到放弃:瞎说Mapping
前面我们聊了 Elasticsearch 的索引.搜索和分词器,今天再来聊另一个基础内容-- Mapping. Mapping 在 Elasticsearch 中的地位相当于关系型数据库中的 sche ...
- Elasticsearch从入门到放弃:文档CRUD要牢记
在Elasticsearch中,文档(document)是所有可搜索数据的最小单位.它被序列化成JSON存储在Elasticsearch中.每个文档都会有一个唯一ID,这个ID你可以自己指定或者交给E ...
- Elasticsearch从入门到放弃:索引基本使用方法
前文我们提到,Elasticsearch的数据都存储在索引中,也就是说,索引相当于是MySQL中的数据库.是最基础的概念.今天分享的也是关于索引的一些常用的操作. 创建索引 curl -X PUT & ...
- Elasticsearch从入门到放弃:浅谈算分
今天来聊一个 Elasticsearch 的另一个关键概念--相关性算分.在查询 API 的结果中,我们经常会看到 _score 这个字段,它就是用来表示相关性算分的字段,而相关性就是描述一个文档和查 ...
- elasticsearch从入门到出门-03-多种搜索
1.query string search 2.query DSL 3.query filter 4.full-text search 5.phrase search 6.highlight sear ...
- elasticsearch入门到放弃之elasticsearch-head
elasticsearch-head可理解为跟DBeaver一样是一个数据可视化工具,但是这个工具并没有理想中那么好用坑也是很多,我已经在我的github上fork了一份修改后的版本:https:// ...
- 小白学 Python 爬虫(28):自动化测试框架 Selenium 从入门到放弃(下)
人生苦短,我用 Python 前文传送门: 小白学 Python 爬虫(1):开篇 小白学 Python 爬虫(2):前置准备(一)基本类库的安装 小白学 Python 爬虫(3):前置准备(二)Li ...
- 绕过校园网的共享限制 win10搭建VPN服务器实现--从入门到放弃
一.开篇立论= =.. 上次说到博主在电脑上搭建了代理服务器来绕过天翼客户端的共享限制,然而经过实际测试还不够完美,所以本着生命不息,折腾不止的精神,我又开始研究搭建vpn服务器= =... (上次的 ...
随机推荐
- 非线性规划的Matlab 解法
编写M 文件fun1.m 定义目标函数 function f=fun1(x); % 定义目标函数 f=sum(x.^)+; % .^2是矩阵中的每个元素都求平方.^2是求矩阵的平方或两个相同的矩阵相乘 ...
- 深度解密 Go 语言之 sync.map
工作中,经常会碰到并发读写 map 而造成 panic 的情况,为什么在并发读写的时候,会 panic 呢?因为在并发读写的情况下,map 里的数据会被写乱,之后就是 Garbage in, garb ...
- Android学习笔记.9.png格式图片
.9.png可以保证图片在合适的位置进行局部拉伸,避免了图片全局缩放造成的图片变形问题.AS提供了制作点9图片的便捷入口,并且会检查你的.9图是否有不合理的拉伸区域. 选中图片点击create 9-p ...
- DES 加密解密 文件工具类
public class DESEncrypt { /** 加密工具 */ private Cipher encryptCipher = null; /** 解密工具 */ private Ciphe ...
- k8s的两种网络方案与多种工作模式[flannel与calico]
k8s的两种网络方案与多种工作模式 1. Flannel: flannel有三种工作模式: 1. vxlan(隧道方案) 2. host-gw(路由方案) 2. udp(在用户态实现的数据封装解封装, ...
- WeChair项目Alpha冲刺(8/10)
团队项目进行情况 1.昨日进展 Alpha冲刺第八天 昨日进展: 前端:安排页面美化,设计实名认证 后端:用户信息通过dao层存储数据库 数据库:修改数据表属性,与后端部署数据库交互 2.今日安 ...
- WeChair Plus版项目介绍
这个作业属于哪个课程 软件工程 (福州大学至诚学院 - 计算机工程系) 团队名称 WeChair 这个作业要求在哪里 团队作业第一次:团队作业第一次(2) 这个作业的目标 项目介绍,项目修改 作业正文 ...
- 搞定ReentrantReadWriteLock 几道小小数学题就够了
| 好看请赞,养成习惯 你有一个思想,我有一个思想,我们交换后,一个人就有两个思想 If you can NOT explain it simply, you do NOT understand it ...
- 四层发现-UDP发现
udp发现要注意选择一个不常用的端口,如果目标ip在up时目标端口是开放状态,那么不管目标ip是否为up状态,都不会收到任何回应,只有在目标ip为down状态且目标端口为关闭状态,才会返回一个目标不可 ...
- shell把字符串中的字母去掉,只保留数字
1 编辑测试文件 [root@hz-kvm cephdisk3]# cat > 1.txt <<EOF> 120Tib> EOF 2 显示文件[root@hz-kvm c ...