本节主要讲解 Elasticsearch 的 搜索相关功能 Search-API,讲解什么是 URL Search 和 Request Body Search 的语法,对常用的语法都会一一进行详细介绍。

1.Search API

Search API 分为两大类一个是 URL Search 和 Request Body Search。

  • URL Search

    • 在 URL 中根据参数查询结果
  • Request Body Search

    • 一种基于 JSON 格式的查询语言 Query Domain Specific Language (DSL)

2.URL Search

GET /movies/_search?q=love&df=title&sort=year:desc&from=0&size=10&timeout=1s
{
"profile":"true"
}
  • q 指定查询语句
  • df 指定查询字段,不指定对所有字段进行查询
  • Sort 排序
  • from 和 size 用于分页
  • 如果要查询执行过程,可以增加 profile 为 true

2.1Query String Syntax

2.1.1TermQuery

GET /movies/_search?q=title:(Beautiful Mind)
{
"profile":"true"
}

输出为有 Beautiful 或者 Mind 的电影名称

2.1.2PhraseQuery

GET /movies/_search?q=title:"Beautiful Mind"
{
"profile":"true"
}

输出为按照顺序同时出现 "Beautiful Mind" 这个词语的电影名称

TermQuery 必须带有 () ,比如 (Beautiful Mind),不带的情况是不一样的。

GET /movies/_search?q=title:(Beautiful Mind)

Mind 为泛查询,对所有字段都进行查询

2.1.3布尔查询

  • AND / OR / NOT 或者 && /|| / !

    • 必须大写
    • title:(Beautiful OR Mind)
GET /movies/_search?q=title:(Beautiful OR Mind)
{
"profile":"true"
}

里面执行是 BooleanQuery,最后还是以 TermQuery 进行分组查询。



2.1.4范围查询

  • [] 为闭区间,{} 为开区间
  • year:[2018 TO 2019],查询时间在2018-2019年的电影
GET /movies/_search?q= year:[2018 TO 2019]
{
"profile":"true"
}

2.1.5算数查询

  • year:>=2018,匹配电影在2018年以后的电影
GET /movies/_search?q=year:>=2018
{
"profile":"true"
}

2.1.6通配符和正则匹配

  • ? 代表1个字符,*代表0到多个字符,这种不推荐,占用太多空间
  • title:b*,匹配电影名称有 b 开头的名称
  • title:[bu],匹配电影名称有 b 开头的名称

GET /movies/_search?q=title:b*

2.1.7模糊查询

  • "Avengers War"~2 ,Avengers 和 War 之间有两个 term,匹配 Avengers: Infinity War - Part I,不能匹配 Avengers: War。

GET /movies/_search?q=title:"Avengers War"~2

3.Request Body Search

其实在高阶使用方法上只有 Request Body Search 才能实现,所以也是推荐使用这种方法查询学习。

Request Body Search 将查询语句通过通过 HTTP 方式发送到 ES,进行查询

3.1Query DSL

POST kibana_sample_data_ecommerce/_search
{
"profile": true,
"_source":["customer_first_name","customer_full_name","customer_gender"],
"from":10,
"size":20,
"sort":[{"order_date":"desc"}],
"query": {
"match_all": {}//查询所有文档
}
}

  • from 和 size 进行分页,"from":10,

    "size":20,from 从 10 开始,返回20个结果,不填写时from=0,size=10
  • sort 根据某些字段进行排序,最好选择日期或者数字的列进行排序
  • _source 当你不需要对所有字段进行查询,通过 _source 选择需要展示数据,不填写则所有,)source 支持正则

3.2脚本字段

脚本字段简单说通过 ES 的 painless 脚本去算出一个新的字段。这个有什么用处呢?当你要对一个列排序,发现存储的有不同的单位,需要转换之后才能做一个统一的排序。

GET kibana_sample_data_ecommerce/_search
{
"script_fields": {
"new_field": {
"script": {
"lang": "painless",
"source": "doc['customer_id']+'_2333333!'"
}
}
},
"query": {
"match_all": {}
}
}

脚本字段不要选择文本类型,默认禁止,可以通过设置 fielddata = true 开启,不建议。

3.3Match 查询表达式

前面 URL Search 中讲解 Term 和 Phrase 查询,现在我们来看在 Request Body Search 是怎么实现。

  • 使用 quest-match 方式,下一层填写具体查询内容,
  • 查询内容两个字符串,类似于 OR 方式。
POST movies/_search
{
"query": {
"match": {
"title": "Who Last"
}
}
}

如果你要要求 Who Last 要同时出现,增加 "operator": "and" 实现。

POST movies/_search
{
"query": {
"match": {
"title": {
"query": "Who Christmas",
"operator": "and"
}
}
}
}

3.4Match Phrase

  • 通过使用 query-match_phrase 实现 Phrase 查询
  • query 的词必须按照顺序排列
  • slop 实现模糊查询,slop=1,表示中间可以有一个字符
POST movies/_search
{
"query": {
"match_phrase": {
"title": {
"query": "Who Christmas"
}
}
}
}

POST movies/_search
{
"query": {
"match_phrase": {
"title": {
"query": "Who Christmas",
"slop": 1
}
}
}
}

4.小结

本篇主要对 Search-Api 的 URL Search 和 Request Body Search 详细介绍,URL Search 和 Request Body Search 都可以简单方便查询我们想要的结果, 那么我们应该采用哪种方式进行查询呢?在简单的进行查询两种方式没有什么区别,但是在 ES 中高级使用方法只能在 Request Body Search 中做,所有这里也是推荐学习和使用这种方法,对 Request Body Search 高阶使用的方法会在之后的章节进行讲解。

5.数据来源

kibana_sample_data_ecommerce 索引是 kibana 自带的索引,需要手动在 kibana 进行点击导入

movies 索引是 movielens 数据集,通过https://grouplens.org/datasets/movielens/ 这个地址下载。通过 Logstash 导入。logstash.conf 和 数据文件在公众号后台回复 ES 获取。

【Elasticsearch 7 探索之路】(四)Analyzer 分析

【Elasticsearch 7 探索之路】(三)倒排索引

【Elasticsearch 7 探索之路】(二)文档的 CRUD 和批量操作

【Elasticsearch 7 搜索之路】(一)什么是 Elasticsearch?

【Elasticsearch 7 探索之路】(五)搜索相关 Search-API的更多相关文章

  1. Elasticsearch学习笔记(二)Search API 与 Query DSL

    一. Search API eg: GET /mall/product/_search?q=name:productName&sort=price desc 特点:search的请求参数都是以 ...

  2. (十五)The Search API

    Now let’s start with some simple searches. There are two basic ways to run searches: one is by sendi ...

  3. Elasticsearch核心技术(五):搜索API和搜索运行机制

    本文将从数据存储和搜索的角度简单分析Elasticsearch的搜索运行机制,主要涉及搜索API.搜索机制.存在问题和解决方案. 4.1 Search API Search API允许用户执行一个搜索 ...

  4. elasticsearch系列四:搜索详解(搜索API、Query DSL)

    一.搜索API 1. 搜索API 端点地址 从索引tweet里面搜索字段user为kimchy的记录 GET /twitter/_search?q=user:kimchy 从索引tweet,user里 ...

  5. 通过Google Custom Search API 进行站内搜索

    今天突然想把博客的搜索改为google的站内搜索,印象中google adsense中好像提高这个站内搜索的代码,但苦逼的是google adsense帐号一直审核不通过,所以只能通过google c ...

  6. Elasticsearch 6.x版本全文检索学习之Search API

    Elasticsearch 6.x版本全文检索学习之Search API. 1).Search API,实现对es中存储的数据进行查询分析,endpoind为_search,如下所示. 方式一.GET ...

  7. ElasticSearch Search API 简介

    REST request URI curl 'localhost:9200/bank/_search?q=*&pretty' 1. localhost:9200/bank/_search,以 ...

  8. 【Elasticsearch 7 探索之路】(六)初识 Mapping

    上一篇主要讲解什么是 URL Search 和 Request Body Search 的语法.本篇对 Mapping 的 Dynamic Mapping 以及手动创建 Mapping 进行讲解. 1 ...

  9. Elasticsearch入门教程(五):Elasticsearch查询(一)

    原文:Elasticsearch入门教程(五):Elasticsearch查询(一) 版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文链接:h ...

随机推荐

  1. P2579 [ZJOI2005]沼泽鳄鱼(邻接矩阵,快速幂)

    题目简洁明了(一点都不好伐) 照例,化简题目 给一张图,每一个时间点有一些点不能走,(有周期性),求从起点第k秒恰好在终点的方案数,可重复,不可停留. 额dp实锤 于是就被打脸了.... 有一种东西叫 ...

  2. 跳跳棋——二分+建模LCA

    题目描述 跳跳棋是在一条数轴上进行的.棋子只能摆在整点上.每个点不能摆超过一个棋子. 我们用跳跳棋来做一个简单的游戏:棋盘上有3颗棋子,分别在a,b,c这三个位置.我们要通过最少的跳动把他们的位置移动 ...

  3. Python 基础 三 反射

    Python 基础 三 反射 今天我们先介绍一下反射这个概念,啥是反射?反射就是自己检测自己.在我们Python的面向对象中的反射是啥意思呢?就是通过字符串的形式操作对象相关的属性.python中的一 ...

  4. 使用Bootstrap制作简单的旅游主页

    页面效果 代码: 需要导入bootstrapt文件,解压至项目中. 下载地址:https://v3.bootcss.com/getting-started/#download <!DOCTYPE ...

  5. k8s部署高可用Ingress

    部署高可用Ingress 官网地址https://kubernetes.github.io/ingress-nginx/deploy/ 获取ingress的编排文件 wget https://raw. ...

  6. Java基础:数值类型转换、强制类型转换

    数值类型之间的转换 数值类型之间的转换,在小数值往大数值转换时,不会发生精度的损失.在小数值往大数值转换时有可能发生精度的损失. 比如byte最大值也只有127,如果一个大于127的int类型数据往b ...

  7. Comet OJ - Contest #10 C题 鱼跃龙门

    ###题目链接### 题目大意: 给你一个 x ,让你求出最小的正整数 n 使得 n * (n + 1) / 2  % x == 0 ,即 n * (n + 1)  % 2x == 0 . 分析: 1 ...

  8. Cache地址映射

    原理:程序访问局部性         在较短时间内由程序产生的地址往往集中在存储器逻辑地址空间的很小范围内         时间:在一小段时间内,最近被访问过的程序和数据很可能再次被访问       ...

  9. Python自动化办公之操作Excel文件

    模块导入 import openpyxl 读取Excel文件 打开Excel文件 workbook = openpyxl.load_workbook("test.xlsx") 输出 ...

  10. webapi跨域使用session

    在之前的项目中,我们设置跨域都是直接在web.config中设置的. 这样是可以实现跨域访问的.因为我们这边一般情况下一个webapi会有多个网站.小程序.微信公众号等访问,所以这样设置是没有问题的. ...