Elasticsearch: 使用URI Search
在Elasticsearch中,我们可以使用_search终端进行搜索。这个在我之前的文章 “开始使用Elasticsearch (2)” 中有很多的描述。针对这种搜索,我们可以使用强大的DSL进行搜索。在Elasticsearch中,还有一类是基于URI的搜索。对于这种它可以很方便地直接在浏览器中的地址栏或命令行中直接使用。 使用此模式执行搜索时,并非所有搜索选项都公开,但是对于快速的“curl tests”来说,它可能很方便。在今天的文章中,我们来做一个简单的描述。同时我需要指出来的是,这里的语法和Kibana中的Search Bar搜索语法是一样的。
安装Elastic Stack
准备好数据
为了说明问题的方便,我们首先在Kibana中使用如下的bulk指令来创建我们的twitter索引。
POST _bulk
{ "index" : { "_index" : "twitter", "_id": 1} }
{"user":"张三","message":"今儿天气不错啊,出去转转去","uid":2,"age":20,"city":"北京","province":"北京","country":"中国","address":"中国北京市海淀区","location":{"lat":"39.970718","lon":"116.325747"}, "DOB":"1980-12-01"}
{ "index" : { "_index" : "twitter", "_id": 2 }}
{"user":"老刘","message":"出发,下一站云南!","uid":3,"age":30,"city":"北京","province":"北京","country":"中国","address":"中国北京市东城区台基厂三条3号","location":{"lat":"39.904313","lon":"116.412754"}, "DOB":"1981-12-01"}
{ "index" : { "_index" : "twitter", "_id": 3} }
{"user":"李四","message":"happy birthday!","uid":4,"age":30,"city":"北京","province":"北京","country":"中国","address":"中国北京市东城区","location":{"lat":"39.893801","lon":"116.408986"}, "DOB":"1982-12-01"}
{ "index" : { "_index" : "twitter", "_id": 4} }
{"user":"老贾","message":"123,gogogo","uid":5,"age":35,"city":"北京","province":"北京","country":"中国","address":"中国北京市朝阳区建国门","location":{"lat":"39.718256","lon":"116.367910"}, "DOB":"1983-12-01"}
{ "index" : { "_index" : "twitter", "_id": 5} }
{"user":"老王","message":"Happy BirthDay My Friend!","uid":6,"age":50,"city":"北京","province":"北京","country":"中国","address":"中国北京市朝阳区国贸","location":{"lat":"39.918256","lon":"116.467910"}, "DOB":"1984-12-01"}
{ "index" : { "_index" : "twitter", "_id": 6} }
{"user":"老吴","message":"好友来了都今天我生日,好友来了,什么 birthday happy 就成!","uid":7,"age":90,"city":"上海","province":"上海","country":"中国","address":"中国上海市闵行区","location":{"lat":"31.175927","lon":"121.383328"}, "DOB":"1985-12-01"}
这里总共有6条数据。

下面,我们来进行一些查询的动作。
搜索数据
首先,我们做一个简单的搜索,我们可以在浏览器中打入如下的命令:
GET twitter/_search?q=user:张三

我们通过 “q=user:张三” 查询到我们所需要的文档。在有的时候这是一种非常快的查询方式。我们也可以在浏览器中直接打入一个这样的URI:
http://localhost:9200/_search?q=user:%E5%BC%A0%E4%B8%89&pretty

或者在命令行中:

下面,我们将使用Kibana来展示使用URI搜索的一些最基本的特点。
URI查询使用语法根据运算符(例如OR,AND或NOT)解析和拆分提供的查询字符串
我们想使用sort来对数据进行排序:
GET twitter/_search?q=city:"北京"&sort=DOB:desc

上面显示了所有来自北京的用户,并按照出生年月降序排列。
假如我们只想在_source里显示年龄,DOB及城市信息,我们可以这么做:
GET twitter/_search?q=city:"北京"&sort=DOB:desc&_source=city,age,DOB

从上面的显示可以看出来,我们只看到有三个字段显示出来。加入我们想分页,每个页只有2个文档,那么我们可以这么做:
GET twitter/_search?q=city:"北京"&sort=DOB:desc&_source=city,age,DOB&size=2

从上面的显示上我们可以看出来,只有两个文档被显示出来尽管总共有5个文档满足条件。
假如这个时候,我们想对city为“上海”和“北京”的所有用户都来统计一下,那么我们可以使用如下的语句:
GET twitter/_search?q=city:("北京" or "上海") &sort=DOB:desc&_source=city,age,DOB&size=2

显然这个时候,我们得到了6条数据。上海和北京的所有用户都被搜索出来了。
假如我们想查询来自“北京”并且名字叫做“张三”的文档,那么我们可以这么查询:
GET twitter/_search?q=city:"北京" AND user:"张三

从上面可以看出来就只有一条数据。
假如我们想得到来除了上海以外地区的所有的用户,那么我们可以使用如下的方法来得到:
GET twitter/_search?q=NOT city:"上海"

我们看到了5个数据。
我们也可以对某些想进行加权,以使得它们能够排在更前面,比如:

上面的查询是寻找年龄是20岁的,或者是来自上海的人。从搜索的结果来看,我们可以看到上海的老吴是排在前面。如果我们想对年龄为20岁的人需要有更多的关注,那么我们可以对它们的搜索结果进行加权,这样会使得它们的分数更高。我们可以采用如下的方法来做:
GET twitter/_search?q=(age:20^5 OR city:"上海")
在上面,我们显然对age为20的这个选项进行了加权。那么搜索后的结果为:

我们可以看到现在age为20岁的张三排到了搜索结果的前面。
假如我们不指定任何的field的话,那么这个搜索将对所有的field都进行:
GET twitter/_search?q=张三

当然我们也可以进行fuzzy搜索:

上面标明有一个edit错误也可以被搜索出来。对于中文的检索,这个依赖于分词器。在我们的实验中没有使用具体的分词器。这个和实际的使用可能会有区别。
我们也可以对一下范围进行搜索:
GET twitter/_search?q=age:[20 TO 30]

上面搜索的结果是从20岁到30岁的所有的结果,并且都包含在里面。我们如果不想包含30岁的话,那么可以写成这样的格式:

我们使用[20 TO 30}, 如果我们想搜索在30岁一下的所有文档,那么我们可以使用如下的搜索方式:

在这里,我们使用[* TO 30},这里不包含30。
好了今天就讲到这里。这里的所有的语法也适用于在Kibana中的Search Bar。如果我们熟练地掌握了这些,也可以很方便地让我们熟练地操作Kibana中搜索。
参考:
【1】https://www.elastic.co/guide/en/elasticsearch/reference/current/query-filter-context.html
【2】https://www.elastic.co/guide/en/elasticsearch/reference/7.4/search-uri-request.html
Elasticsearch: 使用URI Search的更多相关文章
- Elasticsearch URI search 查询语法整理
Elasticsearch URI search 一.请求体查询与空查询 1. 请求体查询(request body search) 简单查询语句(lite)是一种有效的命令行adhoc查询.但是,如 ...
- Elasticsearch7.X 入门学习第三课笔记----search api学习(URI Search)
原文:Elasticsearch7.X 入门学习第三课笔记----search api学习(URI Search) 版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出 ...
- ElasticSearch - How to search for a part of a word with ElasticSearch
Search a part of word with ElasticSearch 来自stackoverflow https://stackoverflow.com/questions/6467067 ...
- ElasticSearch报 EsThreadPoolExecutor[search, queue capacity = 1000, org.elasticsearch.common.util.concurrent.EsThreadPoolExecutor@c0efba
ElasticSearch报以下错误的解决办法: "type": "es_rejected_execution_exception", "reason ...
- elasticsearch 基础 —— URI搜索
URI搜索 可以通过提供请求参数使用URI来执行搜索请求.使用此模式执行搜索时,并非所有搜索选项都会暴露.这是一个例子: GET twitter/_search?q=user:kimchy 示例响应: ...
- ElasticSearch: SearchContextMissingException[No search context found for id [173690]]
这个原因是scroll的时间设置不够久,设久一些就可以了. ----------------------------------- 原文:https://www.cnblogs.com/chenmz1 ...
- Elasticsearch Search API
当执行一个搜索时,它将这个搜索请求广播给所有的索引分片.可以通过提供路由参数来控制要搜索哪些分片.例如,当检索tweets这个索引时,路由参数可以设置为用户名: curl -X POST " ...
- Elasticsearch Search APIs
Elasticsearch Search APIs By:授客 QQ:1033553122 1. 搜索 1 在单个索引的所有类型中搜索 1 在单个索引的指定类型中搜索 1 在多个指定的索引中搜索 1 ...
- How to Build a Search Page with Elasticsearch and .NET
Although SQL Server's Full-Text search is good for searching text that is within a database, there a ...
随机推荐
- Java学习dayo4
分支结构和循环语句 1.包的概念 包就是文件夹 包的命名规范:全小写,域名倒置,不能以点开头或结尾,可以包含点,每存在一个点表示一个子目录 举例:com.baidu.demo 定义包后,包中的java ...
- httrack使用cookie克隆站点
关于cookies使用在这里官方已有说明,意思是将cookies.txt文件放在项目的根目下即可,格式也给了说明.问题是cookie值太多,手动不好整理,所以就需要用到神器editthiscookie ...
- k8s+crio+podman搭建集群
前言 在传统的k8s集群中,我们都是使用docker engine做为底层的容器管理软件的,而docker engine因为不是k8s亲生的解决方案,所以实际使用中会有更多的分层.之前我们也讲过,k8 ...
- .NET Core 实现后台任务(定时任务)Longbow.Tasks 组件(三)
原文链接:https://www.cnblogs.com/ysmc/p/16512309.html 在上两篇文章中,简单介绍了怎么使用 IHostedService 与 BackgroundServi ...
- C#基础语法之-泛型
泛型:一共7个知识点 1.引入泛型,延迟声明 2.如何声明和使用泛型 3.泛型的好处和原理 4.泛型类,泛型方法,泛型接口,泛型委托 5.泛型约束 6.协变,逆变 7.泛型缓存 一.为啥会出现泛型,有 ...
- 【RocketMQ】消息的消费
上一讲[RocketMQ]消息的拉取 消息消费 当RocketMQ进行消息消费的时候,是通过ConsumeMessageConcurrentlyService的submitConsumeRequest ...
- 关于 CMS 垃圾回收器,你真的懂了吗?
大家好,我是树哥. 前段时间有个小伙伴去面试,被问到了 CMS 垃圾回收器的详细内容,没答出来.实际上,CMS 垃圾回收器是回收器历史上很重要的一个节点,其开启了 GC 回收器关注 GC 停顿时间的历 ...
- git常见问题及解决方法
简介 由于在git使用过程中会出现各种各样的问题,因此本文将常见的问题记录下来并提供相应的解决方案,方便后续查找. git pull问题: There is no tracking informati ...
- 使用gulp助力前端自动化
前言 随着前端诸如webpack,rollup,vite的发展,gulp感觉似乎好像被取代了.其实并没有,只不过它从台前退居到了幕后.我们仍然可以在很多项目中看到它的身影,比如elementplus. ...
- C 语言 时间函数使用技巧(汇总)
time.h 头文件 是 C 语言中 有关 时间的函数所储存的头文件 #include <time.h> 在介绍时间函数用法之前,我们首先要了解在 time.h 头文件中已经声明了的一个结 ...