ElasticSearch查询第一篇：搜索API

《ElasticSearch查询》目录导航：

不同于SQL语言，对ElasticSearch引擎发送的查询请求，有两种方式：第一种方式是使用RESTful 风格的API请求对数据进行搜索或更新，这意味着，必须使用搜索API向ElasticSearch引擎发起搜索请求；第二种方式是使用Qeury DSL，将查询语言封装成JSON结构，在JSON结构中，封装查询请求的参数，作为请求主体（Request Body），发送给ElasticSearch引擎处理。

DSL是领域专用语言（Domain-Specific Language）的首字母缩写，是一种通用的大数据查询语言，用于实现海量数据的检索分析。

本系列是ElasticSearch的入门文章，用于介绍搜索API的使用方法，只求快速入门，想要深入了解，最好的文档永远是官方手册。

一，约定格式

在《ElasticSearch查询》系列文章中，为了简化描述，突出重点，约定将URL字符串中host:port/index/type 省略，

 curl -XGET 'http://localhost:9200/twitter/tweet/_search?q=user:kimchy'

简写为只包含“HTTP动词+端点+查询参数”的简写格式，如下：

GET /_search?q=user:kimchy

将带有POST请求主体的查询，如下：

curl -XGET 'http://localhost:9200/twitter/tweet/_search' -d '{

    "query" : {

        "term" : { "user" : "kimchy" }

    }

}'

简写为只包含“HTTP动词+端点+请求主体JSON”的格式，如下：

GET /_search -d

{

    "query" : {

        "term" : { "user" : "kimchy" }

    }

}

二，查询端点（Endpoint）

查询端点允许RESTful API或客户端查询ElasticSearch引擎中存储的数据，通过HTTP动词定义操作，通过URI定位数据资源。

1，用于搜索数据的端点

查询ElasticSearch引擎，主要使用_search 和_query端点，_search端点允许执行搜索查询，返回查询结果。在_search端点上，能够执行RESTful API查询和Qeury DSL查询，例如一下脚本：

GET /_search?q=user:kimchy

GET /_search -d

{

    "query" : {

        "term" : { "user" : "kimchy" }

    }

}

ElasticSearch的所有查询请求都发送到_search端点，对于_query端点，只用于将查询的结果删除：

DELETE /_query?q=user:kimchy

2，分析端点（_analyze）

分析端点_analyze，用于对查询参数进行分析，并返回分析的结果

POST /_analyze?field=title -d

ElasticSearch Sever

3，计数端点（_count）

在计数端点_count上，执行查询，获取满足查询条件的文档数量

GET /_count?q=user:jim

4，解释端点(_explain)

用于验证指定的文档是否满足查询条件，格式是index/type/_id/_explain，例如

GET index/type//_explain?q=message:search

三，根据文档标识ID搜索单个文档

根据文档标识符搜索文档时，使用“index/type/_id” 格式，如下，搜索文档标识为13的文档：

GET /13

四，检查是否有文档满足查询条件

GET /_search/exists?q=user:kimchy

五，URI搜索

请求参数位于_search端点之后，参数之间使用&分割，例如：

GET /_search?pretty&q=title:azure&explain=true&from=1&size=10&sort=title:asc&fields:user,title,content

1，pretty参数

默认情况下，API返回的JSON对象忽略换行符，在请求(Request)中加上pretty参数，强制ElasticSearch引擎在响应（Response）中加上换行符，使返回的结果集JSON可读。

2，查询条件（q）参数

查询条件（q）参数用于指定返回的文档必须匹配的查询条件，例如：q=title:azure，指定搜索title字段中包含azure关键字的文档；

可以设置一个字段包含多个关键字，关键字之间使用空格或逗号分隔，例如：q=title:(azure,aws,cloud)，或 q=title:(azure aws cloud)，指定搜索title字段中包含azure，aws或cloud的文档；只要title字段包含任意一个关键字，文档就满足查询条件；

q参数可以指定搜素一个短语，短语使用双引号标识，例如：q=title:"azure vs aws"，指定搜索title中包含短语“azure vs aws”的文档；

在查询条件中，也可以指定操作符：+或-，操作符 + 用于指定返回的文档必须匹配查询条件；操作符 - 用于指定返回的文档不匹配查询条件；操作符之间以空格分隔，操作符是位于查询条件=号右侧，字段前面，例如 q=+title:azure -title:aws，指定搜索字段title中只能包含azure，不能包含aws；

3，默认操作符（default_operator）参数

在API中可以包含多个查询条件q，默认条件下，多个查询条件之间的关系是或（or）关系，例如：q=title:azure&q=content:azure，指定搜索title字段中包含azure关键字，或者content字段中包含azure关键字的文档。

查询条件之间的逻辑关系由默认操作符（default_operator）参数指定，默认值是or，该属性可以设置为and 或 or；

当设置为or时，只要一个查询条件（q）满足，就返回文档；例如：q=title:azure&q=content:azure&default_operator=or
当设置为and时，所有的查询条件都满足时，才返回文档；例如：q=title:azure&q=content:azure&default_operator=and

对于查询：q=title:(azure,aws)&q=content:(azure,aws)，表示搜索文档的字段title或content，只要字段值中出现azure 或 aws关键字，就表示该文档匹配查询条件，作为查询结果返回。

4，投影字段（fields）参数

默认情况下，返回的每个文档都包括_index,_type,_id,_score和_source字段，投影参数 fields 用于指定返回的字段列表。在查询时，通过fields参数，指定一个以逗号分隔的字段列表，这些字段的store属性必须设置为true，或存在于_source字段中。默认情况下，fields字段的参数值是_source。可以指定一个或多个字段，字段之间以逗号分隔：

fields=title
fields=title,user

5，排序（sort）参数

排序（sort）参数，用于对结果进行排序，使ElasticSearch按照指定的字段对结果进行排序，值是fieldName:asc/fieldName:desc，默认是升序排序，可以有多个排序字段，排序字段之间以逗号分割，例如：sort=field1:asc,field:desc

6，其他参数

解释（explain）参数：设置为true时，ElasticSearch将在结果中的文档中包含额外的解释信息；
分页（from和size）参数，用于指定结果窗口，from参数指定结果从哪个记录开始返回，默认值是0；size参数定义了返回结果的最大文档数量，默认值是10，参数示例：from=10&size=15
小写词条（lowercase_expanded_terms）参数：自动将词条转换成小写，默认值是true；
分析通配符（analyze_wildcard）参数：通配符或前缀是否被分析，默认值是false；

六，查询请求

搜索API可以转换为查询请求，如下代码，查询请求的查询条件是词条查询，查询参合URI搜索的参数是对应的：

GET /_search -d

{

   "from":,

   "size":,

   "sort":[

      {"post_date":{"order":"asc"}},

      { "name":"desc" }

   ],

   "fields":[ "name","postDate","age"],

   "query":{

      "term":{ "user":"kimchy"}

   }

}

1，查询条件

在查询条件结点"query"中，指定查询的类型是词条（Term），在词条中指定查询的条件，例如，只要User中包含kimchy关键字，就满足查询条件：

"query" : {

        "term" : { "user" : "kimchy" }

}

2，排序

排序sort字段指定排序的字段及其排序的方向，并且排序值（Sort Value）作为查询结果返回：

"sort":[

   {   "post_date":{   "order":"asc" }},

   {   "name":"desc"  }

]

排序的方向：升序asc，降序desc，对于_score字段，默认的排序方式是降序desc，对于其他字段，默认的排序方向是asc。

当对字符串字段进行排序时，该字段最好不被分词（analyzed或tokenized），如果字符串字段被分析，那么ElasticSearch引擎将随机选取字段的一个分词（Term）进行排序，这可能不是你想要的排序值。

3，投影，选取返回的字段

投影字段（fields），用来限制返回的字段，该字段必须存储在倒排索引中，也就是说，在索引映射中，该字段的store属性为ture。推荐使用_source字段，从文档源数据中，指定需要返回的字段。示例，使用_source 字段，控制结果hits数组中，每个文档_source字段必须返回的字段：

{

    "_source": {

        "include": [ "filed1", "field2" ],

        "exclude": [ "field3" ]

    },

    "query" : {

        "term" : { "user" : "kimchy" }

    }

}

4，窗口字段

窗口字段 from 和 size，用来限制返回的文档数量

参考文档：

Elasticsearch Reference [2.4] » Search APIs

Elasticsearch Reference [2.4] » Document APIs

Elasticsearch Reference [2.4] » Search APIs » URI Search

ElasticSearch查询第一篇：搜索API的更多相关文章

ElasticSearch查询第二篇：文档更新
<ElasticSearch查询>目录导航: ElasticSearch查询第一篇:搜索API ElasticSearch查询第二篇:文档更新 ElasticSearch查询第三篇: ...
ElasticSearch入门第一篇：Windows下安装ElasticSearch
这是ElasticSearch 2.4 版本系列的第一篇: ElasticSearch入门第一篇:Windows下安装ElasticSearch ElasticSearch入门第二篇:集群配置 E ...
elasticsearch查询所有数据restful api以及java代码实现
原文:http://blog.java1234.com/blog/articles/366.html restful api实现如下: get http://192.168.1.111:9200/fi ...
【ElasticSearch+NetCore 第一篇】在Windows上安装部署ElasticSearch和ElasticSearch-head
ElasticSearch是一个基于Lucene的搜索服务器.它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口.Elasticsearch是用Java开发的,并作为Apach ...
oracle查询第一篇
第一个小知识点: clear 在oracle中也可以用以清除屏幕上的内容第二个小知识点: 在一个表中插入自身的查询结果 insert into my_table (id,name,age) sele ...
对应第一篇文章api的编写
router.get('/api/tags/search/:list/:key/:page', function(req, res) { if(_.isEmpty(req.params.key)) { ...
Mysql慢查询 [第一篇]
一.简介开启慢查询日志,可以让MySQL记录下查询超过指定时间的语句,通过定位分析性能的瓶颈,才能更好的优化数据库系统的性能. 二.参数说明 slow_query_log 慢查询开启状态slow_q ...
ElasticSearch查询第五篇：布尔查询
布尔查询是最常用的组合查询,不仅将多个查询条件组合在一起,并且将查询的结果和结果的评分组合在一起.当查询条件是多个表达式的组合时,布尔查询非常有用,实际上,布尔查询把多个子查询组合(combine)成 ...
ElasticSearch查询第四篇：匹配查询（Match）
<ElasticSearch查询>目录导航: ElasticSearch查询第一篇:搜索API ElasticSearch查询第二篇:文档更新 ElasticSearch查询第三篇: ...

随机推荐

LeetCode题解之Rotate String
1.题目描述 2.问题分析直接旋转字符串A,然后做比较即可. 3.代码 bool rotateString(string A, string B) { if( A.size() != B.size( ...
JBoss EAP应用服务器部署方法和JBoss 开发JMS消息服务小例子
一.download JBoss-EAP-6.2.0GA: http://jbossas.jboss.org/downloads JBoss Enterprise Application Platfo ...
NFS 系统的搭建
问题: 由于工作,需要,不断得进行挂在硬盘重装系统,NFS 系统给了我一个很好的解决方案.于是决定写一篇博客,防止以后再次使用的时候,能够很快得重新建立NFS 文件系统. 调研: NFS(Networ ...
history历史记录控制
往往我们操作的每一条命令都会被机器记录下来,所有我们为了安全需要屏蔽掉某些敏感的操作命令. 设置linux默认的历史记录数: 临时生效: export HISTSIZE=5 history 永久生效 ...
【MYSQL】语法复习
一.数据类型截图来源: http://www.runoob.com/mysql/mysql-data-types.html 二.基本语句 1.创建数据表 -- 主键自增,T_User CREATE ...
Xmind在win10更改用户设置后出现Invalid Configuration Location 错误的解决办法
错误原因: 因为一开始新建win10用户时,使用的是中文用户名,导致了部分软件比如IDEA读取C盘中配置文件时报错.我用管理员权限修改用户姓名为英文后,IDEA的问题虽然已经解决,但Xmind却报出了 ...
jquery实现根据所选时间生成页面元素
最近做项目,碰见这样的一个需求根据所选的时间动态生成值班安排,日期格式需要带星期,如: 代码如下: 1.首先放两个文本框,时间插件用的是My97DataPicker,再放一个table,简单设置一下 ...
php 魔术方法说明
1.__get.__set这两个方法是为在类和他们的父类中没有声明的属性而设计的.◆__get( $property ) 当调用一个未定义的属性时,此方法会被触发,传递的参数是被访问的属性名.◆__s ...
cenos6.5 python2.6.6升级至python2.7.3
踩坑无数... 一.参照以下两篇博文把python升级至python2.7.3 https://www.cnblogs.com/senzhe/p/6322214.html http://www.jb5 ...
容器内部设置JVM的Heap大小
容器内部利用脚本来获取容器的CGroup资源限制,并通过设置JVM的Heap大小. Docker1.7开始将容器cgroup信息挂载到容器中,所以应用可以从 /sys/fs/cgroup/memory ...

ElasticSearch查询 第一篇：搜索API

ElasticSearch查询 第一篇：搜索API的更多相关文章

随机推荐

热门专题

ElasticSearch查询第一篇：搜索API

ElasticSearch查询第一篇：搜索API的更多相关文章