GET API是Elasticsearch中常用的操作,一般用于验证文档是否存在;或者执行CURD中的文档查询。与检索不同的是,GET查询是实时查询,可以实时查询到索引结果。而检索则是需要经过处理才能搜索到。合理利用这些方法,可以更灵活的使用Elasticsearch。

查询样例

Get API允许基于ID字段从Elasticsearch查询JSON文档,下面就是一个查询的例子:

curl -XGET 'http://localhost:9200/website/blog/123?pretty'

上面的命令表示,在website索引的blog类型中查询id为123的文档,返回结果如下:

{
  • "_index": "website",
  • "_type": "blog",
  • "_id": "123",
  • "_version": 1,
  • "found": true,
  • "_source": {
    • "title": "My first blog entry",
    • "text": "Just trying this out...",
    • "date": "2014/01/01"

    }

}

上面返回的数据包括文档的基本内容,

_index是索引名称

_type是类型

_id是ID

_version是版本号

_source字段包括了文档的基本内容

found字段代表是否找到

这个API支持使用HEAD方式提交,这样可以验证这个ID是否存在,而不会返回无用的数据。

curl -XHEAD -i 'http://localhost:9200/website/blog/123'HTTP/1.1 200 OK
Content-Type: text/plain; charset=UTF-8
Content-Length: 0

实时

默认情况下get API是实时的,并不会受到索引的刷新频率的影响。(也就是说,只要索引的数据,就可以立马查询到)

有的时候我们可能想要关闭实时查询,这样可以设置realtime=false。

也可以在配置文件中配置,使之全局可用,即配置action.get.realtime为false。

类型可选

API中类型_type是可选的,如果想要查询所有的类型,可以直接指定类型为_all,从而匹配所有的类型。

source过滤

默认情况下get操作会返回_source字段,除非你使用了fields字段或者禁用了_source字段。通过设置_source属性,可以禁止返回source内容(source内容为空):

curl -XGET 'http://localhost:9200/website/blog/123?_source=false'{
  • "_index": "website",
  • "_type": "blog",
  • "_id": "123",
  • "_version": 1,
  • "found": true,
  • "_source": { }

}

如果想要返回特定的字段,可以使用_source_include(包含)或者_source_exclude(排除)进行过滤。可以使用逗号分隔来设置多种匹配模式,比如:

curl -XGET 'http://localhost:9200/website/blog/123?_source_include=title,date'curl -XGET 'http://localhost:9200/website/blog/123?_source_exclude=date'
curl -XGET 'http://localhost:9200/website/blog/123?_source_include=*&_source_exclude=date'
{
  • "_index": "website",
  • "_type": "blog",
  • "_id": "123",
  • "_version": 1,
  • "found": true,
  • "_source": {
    • "text": "Just trying this out...",
    • "title": "My first blog entry"

    }

}

字段

get操作允许设置fields字段,返回特定的字段:

curl -XGET 'http://localhost:9200/website/blog/123?fields=title,text'{
  • "_index": "website",
  • "_type": "blog",
  • "_id": "123",
  • "_version": 1,
  • "found": true,
  • "fields": {
    • "title": [
      • "My first blog entry"

      ],

    • "text": [
      • "Just trying this out..."

      ]

    }

}

如果请求的字段没有被存储,那么他们会从source中分析出来,这个功能也可以用source_filter来替代。

元数据比如_routing_parent是永远不会被返回的。

Generated fields

如果在执行完索引操作,没有刷新,那么GET操作会读取translog的内容来查询文档。然而有一些字段仅仅是在索引的时候产生的。如果你尝试读取索引中的生成的字段,就会出现错误。可以设置ignore_erros_on_generated_fields=true来忽略错误。

Translog就是索引的数据要进行存储,总不可能索引一条就更新一次Lucene结构。于是就搞了个translog,数据的变动会先放在translog里面,再刷新到es中。实时查询,其实是读取了translog中,还未持久化的数据。

仅返回_source

使用/{index}/{type}/{id}/_source可以仅仅返回_source字段,而不必返回过多不必要的信息,浪费网络带宽。

curl -XGET 'http://localhost:9200/website/blog/123/_source'{
  • "title": "My first blog entry",
  • "text": "Just trying this out...",
  • "date": "2014/01/01"

}

也可以使用过滤机制:

curl -XGET 'http://localhost:9200/website/blog/123/_source?_source_include=title,text,date'{
  • "date": "2014/01/01",
  • "text": "Just trying this out...",
  • "title": "My first blog entry"

}

也是支持使用HEAD方式,验证是否存在:

curl -XHEAD -i 'http://localhost:9200/website/blog/123/_source'HTTP/1.1 200 OK
Content-Type: text/plain; charset=UTF-8
Content-Length: 0

路由

当索引的时候指定了路由,那么查询的时候就一定要指定路由。

curl -XGET 'http://localhost:9200/XXX/XXX/XXX?routing=XXX'

如果路由信息不正确,就会查找不到文档

Preference

控制为get请求维护一个分片的索引,这个索引可以设置为:

  • _primary 这个操作仅仅会在主分片上执行。
  • _local 这个操作会在本地的分片上执行。
  • Custom (string) value 用户可以自定义值,对于相同的分片可以设置相同的值。这样可以保证不同的刷新状态下,查询不同的分片。就像sessionid或者用户名一样。

刷新

refresh参数可以让每次get之前都刷新分片,使这个值可以被搜索。设置true的时候,尽量要考虑下性能问题,因为每次刷新都会给系统带来一定的压力

分布式

get操作会通过特定的哈希方法,把请求分配给特定的分片进行查询。由于在分布式的环境下,主分片和备份分片作为一个组,都可以支持get请求。这就意味着,分片的数量越多,get执行的规模就越大。

参考

http://www.cnblogs.com/xing901022/p/5317698.html

ElasticSearch API 之 GET的更多相关文章

  1. Python Elasticsearch api,组合过滤器,term过滤器,正则查询 ,match查询,获取最近一小时的数据

    Python Elasticsearch api   描述:ElasticSearch是一个基于Lucene的搜索服务器.它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口.下 ...

  2. Elasticsearch API响应的一些常用选项

    我们可以点击Elasticsearch API以获取所需的响应,但是如果要修改API响应,以便我们更改显示格式或过滤掉某些字段,然后我们可以将这些选项与查询一起应用. 有一些常见的选项可以适用于API ...

  3. Python Elasticsearch api

    描述:ElasticSearch是一个基于Lucene的搜索服务器.它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口.下面介绍了利用Python API接口进行数据查询,方便 ...

  4. ElasticSearch API 简要介绍

    调用其API会返回很多信息,例如集群的信息,节点的信息等 检查集群的状态----Restful API说明 1:检查集群状态信息 2:管理集群 3:执行 增删改查 命令 4:执行高级命令 Restfu ...

  5. elasticsearch api约定

    elasticsearch REST API 使用JSON通过HTTP协议传输. 本约定贯穿整个REST API,除非有特别的说明. 一.多重索引 大多数APIs引用到一个index参数来在多个索引中 ...

  6. java优雅的使用elasticsearch api

    本文给出一种优雅的拼装elasticsearch查询的方式,可能会使得使用elasticsearch的方式变得优雅起来,使得代码结构很清晰易读. 建立elasticsearch连接部分请参看另一篇博客 ...

  7. Java调用Elasticsearch API查询及matchPhraseQuery和matchQuery的区别

    一.引入依赖 <!--Elasticsearch client--> <!-- https://mvnrepository.com/artifact/org.elasticsearc ...

  8. ElasticSearch API 之 UPDATE

    ES本身是一个倾向于查询检索的框架,对于更新的操作,太过频繁总归不好的. 阅读本篇后,你可以使用Script对所有的文档执行更新操作,也可以使用doc对部分文档执行更新,也可以使用upsert对不存在 ...

  9. ElasticSearch API 之 DELETE

    删除API,可以根据特定的ID删除文档. $ curl -XDELETE 'http://localhost:9200/website/blog/AVbkih8AltSLRRB7XAun' 会返回下面 ...

随机推荐

  1. 漫谈 Clustering (4): Spectral Clustering<转载>

    转自http://blog.pluskid.org/?p=287 如果说 K-means 和 GMM 这些聚类的方法是古代流行的算法的话,那么这次要讲的 Spectral Clustering 就可以 ...

  2. js获取当前日期、前一天、后一天的日期的例子

    <script> function addByTransDate(dateParameter, num) { var translateDate = "", dateS ...

  3. OracleDBConsole启动不了

    今天要用OEM,然后去打开OracleDBConsoleXXX, 提示说什么么么2,然后就各种百度...最后发现...有断了网络连接之后就可以把它启动了...简直惨,不知道这是什么原理,还有Oracl ...

  4. python之道07

    2.用户输入一个数字,判断一个数是否是水仙花数. 水仙花数是一个三位数, 三位数的每一位的三次方的和还等于这个数. 那这个数就是一个水仙花数, 例如: 153 = 1******3 + 5****** ...

  5. perl 引用(数组和hash引用) --- perlreftut - Mark 的一个简单的'引用'教程 ---Understand References Today. --Mark Jason Dominus, Plover Systems (mjd-perl-ref+@plover.com)

    https://blog.csdn.net/fangwei1235/article/details/8570886 首页 博客 学院 下载 论坛 APP 问答 商城 活动 VIP会员 招聘 ITeye ...

  6. kubernetes添加不了google apt-key

    转自icepoint的博客 key来源 我的百度云盘 密码:v3wo 下载kube_apt_key.gpg到本地,上传到服务器后执行下面的命令 apt-get update && ap ...

  7. C#栈Stack的使用

    using System; using System.Collections.Generic; namespace CSharp栈 { class Program { static void Main ...

  8. shell脚本,每5个字符之间插入"|",行末不插入“|”。

    文本aaaaabbbbbcccccdddd eeeeefffffkkkkkvvvv nnnnnggggg 希望得到的结果如下: aaaaa|bbbbb|ccccc|dddd eeeee|fffff|k ...

  9. 调用 C 动态库

    调用 C 动态库 由 王巍 (@ONEVCAT) 发布于 2015/11/04 C 是程序世界的宝库,在我们面向的设备系统中,也内置了大量的 C 动态库帮助我们完成各种任务.比如涉及到压缩的话我们很可 ...

  10. 在/etc/crondtab中添加定时任务注意事项

    1 要添加用户名 2 要重启定时任务服务