ES-识别文档

为了识别同一个索引中的某篇文档,ES使用_uid中的文档类型和ID结合体。_uid字段是由_id和_type字段组成,当搜索或者检索文档的时候总是能获得这两项信息。

FengZhendeMacBook-Pro:cv FengZhen$ curl -XGET 'localhost:9200/music/album/5?pretty&fields'
{
"_index" : "music",
"_type" : "album",
"_id" : "",
"_version" : ,
"found" : true
}

由于所有的文档都位于同一个Lucene的索引中,ES内部使用_uid来唯一确定文档的身份。类型和ID的分离是一种抽象,通过类型的区分使得针对不同结构的运作更为容易。正是因为如此,_id通常从_uid抽取出来,但是_type必须单独索引,这样当搜索特定类型时,系统才能轻松地根据类型来过滤文档。

_uid:
  是否存储:yes
  是否索引:yes
  描述:用于识别整个索引中的某篇文档
_id:
  是否存储:no
  是否索引:no
  描述:该字段没有被索引,也没有被存储。如果搜索他,实际上是用的是_uid。当获得了结果,也同样是从_uid抽取内容。
_type:
  是否存储:no
  是否索引:no_analyzed
  描述:该字段是被索引的,并且生成一个单一的词条。ES用它来过滤指定类型的文档。也可以搜索这个字段

1. 为文档提供ID

(1) 手动指定

目前为止,多数是通过URI的一部分来手动提供ID。例如,为了索引ID为1st的文档,运行类似下面的命令

FengZhendeMacBook-Pro:cv FengZhen$ curl -XPUT 'localhost:9200/get-together/manual_id/1st?pretty' -d '{
> "name":"Elasticsearch Denver"
> }'
{
"_index" : "get-together",
"_type" : "manual_id",
"_id" : "1st",
"_version" : ,
"_shards" : {
"total" : ,
"successful" : ,
"failed" :
},
"created" : true
}

(2) ES自动生成

可以依靠ES来生成唯一的ID。如果尚无唯一的ID,或者没有必要通过某种特定的属性来识别文档,这一点就很有帮助。通常而言,当索引应用程序的日志时,会这么做:这些数据没有唯一的属性来识别它们,而且它们也从不会被更新。
为了让ES生成ID,使用HTTP POST请求并省去ID

FengZhendeMacBook-Pro:cv FengZhen$ curl -XPOST 'localhost:9200/logs/auto_id/?pretty' -d '{
> "message":"test es auto id"
> }'
{
"_index" : "logs",
"_type" : "auto_id",
"_id" : "AWut3pFctSp-KrHOt_--",
"_version" : ,
"_shards" : {
"total" : ,
"successful" : ,
"failed" :
},
"created" : true
}

可以看到自动回复中的ID:AWut3pFctSp-KrHOt_--

2. 在文档中存储索引名称

除了ID和类型,为了让ES在文档中存储索引的名称,可以使用_index字段。和_id、_type一样,可以在搜索或者是GET请求的结果中看到_index,它也不是来源于字段的内容。
ES知道每个结果来自哪个索引,所以它可以展示_index的值

FengZhendeMacBook-Pro:cv FengZhen$ curl 'localhost:9200/_search?q=_index:get-together&pretty'

{

"took" : 3,

"timed_out" : false,

"_shards" : {

"total" : 25,

"successful" : 25,

"failed" : 0

},

"hits" : {

"total" : 1,

"max_score" : 1.0,

"hits" : [ {

"_index" : "get-together",

"_type" : "manual_id",

"_id" : "1st",

"_score" : 1.0,

"_source" : {

"name" : "Elasticsearch Denver"

}

} ]

}

}

Elasticsearch-如何识别一篇文档的更多相关文章

  1. R︱Softmax Regression建模 (MNIST 手写体识别和文档多分类应用)

    本文转载自经管之家论坛, R语言中的Softmax Regression建模 (MNIST 手写体识别和文档多分类应用) R中的softmaxreg包,发自2016-09-09,链接:https:// ...

  2. Elasticsearch 7.x文档基本操作(CRUD)

    官方文档:https://www.elastic.co/guide/en/elasticsearch/reference/current/docs.html 1.添加文档 1.1.指定文档ID PUT ...

  3. elasticsearch 基础 —— 分布式文档存储原理

    路由一个文档到一个分片中 当索引一个文档的时候,文档会被存储到一个主分片中. Elasticsearch 如何知道一个文档应该存放到哪个分片中呢?当我们创建文档时,它如何决定这个文档应当被存储在分片  ...

  4. 关于Elasticsearch单个索引文档最大数量问题

    因为ElasticSearch是一个基于Lucene的搜索服务器.Lucene的索引有个难以克服的限制,导致Elasticsearch的单个分片存在最大文档数量限制,一个索引分片的最大文档数量是20亿 ...

  5. ElasticSearch核心概念和文档的CRUD

    目录 1. 基本概念 1.1 Node 与 Cluster 1.2 Index 1.3 Document 1.4 Type(将在ES6.0移除) 2. 数据的增删改查 2.1 添加数据 2.2 查询数 ...

  6. elasticsearch 官方监控文档 老版但很有用

    https://zhaoyanblog.com/page/1?s=elasticsearch 监控每个节点(jvm部分) 操作系统和进程部分 操作系统和进程部分的含义是很清楚的,这里不会描述的很详细. ...

  7. Elasticsearch操作Document文档

    1.利用客户端操作Document文档数据        1.1 创建一个文档(创建数据的过程,向表中去添加数据)            请求方式:Post    请求地址:es所在IP:9200/索 ...

  8. 【Elasticsearch学习】文档搜索全过程

    在ES执行分布式搜索时,分布式搜索操作需要分散到所有相关分片,若一个索引有3个主分片,每个主分片有一个副本分片,那么搜索请求会在这6个分片中随机选择3个分片,这3个分片有可能是主分片也可能是副本分片, ...

  9. 5.ElasticSearch系列之文档的基本操作

    1. 文档写入 # create document. 自动生成 _id POST users/_doc { "user" : "shenjian", " ...

随机推荐

  1. Chef 组件

    Chef是一家自动化公司.自2008年成立以来,我们一直在将开发人员和系统管理员与我们的同名产品Chef Infra联系在一起.多年来,我们所说的自动化已经扩展了.今天,Chef为基础设施和应用程序提 ...

  2. Python三引号(triple quotes)

    python中三引号可以将复杂的字符串进行复制: python三引号允许一个字符串跨多行,字符串中可以包含换行符.制表符以及其他特殊字符. 三引号的语法是一对连续的单引号或者双引号(通常都是成对的用) ...

  3. golang web实战之三(基于iris框架的 web小应用,数据库采用 sqlite3 )

    一.效果:一个图片应用 1.可上传图片到uploads目录. 2.可浏览和评论图片(用富文本编辑器输入) 二.梳理一下相关知识: 1.iris框架(模板输出,session) 2.富文本编辑器.sql ...

  4. Eclips的JDK更换为1.8

    1.Window—Preferences—Java—Compiler—右侧面板设置为1.6 2.Window—Preferences—Java—Installed JREs—右侧面板“Add”本地的1 ...

  5. Bootloader - Main system - Recovery的三角关系

    原文地址:http://blog.csdn.net/myarrow/article/details/8115610 一.MTD分区:BOOT:        boot.img,Linux kernel ...

  6. luoguP1739 表达式括号匹配 x

    P1739 表达式括号匹配 题目描述 假设一个表达式有英文字母(小写).运算符(+,—,*,/)和左右小(圆)括号构成,以“@”作为表达式的结束符.请编写一个程序检查表达式中的左右圆括号是否匹配,若匹 ...

  7. CUDA-F-1-0-并行计算与计算机架构

    Abstract: 本文从总体上给出了CUDA编程的Big picture,后续所有的文章都在本文的基础上详细展开. Keywords: 并行计算,串行编程,并行编程,计算机架构,并行性,异构架构,C ...

  8. Spring——JdbcTemplate

    一.JdbcTemplate介绍: 为了使 JDBC 更加易于使用,Spring 在 JDBCAPI 上定义了一个抽象层, 以此建立一个JDBC存取框架,Spring Boot Spring Data ...

  9. Java线程之如何分析死锁及避免死锁

    什么是死锁 java中的死锁是一种编程情况,其中两个或多个线程被永久阻塞,Java死锁情况出现至少两个线程和两个或更多资源. 在这里,我们将写了一个简单的程序,它将导致java死锁场景,然后我们将分析 ...

  10. LVS集群之NAT模式

    集群的分类: (1)HA:高可用集群,有叫双机热备 原理:两台机器A.B,正常是A提供服务,当A机宕机或者服务有问题时,会切换到B机继续提供服务常用的高了永软件:heartbeat和keepalive ...