Elasticsearch-如何识别一篇文档

ES-识别文档

为了识别同一个索引中的某篇文档，ES使用_uid中的文档类型和ID结合体。_uid字段是由_id和_type字段组成，当搜索或者检索文档的时候总是能获得这两项信息。

FengZhendeMacBook-Pro:cv FengZhen$ curl -XGET 'localhost:9200/music/album/5?pretty&fields'

{

"_index" : "music",

"_type" : "album",

"_id" : "",

"_version" : ,

"found" : true

}

由于所有的文档都位于同一个Lucene的索引中，ES内部使用_uid来唯一确定文档的身份。类型和ID的分离是一种抽象，通过类型的区分使得针对不同结构的运作更为容易。正是因为如此，_id通常从_uid抽取出来，但是_type必须单独索引，这样当搜索特定类型时，系统才能轻松地根据类型来过滤文档。

_uid:

　　是否存储：yes

　　是否索引：yes

　　描述：用于识别整个索引中的某篇文档

_id：

　　是否存储：no

　　是否索引：no

　　描述：该字段没有被索引，也没有被存储。如果搜索他，实际上是用的是_uid。当获得了结果，也同样是从_uid抽取内容。

_type：

　　是否存储：no

　　是否索引：no_analyzed

　　描述：该字段是被索引的，并且生成一个单一的词条。ES用它来过滤指定类型的文档。也可以搜索这个字段

1. 为文档提供ID

(1) 手动指定

目前为止，多数是通过URI的一部分来手动提供ID。例如，为了索引ID为1st的文档，运行类似下面的命令

FengZhendeMacBook-Pro:cv FengZhen$ curl -XPUT 'localhost:9200/get-together/manual_id/1st?pretty' -d '{

> "name":"Elasticsearch Denver"

> }'

{

"_index" : "get-together",

"_type" : "manual_id",

"_id" : "1st",

"_version" : ,

"_shards" : {

"total" : ,

"successful" : ,

"failed" :

},

"created" : true

}

(2) ES自动生成

可以依靠ES来生成唯一的ID。如果尚无唯一的ID，或者没有必要通过某种特定的属性来识别文档，这一点就很有帮助。通常而言，当索引应用程序的日志时，会这么做：这些数据没有唯一的属性来识别它们，而且它们也从不会被更新。
为了让ES生成ID，使用HTTP POST请求并省去ID

FengZhendeMacBook-Pro:cv FengZhen$ curl -XPOST 'localhost:9200/logs/auto_id/?pretty' -d '{

> "message":"test es auto id"

> }'

{

"_index" : "logs",

"_type" : "auto_id",

"_id" : "AWut3pFctSp-KrHOt_--",

"_version" : ,

"_shards" : {

"total" : ,

"successful" : ,

"failed" :

},

"created" : true

}

可以看到自动回复中的ID：AWut3pFctSp-KrHOt_--

2. 在文档中存储索引名称

除了ID和类型，为了让ES在文档中存储索引的名称，可以使用_index字段。和_id、_type一样，可以在搜索或者是GET请求的结果中看到_index，它也不是来源于字段的内容。
ES知道每个结果来自哪个索引，所以它可以展示_index的值

FengZhendeMacBook-Pro:cv FengZhen$ curl 'localhost:9200/_search?q=_index:get-together&pretty'

{

"took" : 3,

"timed_out" : false,

"_shards" : {

"total" : 25,

"successful" : 25,

"failed" : 0

"hits" : {

"total" : 1,

"max_score" : 1.0,

"hits" : [ {

"_index" : "get-together",

"_type" : "manual_id",

"_id" : "1st",

"_score" : 1.0,

"_source" : {

"name" : "Elasticsearch Denver"

}

} ]

}