elasticsearch6.7 01.入门指南（3）

4、Modifying Your Data（修改数据）

Elasticsearch 提供了近实时的操纵数据和搜索的能力。默认情况下，从索引/更新/删除数据到在搜索结果中显示数据会有 1 秒的延迟（刷新间隔）。这是与其他平台（如SQL）的一个重要区别，在SQL中，数据在事务完成后立即可用。

4.1 Indexing/Replacing Documents（索引/替换文档)

我们先前见过如何索引单个文档。让我们再次调用该命令 :

PUT /customer/_doc/1?pretty
{
  "name": "John Doe"
}

同样，上面将指定的文档索引到customer索引中，且该文档的ID为1。如果我们再使用不同（或相同）的文档执行上述命令，ElasticSearch将在现有文档的基础上替换（即重新索引）一个ID为1的新文档：

PUT /customer/_doc/1?pretty
{
  "name": "Jane Doe"
}

上面将 ID 为 1 的文档的name从“John Doe”改成“Jane Doe”。如果使用的是不同的 ID，那么将为新文档编制索引，并且索引中已有的文档将保持不变。

PUT /customer/_doc/2?pretty
{
  "name": "Jane Doe"
}

上面将索引一个 ID 为 2 的新文档。

在索引时，ID 是可选的。如果没有指定id，Elasticsearch 将生成一个随机 ID，然后使用它去索引文档。ElasticSearch生成的实际ID（或在前面的示例中显式指定的任何内容）作为索引API调用的一部分返回。

该例子演示了在没有明确的 ID 的情况下如何去索引一个文档 :

POST /customer/_doc?pretty
{
  "name": "Jane Doe"
}

注意，在上述的情况下，我们使用了 POST 而不是 PUT，因为我们没有指定 ID。

4.2 Updating Documents（更新文档）

除了可以索引和替换文档之外，我们也可以更新文档。不过，请注意Elasticsearch实际上并不是对指定的文档进行更新。每当我们做一次更新，Elasticsearch都会删除旧文档，然后索引一个新文档，并一次性对其应用更新。

下例演示了将name字段更改为“Jane Doe”来更新ID为1的旧文档：

POST /customer/_update/1?pretty
{
  "doc": { "name": "Jane Doe" }
}

下例演示了将name字段更改为“Jane Doe”来更新ID为1的旧文档，并同时向其添加age字段：

POST /customer/_update/1?pretty
{
  "doc": { "name": "Jane Doe", "age": 20 }
}

也可以使用简单的scripts（脚本）来执行更新。下例演示了使用scripts来将 age增加 5 :

POST /customer/_update/1?pretty
{
  "script" : "ctx._source.age += 5"
}

在上面的例子中，ctx._source 代表当前将被更新的源文档。

Elasticsearch提供了在给定查询条件（如SQL UPDATE-WHERE语句）下更新多个文档的功能。请参阅docs-update-by-query API

4.3 Deleting Documents（删除文档）

删除文档是很简单的，下例演示了如何删除ID 为 2 的 customer（的文档）。

DELETE /customer/_doc/2?pretty

请看 Delete By Query API 以删除指定查询匹配到的所有文档。

值得注意的是，直接删除整个索引比使用Delete By Query API更有效。

4.4 Batch Processing（批处理）

除了可以索引，更新，和删除单个文档之外，Elasticsearch 还提供了使用 _bulk API 来执行上面任何操作的批量方式的能力。这个功能是非常重要，它提供了一种非常有效的机制，可以尽可能减少网络返回且尽可能快的执行多个操作。

举一个简单的例子，在下面一个批量操作中索引了两个文档（ID 1 - John Doe 和 ID 2 - Jane Doe）:

POST /customer/_bulk?pretty
{"index":{"_id":"1"}}
{"name": "John Doe" }
{"index":{"_id":"2"}}
{"name": "Jane Doe" }

下例使用一个批量操作更新了第一个文档（ID 为 1），删除了第二个文档（ID 为 2） :

POST /customer/_bulk?pretty
{"update":{"_id":"1"}}
{"doc": { "name": "John Doe becomes Jane Doe" } }
{"delete":{"_id":"2"}}

请注意上面的删除操作，在它后面没有相关的源文档，因为删除操作只需要根据文档的 ID 来删除。

Bulk API不会因其中一个操作失败而失败。如果单个操作因任何原因失败，bulk操作将继续处理它后面的其他操作。当Bulk API返回时，它将为每个操作提供一个状态（按照发送的顺序），以便您可以检查特定操作是否失败。