4、Modifying Your Data(修改数据)

Elasticsearch 提供了近实时的操纵数据和搜索的能力。默认情况下,从索引/更新/删除数据到在搜索结果中显示数据会有 1 秒的延迟(刷新间隔)。这是与其他平台(如SQL) 的一个重要区别,在SQL中,数据在事务完成后立即可用。

4.1 Indexing/Replacing Documents(索引/替换 文档)

我们先前见过如何索引单个文档。让我们再次调用该命令 :

PUT /customer/_doc/1?pretty
{
  "name": "John Doe"
}

同样,上面将指定的文档索引到customer索引中,且该文档的ID为1。如果我们再使用不同(或相同)的文档执行上述命令,ElasticSearch将在现有文档的基础上替换(即重新索引)一个ID为1的新文档:

PUT /customer/_doc/1?pretty
{
  "name": "Jane Doe"
}

上面将 ID 为 1 的文档的name“John Doe”改成“Jane Doe”。如果使用的是不同的 ID,那么将为新文档编制索引,并且索引中已有的文档将保持不变。

PUT /customer/_doc/2?pretty
{
  "name": "Jane Doe"
}

上面将索引一个 ID 为 2 的新文档。

在索引时,ID 是可选的。如果没有指定id,Elasticsearch 将生成一个随机 ID,然后使用它去索引文档。ElasticSearch生成的实际ID(或在前面的示例中显式指定的任何内容)作为索引API调用的一部分返回。

该例子演示了在没有明确的 ID 的情况下如何去索引一个文档 :

POST /customer/_doc?pretty
{
  "name": "Jane Doe"
}

注意,在上述的情况下,我们使用了 POST 而不是 PUT,因为我们没有指定 ID。

4.2 Updating Documents(更新文档)

除了可以索引和替换文档之外,我们也可以更新文档。不过,请注意Elasticsearch实际上并不是对指定的文档进行更新。每当我们做一次更新,Elasticsearch都会删除旧文档,然后索引一个新文档,并一次性对其应用更新。

下例演示了将name字段更改为“Jane Doe”来更新ID为1的旧文档:

POST /customer/_update/1?pretty
{
  "doc": { "name": "Jane Doe" }
}

下例演示了将name字段更改为“Jane Doe”来更新ID为1的旧文档,并同时向其添加age字段:

POST /customer/_update/1?pretty
{
  "doc": { "name": "Jane Doe", "age": 20 }
}

也可以使用简单的scripts(脚本)来执行更新。下例演示了使用scripts来将 age增加 5 :

POST /customer/_update/1?pretty
{
  "script" : "ctx._source.age += 5"
}

在上面的例子中,ctx._source 代表当前将被更新的源文档。

Elasticsearch提供了在给定查询条件(如SQL UPDATE-WHERE语句)下更新多个文档的功能。请参阅docs-update-by-query API

4.3 Deleting Documents(删除文档)

删除文档是很简单的,下例演示了如何删除ID 为 2 的 customer(的文档)。

DELETE /customer/_doc/2?pretty

请看 Delete By Query API 以删除指定查询匹配到的所有文档。

值得注意的是,直接删除整个索引比使用Delete By Query API更有效。

4.4 Batch Processing(批处理)

除了可以索引,更新,和删除单个文档之外,Elasticsearch 还提供了使用 _bulk API 来执行上面任何操作的批量方式的能力。这个功能是非常重要,它提供了一种非常有效的机制,可以尽可能减少网络返回且尽可能快的执行多个操作。

举一个简单的例子,在下面一个批量操作中索引了两个文档(ID 1 - John Doe 和 ID 2 - Jane Doe):

POST /customer/_bulk?pretty
{"index":{"_id":"1"}}
{"name": "John Doe" }
{"index":{"_id":"2"}}
{"name": "Jane Doe" }

下例使用一个批量操作更新了第一个文档(ID 为 1),删除了第二个文档(ID 为 2) :

POST /customer/_bulk?pretty
{"update":{"_id":"1"}}
{"doc": { "name": "John Doe becomes Jane Doe" } }
{"delete":{"_id":"2"}}

请注意上面的删除操作,在它后面没有相关的源文档,因为删除操作只需要根据文档的 ID 来删除。

Bulk API不会因其中一个操作失败而失败。如果单个操作因任何原因失败,bulk操作将继续处理它后面的其他操作。当Bulk API返回时,它将为每个操作提供一个状态(按照发送的顺序),以便您可以检查特定操作是否失败。

elasticsearch6.7 01.入门指南(3)的更多相关文章

  1. elasticsearch6.7 01.入门指南(2)

    2.安装(略) 默认情况下,elasticsearch 使用端口 9200 来访问它的 REST API.如果有必要,该端口也可以配置 3.探索集群 3.1 The REST API 既然我们已经启动 ...

  2. elasticsearch6.7 01.入门指南(4)

    5.Exploring Your Data(探索数据) Sample Dataset(样本数据集) 现在我们已经学会了基础知识,让我们尝试在更真实的数据集上操作.我准备了一份顾客银行账户信息的虚构的 ...

  3. elasticsearch6.7 01.入门指南(1)

    Elasticsearch 是一个高度可扩展且开源的全文检索和分析引擎.它可以让您快速.近实时地存储.检索以及分析海量数据.它通常用作那些具有复杂搜索功能和需求的应用的底层引擎或者技术. 下面是 El ...

  4. 现代OpenGL教程 01 - 入门指南

    原文链接传送门 译序 早前学OpenGL的时候还是1.x版本,用的都是glVertex,glNormal等固定管线API.后来工作需要接触DirectX9,shader也只是可选项而已,跟固定管线一起 ...

  5. AngularJS快速入门指南01:导言

    AngularJS使用新的attributes扩展了HTML AngularJS对单页面应用的支持非常好(SPAs) AngularJS非常容易学习 现在就开始学习AngularJS吧! 关于本指南 ...

  6. AngularJS快速入门指南02:介绍

    AngularJS是一个JavaScript框架.它可以通过<script>标记被添加到HTML页面中. AngularJS通过指令对HTML属性进行了扩展,然后通过表达式将数据绑定到HT ...

  7. 《Gulp 入门指南》 : 使用 gulp 压缩 JS

    <Gulp 入门指南> : 使用 gulp 压缩 JS 请务必理解如下章节后阅读此章节: 安装 Node 和 gulp 访问论坛获取帮助 压缩 js 代码可降低 js 文件大小,提高页面打 ...

  8. RequireJS 入门指南

    RequireJS 入门指南 http://requirejs.org/ 简介如今最常用的JavaScript库之一是RequireJS.最近我参与的每个项目,都用到了RequireJS,或者是我向它 ...

  9. 《KAFKA官方文档》入门指南(转)

    1.入门指南 1.1简介 Apache的Kafka™是一个分布式流平台(a distributed streaming platform).这到底意味着什么? 我们认为,一个流处理平台应该具有三个关键 ...

随机推荐

  1. docker gitlab安装

    mkdir -p /data/docker/volumes/gitlab chmod 777 /data/docker/volumes/gitlab cd /data/docker/volumes/g ...

  2. [solution] JZOJ 5459. 密室

    [solution] JZOJ 5459. 密室 Description 小X 正困在一个密室里,他希望尽快逃出密室. 密室中有$N$ 个房间,初始时,小X 在1 号房间,而出口在N 号房间. 密室的 ...

  3. go的数据库操作mysql

    go get github.com/go-sql-driver/mysql package main; import ( "database/sql" _ "github ...

  4. 桌面管理工具 RedisDesktopManager 0.8.8

    RedisDesktopManager 0.8.8  发布,此版本更新内容如下: 改进: Show key bytes length and value bytes length #3677 修复: ...

  5. 团队作业第五周(HCL盐酸队)

    一.Alpha版本测试报告 1.测试计划 测试项目 上下移动   左右移动   发射子弹   与敌方坦克进行攻击 2.测试过程 测试截图 错误记录(提交issues到码云团队项目) 3.测试找出的bu ...

  6. Dynamic Programming | Set 3 (Longest Increasing Subsequence)

    在 Dynamic Programming | Set 1 (Overlapping Subproblems Property) 和 Dynamic Programming | Set 2 (Opti ...

  7. libRTMP 整体说明

    函数结构 (libRTMP)的整体的函数调用结构图如下图所示: 原图地址:http://img.my.csdn.net/uploads/201602/10/1455087168_7199.png 基本 ...

  8. 分布式任务调度系统xxl-job搭建

    为解决分布式环境下定时任务的可靠性,稳定性,只执行一次的特性,我找到了个大众点评开源的分布式调度任务解决完整系统,下面我将一步步深入解读该系统,从基本的使用到源码的探究 下载 https://gith ...

  9. Qt之实现360安全卫士主界面代码开源

    匆匆一年又过去了,总结去年一年的节奏就是忙爆了:生活忙.工作忙,值得庆幸的是没有瞎忙:今天打开博客园查看我的博客,才发现几乎差不多一年时间没写博客了:博客文章就是记忆,就是曾经努力过的见证,感谢博客园 ...

  10. Scala + IntelliJ IDEA

    学习路上的新起点:大数据Scala + Spark +(HDFS + HBase),本文主要介绍下Scala的基本语法和用法吧.最后再简单介绍一种Java开发工具IntelliJ IDEA的使用. S ...