4、Modifying Your Data(修改数据)

Elasticsearch 提供了近实时的操纵数据和搜索的能力。默认情况下,从索引/更新/删除数据到在搜索结果中显示数据会有 1 秒的延迟(刷新间隔)。这是与其他平台(如SQL) 的一个重要区别,在SQL中,数据在事务完成后立即可用。

4.1 Indexing/Replacing Documents(索引/替换 文档)

我们先前见过如何索引单个文档。让我们再次调用该命令 :

PUT /customer/_doc/1?pretty
{
  "name": "John Doe"
}

同样,上面将指定的文档索引到customer索引中,且该文档的ID为1。如果我们再使用不同(或相同)的文档执行上述命令,ElasticSearch将在现有文档的基础上替换(即重新索引)一个ID为1的新文档:

PUT /customer/_doc/1?pretty
{
  "name": "Jane Doe"
}

上面将 ID 为 1 的文档的name“John Doe”改成“Jane Doe”。如果使用的是不同的 ID,那么将为新文档编制索引,并且索引中已有的文档将保持不变。

PUT /customer/_doc/2?pretty
{
  "name": "Jane Doe"
}

上面将索引一个 ID 为 2 的新文档。

在索引时,ID 是可选的。如果没有指定id,Elasticsearch 将生成一个随机 ID,然后使用它去索引文档。ElasticSearch生成的实际ID(或在前面的示例中显式指定的任何内容)作为索引API调用的一部分返回。

该例子演示了在没有明确的 ID 的情况下如何去索引一个文档 :

POST /customer/_doc?pretty
{
  "name": "Jane Doe"
}

注意,在上述的情况下,我们使用了 POST 而不是 PUT,因为我们没有指定 ID。

4.2 Updating Documents(更新文档)

除了可以索引和替换文档之外,我们也可以更新文档。不过,请注意Elasticsearch实际上并不是对指定的文档进行更新。每当我们做一次更新,Elasticsearch都会删除旧文档,然后索引一个新文档,并一次性对其应用更新。

下例演示了将name字段更改为“Jane Doe”来更新ID为1的旧文档:

POST /customer/_update/1?pretty
{
  "doc": { "name": "Jane Doe" }
}

下例演示了将name字段更改为“Jane Doe”来更新ID为1的旧文档,并同时向其添加age字段:

POST /customer/_update/1?pretty
{
  "doc": { "name": "Jane Doe", "age": 20 }
}

也可以使用简单的scripts(脚本)来执行更新。下例演示了使用scripts来将 age增加 5 :

POST /customer/_update/1?pretty
{
  "script" : "ctx._source.age += 5"
}

在上面的例子中,ctx._source 代表当前将被更新的源文档。

Elasticsearch提供了在给定查询条件(如SQL UPDATE-WHERE语句)下更新多个文档的功能。请参阅docs-update-by-query API

4.3 Deleting Documents(删除文档)

删除文档是很简单的,下例演示了如何删除ID 为 2 的 customer(的文档)。

DELETE /customer/_doc/2?pretty

请看 Delete By Query API 以删除指定查询匹配到的所有文档。

值得注意的是,直接删除整个索引比使用Delete By Query API更有效。

4.4 Batch Processing(批处理)

除了可以索引,更新,和删除单个文档之外,Elasticsearch 还提供了使用 _bulk API 来执行上面任何操作的批量方式的能力。这个功能是非常重要,它提供了一种非常有效的机制,可以尽可能减少网络返回且尽可能快的执行多个操作。

举一个简单的例子,在下面一个批量操作中索引了两个文档(ID 1 - John Doe 和 ID 2 - Jane Doe):

POST /customer/_bulk?pretty
{"index":{"_id":"1"}}
{"name": "John Doe" }
{"index":{"_id":"2"}}
{"name": "Jane Doe" }

下例使用一个批量操作更新了第一个文档(ID 为 1),删除了第二个文档(ID 为 2) :

POST /customer/_bulk?pretty
{"update":{"_id":"1"}}
{"doc": { "name": "John Doe becomes Jane Doe" } }
{"delete":{"_id":"2"}}

请注意上面的删除操作,在它后面没有相关的源文档,因为删除操作只需要根据文档的 ID 来删除。

Bulk API不会因其中一个操作失败而失败。如果单个操作因任何原因失败,bulk操作将继续处理它后面的其他操作。当Bulk API返回时,它将为每个操作提供一个状态(按照发送的顺序),以便您可以检查特定操作是否失败。

elasticsearch6.7 01.入门指南(3)的更多相关文章

  1. elasticsearch6.7 01.入门指南(2)

    2.安装(略) 默认情况下,elasticsearch 使用端口 9200 来访问它的 REST API.如果有必要,该端口也可以配置 3.探索集群 3.1 The REST API 既然我们已经启动 ...

  2. elasticsearch6.7 01.入门指南(4)

    5.Exploring Your Data(探索数据) Sample Dataset(样本数据集) 现在我们已经学会了基础知识,让我们尝试在更真实的数据集上操作.我准备了一份顾客银行账户信息的虚构的 ...

  3. elasticsearch6.7 01.入门指南(1)

    Elasticsearch 是一个高度可扩展且开源的全文检索和分析引擎.它可以让您快速.近实时地存储.检索以及分析海量数据.它通常用作那些具有复杂搜索功能和需求的应用的底层引擎或者技术. 下面是 El ...

  4. 现代OpenGL教程 01 - 入门指南

    原文链接传送门 译序 早前学OpenGL的时候还是1.x版本,用的都是glVertex,glNormal等固定管线API.后来工作需要接触DirectX9,shader也只是可选项而已,跟固定管线一起 ...

  5. AngularJS快速入门指南01:导言

    AngularJS使用新的attributes扩展了HTML AngularJS对单页面应用的支持非常好(SPAs) AngularJS非常容易学习 现在就开始学习AngularJS吧! 关于本指南 ...

  6. AngularJS快速入门指南02:介绍

    AngularJS是一个JavaScript框架.它可以通过<script>标记被添加到HTML页面中. AngularJS通过指令对HTML属性进行了扩展,然后通过表达式将数据绑定到HT ...

  7. 《Gulp 入门指南》 : 使用 gulp 压缩 JS

    <Gulp 入门指南> : 使用 gulp 压缩 JS 请务必理解如下章节后阅读此章节: 安装 Node 和 gulp 访问论坛获取帮助 压缩 js 代码可降低 js 文件大小,提高页面打 ...

  8. RequireJS 入门指南

    RequireJS 入门指南 http://requirejs.org/ 简介如今最常用的JavaScript库之一是RequireJS.最近我参与的每个项目,都用到了RequireJS,或者是我向它 ...

  9. 《KAFKA官方文档》入门指南(转)

    1.入门指南 1.1简介 Apache的Kafka™是一个分布式流平台(a distributed streaming platform).这到底意味着什么? 我们认为,一个流处理平台应该具有三个关键 ...

随机推荐

  1. 执行PowerShell脚本的时候出现"在此系 统上禁止运行脚本"错误

    使用get-executionpolicy查看当前的脚本执行策略, 默认是Restricted, 也就是不允许任何脚本运行. 此时应该使用set-executionpolicy remotesigne ...

  2. Beta阶段Scrum 冲刺博客合集

    Beta阶段博客链接集合 第一篇Scrum冲刺博客 第二篇Scrum冲刺博客-Day1 第三篇Scrum冲刺博客-Day2 第四篇Scrum冲刺博客-Day3 第五篇Scrum冲刺博客-Day4 第六 ...

  3. Singleton Summary

    Java Singleton: Singleton pattern restricts the instantiation of a class and ensures that only one i ...

  4. 批量插入数据, 将DataTable里的数据批量写入数据库的方法

    大量数据导入操作, 也就是直接将DataTable里的内容写入到数据库 通用方法: 拼接Insert语句, 好土鳖 1. MS Sql Server:   使用SqlBulkCopy 2. MySql ...

  5. 背水一战 Windows 10 (81) - 全球化

    [源码下载] 背水一战 Windows 10 (81) - 全球化 作者:webabcd 介绍背水一战 Windows 10 之 全球化 Demo 格式化数字 示例1.演示全球化的基本应用Locali ...

  6. Thinking in Java Chapter 13

    From Thinking in Java 4th Edition String对象是不可变的.String类中每一个看起来会修改String值的方法,实际上都是创建了一个全新的String对象,以包 ...

  7. JavaScript基础-第2章

    目标 常用数据类型 基本语法 变量的定义与赋值 数据类型与转换 逻辑控制语句 条件语句 循环语句 函数定义 基本语法 变量 变量名以字母或下划线("_")开头 变量可以包含数字.从 ...

  8. Mybatis框架二:增删改查

    这里是搭建框架和准备数据: http://www.cnblogs.com/xuyiqing/p/8600888.html 实现增删改查功能: 测试类: package junit; import ja ...

  9. Spring Caching集成Ehcache

    Ehcache可以对页面.对象.数据进行缓存,同时支持集群/分布式缓存.在应用中用于常常需要读取的数据交换,而不是通过DB DAO数据交换(cache不占用DB宝贵的NIO,直接交换堆内存). 整合S ...

  10. 25-socket

    socket通信流程 #server端 #family参数代表地址家族,可为AF_INET或AF_UNIX.AF_INET家族包括#Internet地址,AF_UNIX家族用于同一台机器上的进程间通信 ...