ElasticSearch Bulk API

七步丶 2024-10-16 09:18:46 原文

做一个简单的记录，以便自己后续查找

一、环境要求

ElasticSearch 7.3.0
Kibana 7.3.0

二、详情

ElasticSearch 的 Bulk API 可以批量进行索引或者删除等操作，可以显著的提高索引的速度

其格式如下：

action_and_meta_data\n

optional_source\n

action_and_meta_data\n

optional_source\n

....

action_and_meta_data\n

optional_source\n

注意点: 每一行必须以换行符(\n)结尾，包括最后一行

action_and_meta_data 指定哪个文档做什么操作：

action 必须是 create、index、update、delete 中的一个
meta_data 指定文档的 _index、_id

optional_source 指定需要操作的数据。

比如我们需要删除一部电影，同时创建一部电影

POST /_bulk

{"delete":{"_index":"movie", "_id": ""}}

{"index": {"_index":"movie", "_id":""}}

{"title": "Saving Christmas", "year": }

如果批量操作针对的是同一个index，此时我们不需要重复指定该index，比如上面的语句改为：

POST /movie/_bulk

{"delete":{"_id": ""}}

{"index": {"_id":""}}

{"title": "Saving Christmas", "year": }

三、Bulk API 文档的多大合适

整个批量请求都需要由接收到请求的节点加载到内存中，因此该请求越大，其他请求所能获得的内存就越少。批量请求的大小有一个最佳值，大于这个值，性能将不再提升，甚至会下降。但是最佳值不是一个固定的值。它完全取决于硬件、文档的大小和复杂度、索引和搜索的负载的整体情况。

幸运的是，很容易找到这个最佳点：通过批量索引典型文档，并不断增加批量大小进行尝试。当性能开始下降，那么你的批量大小就太大了。一个好的办法是开始时将 1,000 到 5,000 个文档作为一个批次, 如果你的文档非常大，那么就减少批量的文档个数。

密切关注你的批量请求的物理大小往往非常有用，一千个 1KB 的文档是完全不同于一千个 1MB 文档所占的物理大小。一个好的批量大小在开始处理后所占用的物理大小约为 5-15 MB。

四、参考资料

ElasticSearch Bulk API的更多相关文章

Bulk API
承接上文,使用Java High Level REST Client操作elasticsearch Bulk API 高级客户端提供了批量处理器以协助批量请求 Bulk Request BulkReq ...
Elasticsearch批处理操作——bulk API
Elasticsearch提供的批量处理功能,是通过使用_bulk API实现的.这个功能之所以重要,在于它提供了非常高效的机制来尽可能快的完成多个操作,与此同时使用尽可能少的网络往返. 1.批量索引 ...
Elasticsearch由浅入深（六）批量操作：mget批量查询、bulk批量增删改、路由原理、增删改内部原理、document查询内部原理、bulk api的奇特json格式
mget批量查询批量查询的好处就是一条一条的查询,比如说要查询100条数据,那么就要发送100次网络请求,这个开销还是很大的如果进行批量查询的话,查询100条数据,就只要发送1次网络请求,网络请求的 ...
elasticsearch 中文API bulk(六)
bulk API bulk API允许开发者在一个请求中索引和删除多个文档.下面是使用实例. import static org.elasticsearch.common.xcontent.XCont ...
ElasticSearch（十三） bulk api奇特的json格式的原因
bulk api的语法正常的语法: {"action": {"meta"}}\n {"data"}\n {"action&quo ...
Elasticsearch Java API的基本使用
说明在明确了ES的基本概念和使用方法后,我们来学习如何使用ES的Java API. 本文假设你已经对ES的基本概念已经有了一个比较全面的认识. 客户端你可以用Java客户端做很多事情: 执行标准的 ...
ElasticSearch Document API
删除索引库可以看到id为1的索引库不见了这里要修改下配置文件 slave1,slave2也做同样的操作,在这里就不多赘述了. 这个时候记得要重启elasticseach才能生效,怎么重启这里就不多 ...
Elasticsearch批量操作API用法介绍
Elasticsearch的Bulk API允许批量提交index和delete请求,有如下两种用法: 用法1 BulkRequestBuilder requestBuilder = client.p ...
第08章 ElasticSearch Java API
本章内容使用客户端对象(client object)连接到本地或远程ElasticSearch集群. 逐条或批量索引文档. 更新文档内容. 使用各种ElasticSearch支持的查询方式. 处理E ...

随机推荐

mysql ER图
ER 图 ER图也被称为实体-联系图,提供了表示实体类型.属性和联系的方法,下图就是典型的一张ER图. ER图主要由四个成分构成: 1 实体实体是客观世界中存在的各种事物,或者某个抽象事件, ...
[Leetcode][动态规划] 零钱兑换
一.题目描述给定不同面额的硬币 coins 和一个总金额 amount.编写一个函数来计算可以凑成总金额所需的最少的硬币个数.如果没有任何一种硬币组合能组成总金额,返回 -1. 示例 1: 输入: ...
[LeetCode]sum合集
LeetCode很喜欢sum,里面sum题一堆. 1.Two Sum Given an array of integers, return indices of the two numbers suc ...
2018年蓝桥杯java b组第五题
标题:快速排序以下代码可以从数组a[]中找出第k小的元素. 它使用了类似快速排序中的分治算法,期望时间复杂度是O(N)的. 请仔细阅读分析源码,填写划线部分缺失的内容. 我在使用(a, l, r, ...
第八届蓝桥杯java b组第三题
标题:承压计算 X星球的高科技实验室中整齐地堆放着某批珍贵金属原料. 每块金属原料的外形.尺寸完全一致,但重量不同.金属材料被严格地堆放成金字塔形. 7 ...
Spring MVC-从零开始-第一个控制器（不考虑命名规范）
1.目录结构 (log4j.properties.mybatis-config.xml可忽略) 2.配置web.xml文件 <?xml version="1.0" encod ...
阿里云安装RocketMQ
说明: 我的阿里云是centos 6.9 jdk 1.8.0_192-b12(安装教程参照:https://www.cnblogs.com/kingsonfu/p/9801556.html) mave ...
Flask基础(11)-->http的无状态协议解决办法二(服务端session)
session的交互流程 Session 对于敏感.重要的信息,建议存在服务器端,不能存储在浏览器中,比如用户名,密码,余额,验证码等信息在服务器端进行状态保持的方案就是Session Sessio ...
pandas.DataFrame的groupby()方法的基本使用
pandas.DataFrame的groupby()方法是一个特别常用和有用的方法.让我们快速掌握groupby()方法的基础使用,从此数据分析又多一法宝. 首先导入package: import p ...
从React-Native坑中爬出，我记下了这些
吐槽如果React-Native是个人,我估计已经想要打死他了... 上一篇文章当React开发者初次走进React-Native的世界前言最近因为业务需要,做了一些关于React-Nativ ...