初识Elasticsearch，bulk 操作的遇到的那些事

bulk api可以在单个请求中一次执行多个文档的 create 、 index 、 update 或 delete 操作

批量操作的行为(action)必须是以下几种：
行为	解释
create	当文档不存在时创建之。
index	创建新文档或替换已有文档。
update	局部更新文档。
delete	删除一个文档。

create 必须制定_id

index 不必指定_id 会自动创建一个_id

例如，一个 delete 请求看起来是这样的：

{ "delete": { "_index": "website", "_type": "blog", "_id": "" }}

request body 行由文档的 _source 本身组成--文档包含的字段和值。它是 index 和 create 操作所必需的，这是有道理的：你必须提供文档以索引。

它也是 update 操作所必需的，并且应该包含你传递给 update API 的相同请求体： doc 、 upsert 、 script 等等。 删除操作不需要 request body 行。

{ "create":  { "_index": "website", "_type": "blog", "_id": "" }}

{ "title":    "My first blog post" }

Index 如果不指定 _id ，将会自动生成一个 ID ：

{ "index": { "_index": "website", "_type": "blog" }}

{ "title":    "My second blog post" }

为了把所有的操作组合在一起，一个完整的 bulk 请求 有以下形式:

POST /_bulk

{ "delete": { "_index": "website", "_type": "blog", "_id": "" }}

{ "create": { "_index": "website", "_type": "blog", "_id": "" }}

{ "title":    "My first blog post" }

{ "index":  { "_index": "website", "_type": "blog" }}

{ "title":    "My second blog post" }

{ "update": { "_index": "website", "_type": "blog", "_id": "", "_retry_on_conflict" : } }

{ "doc" : {"title" : "My updated blog post"} } 

bulk 参考示例：

$params['body'] = [];

//创建或替换文档操作
$params['body'][] = [
　　'index' => [ #创建或替换
　　　　'_index' => 'my_index',
　　　　'_type' => 'my_type',
　　　　'_id' => 1,
　　　　'_routing' => 1,
　　]
];
$params['body'][] = [
　　'name' => '杨',
　　'age' => 23
];

//创建文档操作
$params['body'][] = [
　　'create' => [ #创建
　　　　'_index' => 'my_index',
　　　　'_type' => 'my_type',
　　　　'_id' => 2,
　　　　'_routing' => 2,
　　]
];
$params['body'][] = [
　　'name' => '郭',
　　'age' => 19
];

//局部更新文档操作
$params['body'][] = [
　　'update' => [ #局部更新
　　　　'_index' => 'my_index',
　　　　'_type' => 'my_type',
　　　　'_id' => 3,
　　　　'_routing' => 3,
　　]
];
$params['body'][] = [
　　'doc' => [
　　　　'age' => 19
　　]
];

//删除文档操作
$params['body'][] = [
　　'delete' => [ #删除
　　　　'_index' => 'my_index',
　　　　'_type' => 'my_type',
　　　　'_id' => 4,
　　　　'_routing' => 4,
　　]
];
$client = Elasticsearch\ClientBuilder::create()->setHosts(['127.0.0.1:9200'])->build();
$res = $client->bulk($params);

初识Elasticsearch，bulk 操作的遇到的那些事的更多相关文章

ELK 学习笔记之 elasticsearch Bulk操作
Bulk操作: Bulk操作用于批量插入数据: 请求体格式: 编辑一个文件:(插入2个新的文档) curl -XPOST 'http://192.168.1.151:9200/library/book ...
Elasticsearch —— bulk批量导入数据
在使用Elasticsearch的时候,一定会遇到这种场景--希望批量的导入数据,而不是一条一条的手动导入.那么此时,就一定会需要bulk命令! 更多内容参考我整理的Elk教程 bulk批量导入批量 ...
elasticsearch bulk
情景介绍公司2000W的数据从mysql 迁移至elasticsearch,以提供微服务.本文基于elasticsearch-py bulk操作实现数据迁移.相比于elasticsearch-dum ...
BULK操作减少redo实验
建表: create table sm_histable ( sm_id ), sm_subid ), service_type ), orgton ), orgnpi ), destton ), d ...
ElasticSearch Index操作源码分析
ElasticSearch Index操作源码分析本文记录ElasticSearch创建索引执行源码流程.从执行流程角度看一下创建索引会涉及到哪些服务(比如AllocationService.Mas ...
使用Spring Data ElasticSearch+Jsoup操作集群数据存储
使用Spring Data ElasticSearch+Jsoup操作集群数据存储 1.使用Jsoup爬取京东商城的商品数据 1)获取商品名称.价格以及商品地址,并封装为一个Product对象,代码截 ...
Elasticsearch批处理操作——bulk API
Elasticsearch提供的批量处理功能,是通过使用_bulk API实现的.这个功能之所以重要,在于它提供了非常高效的机制来尽可能快的完成多个操作,与此同时使用尽可能少的网络往返. 1.批量索引 ...
elasticsearch使用操作部分
本片文章记录了elasticsearch概念.特点.集群.插件.API使用方法. 1.elasticsearch的概念及特点.概念:elasticsearch是一个基于lucene的搜索服务器.luc ...
elasticsearch更新操作问题
elasticsearch在更新的时候,是通过id进行管理的,我们在前台传入id操作,id如果与elasticsearch相同,则覆盖,否则新增一条记录.且elasticsearch中的插入一条记录和 ...

随机推荐

TestLink 的使用详解
二.初始配置(设置用户.产品) 1. 用户设置在TestLink系统中,每个用户都可以维护自己的私有信息.admin可以创建用户,但不能看到其它用户的密码.在用户信息中,需要设置Email地址,如果 ...
网络表示学习Network Representation Learning/Embedding
网络表示学习相关资料网络表示学习(network representation learning,NRL),也被称为图嵌入方法(graph embedding method,GEM)是这两年兴起的工 ...
Spring MVC 学习笔记9 —— 实现简单的用户管理（4）用户登录显示局部异常信息
Spring MVC 学习笔记9 -- 实现简单的用户管理(4.2)用户登录--显示局部异常信息第二部分:显示局部异常信息,而不是500错误页 1. 写一个方法,把UserException传进来. ...
python学习笔记_week4
装饰器: 定义:本质是函数,(装饰其他函数)就是为其他函数添加附加功能原则:1.不能修改被装饰的函数的源代码 2.不能修改被装饰的函数的调用方式实现装饰器知识储备: 1.函数即“变量” impor ...
List 的一个有用的高效的操作 removeAll
如果有多个list集合,那么使用 removeAll 可以快速的删除另外一个集合的内容: List<String> list1 = new ArrayList<String> ...
Spring4 MVC HelloWord实例
一.创建Web项目我用的eclipse,创建步骤:file=>New=>Other=>Web=>Dynamic Web project,按照操作创建一个完整的Web项目,下载 ...
域控场景下windows安全日志的分析--审计认证行为和命令的历史记录
https://www.cnblogs.com/KevinGeorge/p/8563458.html 一.域控windows安全日志基本操作 1.打开powershell或者cmd 1 #gpedit ...
python setattr
#object生成的对象不能使用setattr函数>>> o=object() >>> setattr(o,'name','ok') Traceback (most ...
【转】bootstrap实现左侧菜单伸缩
传送门:https://blog.csdn.net/easyboot/article/details/59486235
element 表格无法绑定服务返回数据
无法直接绑定返回的Object属性,需要用js做一次对象转换后,才能绑定 <template> <div> <!--<button>添加服务器</but ...

初识Elasticsearch，bulk 操作的遇到的那些事

初识Elasticsearch，bulk 操作的遇到的那些事的更多相关文章

随机推荐

热门专题