ElasticSearch 数据增删改实现

前言

本文介绍 ElasticSearch 增加、删除、修改数据的使用示例。通过Restful 接口和 Python 实现。ES最新版本中有Delete By Query 和 Update By Query等功能，但是老版本是没有相关功能的，这里需要特别注意下。详细可参考官网资料：
5.4版本：https://www.elastic.co/guide/en/elasticsearch/reference/current/docs.html
2.4版本：https://www.elastic.co/guide/en/elasticsearch/reference/2.4/docs.html

事先需要安装好ElasticSearch和head插件。可参考：http://blog.csdn.net/xsdxs/article/details/52815270

Restful API 实现

创建索引

curl -XPOST 'localhost:9200/customer?pretty'

插入数据

单条插入-指定id

curl -XPOST 'localhost:9200/customer/external/1?pretty' -d' {"name": "John Doe" }'

单条插入-不指定id

curl -XPOST 'localhost:9200/customer/external?pretty' -d' {"name": "Jane Doe" }'

批量插入：

curl -XPOST 'localhost:9200/bank/account/_bulk?pretty' --data-binary “@accounts.json"

参考资料：http://blog.csdn.net/pilihaotian/article/details/52452014
数据下载：https://raw.githubusercontent.com/bly2k/files/master/accounts.zip

删除数据

删除数据：下面的语句将执行删除Customer中ID为2的数据

curl -XDELETE 'localhost:9200/customer/external/2?pretty'

根据查询条件删除（PS:这条本人没试过，我用的还是2.4版本，这是参照官网资料的5.4版本写的）

curl -XPOST 'localhost:9200/customer/external/_delete_by_query?pretty' -d '{

    "query": {

        "match": {

            "name": "John"

        }

    }

}'

删除全部

{

    "query": {

        "match_all": {}

    }

}

更新数据

更新文档: 修改id=1的name属性，并直接增加属性和属性值

curl -XPOST 'localhost:9200/customer/external/1/_update?pretty' -d ' {

    "doc": {

        "name": "xyd",

        "age":

    }

}'

更新索引–脚本方式

curl -XPOST 'localhost:9200/customer/external/1/_update?pretty' -d' {

    "script": "ctx._source.age += 5"

}'

Python API 实现

说明

以下代码实现是：单条增加、根据_id删除、根据_id更新、批量增加等接口。调试的时候建议一个一个功能运行。

代码

# -*- coding: utf- -*-

from elasticsearch.helpers import bulk

import elasticsearch

class ElasticSearchClient(object):

    @staticmethod

    def get_es_servers():

        es_servers = [{

            "host": "localhost",

            "port": ""

        }]

        es_client = elasticsearch.Elasticsearch(hosts=es_servers)

        return es_client

class LoadElasticSearch(object):

    def __init__(self):

        self.index = "hz"

        self.doc_type = "xyd"

        self.es_client = ElasticSearchClient.get_es_servers()

        self.set_mapping()

    def set_mapping(self):

        """

        设置mapping

        """

        mapping = {

            self.doc_type: {

                "properties": {

                    "document_id": {

                        "type": "integer"

                    },

                    "title": {

                        "type": "string"

                    },

                    "content": {

                        "type": "string"

                    }

                }

            }

        }

        if not self.es_client.indices.exists(index=self.index):

            # 创建Index和mapping

            self.es_client.indices.create(index=self.index, body=mapping, ignore=)

            self.es_client.indices.put_mapping(index=self.index, doc_type=self.doc_type, body=mapping)

    def add_date(self, row_obj):

        """

        单条插入ES

        """

        _id = row_obj.get("_id", )

        row_obj.pop("_id")

        self.es_client.index(index=self.index, doc_type=self.doc_type, body=row_obj, id=_id)

    def add_date_bulk(self, row_obj_list):

        """

        批量插入ES

        """

        load_data = []

        i =

        bulk_num =   # 2000条为一批

        for row_obj in row_obj_list:

            action = {

                "_index": self.index,

                "_type": self.doc_type,

                "_id": row_obj.get('_id', 'None'),

                "_source": {

                    'document_id': row_obj.get('document_id', None),

                    'title': row_obj.get('title', None),

                    'content': row_obj.get('content', None),

                }

            }

            load_data.append(action)

            i +=

            # 批量处理

            if len(load_data) == bulk_num:

                print '插入', i / bulk_num, '批数据'

                print len(load_data)

                success, failed = bulk(self.es_client, load_data, index=self.index, raise_on_error=True)

                del load_data[:len(load_data)]

                print success, failed

        if len(load_data) > :

            success, failed = bulk(self.es_client, load_data, index=self.index, raise_on_error=True)

            del load_data[:len(load_data)]

            print success, failed

    def update_by_id(self, row_obj):

        """

        根据给定的_id,更新ES文档

        :return:

        """

        _id = row_obj.get("_id", )

        row_obj.pop("_id")

        self.es_client.update(index=self.index, doc_type=self.doc_type, body={"doc": row_obj}, id=_id)

    def delete_by_id(self, _id):

        """

        根据给定的id,删除文档

        :return:

        """

        self.es_client.delete(index=self.index, doc_type=self.doc_type, id=_id)

if __name__ == '__main__':

    write_obj = {

        "_id": ,

        "document_id": ,

        "title": u"Hbase 测试数据",

        "content": u"Hbase 日常运维,这是个假数据监控Hbase运行状况。通常IO增加时io wait也会增加，现在FMS的机器正常情况......",

    }

    load_es = LoadElasticSearch()

    # 插入单条数据测试

    load_es.add_date(write_obj)

    # 根据id更新测试

    # write_obj["title"] = u"更新标题"

    # load_es.update_by_id(write_obj)

    # 根据id删除测试

    # load_es.delete_by_id()

    # 批量插入数据测试

    # row_obj_list = []

    # for i in range(, ):

    #     temp_obj = write_obj.copy()

    #     temp_obj["_id"] = i

    #     temp_obj["document_id"] = i

    #     row_obj_list.append(temp_obj)

    # load_es.add_date_bulk(row_obj_list)

结果显示

单条增加：

单条修改：

单条删除：

批量增加：

ElasticSearch 数据增删改实现的更多相关文章

salesforce 零基础开发入门学习（六）简单的数据增删改查页面的构建
VisualForce封装了很多的标签用来进行页面设计,本篇主要讲述简单的页面增删改查.使用的内容和设计到前台页面使用的标签相对简单,如果需要深入了解VF相关知识以及标签, 可以通过以下链接查看或下载 ...
C#操作Excel数据增删改查(转)
C#操作Excel数据增删改查. 首先创建ExcelDB.xlsx文件,并添加两张工作表. 工作表1: UserInfo表,字段:UserId.UserName.Age.Address.CreateT ...
C#操作Excel数据增删改查示例
Excel数据增删改查我们可以使用c#进行操作,首先创建ExcelDB.xlsx文件,并添加两张工作表,接下按照下面的操作步骤即可 C#操作Excel数据增删改查. 首先创建ExcelDB.xlsx文 ...
【转载】salesforce 零基础开发入门学习（六）简单的数据增删改查页面的构建
salesforce 零基础开发入门学习(六)简单的数据增删改查页面的构建 VisualForce封装了很多的标签用来进行页面设计,本篇主要讲述简单的页面增删改查.使用的内容和设计到前台页面使用的 ...
Webform（五）——内置对象（Response、Request）和Repeater中的数据增删改
一.内置对象 (一)Response对象 1.简介:response 对象在ASP中负责将信息传递给用户.Response对象用于动态响应客户端请求,并将动态生成的响应结果返回到客户端浏览器中,使用R ...
日历插件FullCalendar应用：(二)数据增删改
接上一篇日历插件FullCalendar应用:(一)数据展现. 这一篇主要讲使用fullcalendar插件如何做数据的增删改,用到了art.dialog web对话框组件,上一篇用到的webFor ...
一个在ASP.NET中利用服务器控件GridView实现数据增删改查的例子
备注:这是我辅导的一个项目开发组的一个例子,用文章的方式分享出来,给更多的朋友参考.其实我们这几年的项目中,都不怎么使用服务器控件的形式了,而是更多的采用MVC这种开发模式.但是,如果项目的历史背景是 ...
MVC设计模式（（javaWEB）在数据库连接池下，实现对数据库中的数据增删改查操作）
设计功能的实现: ----没有业务层,直接由Servlet调用DAO,所以也没有事务操作,所以从DAO中直接获取connection对象 ----采用MVC设计模式 ----采用到的技术 .MVC设计 ...
WebForm 内置对象、数据增删改、状态保持
一.内置对象 1.Response对象:响应请求 Response.Write("<script>alert('添加成功!')</script>"); → ...

随机推荐

JdbcTemplate应用学习
一.Spring对不同的持久化支持: Spring为各种支持的持久化技术,都提供了简单操作的模板和回调 ORM持久化技术模板类 JDBC org.springframework.jdbc.core. ...
Web Storage与Cookie相比存在的优势：
(1).存储空间更大:IE8下每个独立的存储空间为10M,其他浏览器实现略有不同,但都比Cookie要大很多. (2).存储内容不会发送到服务器:当设置了Cookie后,Cookie的内容会随着请求一 ...
Java DES 加解密（"DES/EBC/NoPadding"）
private static final Cipher DES_CIPHER; static { try { DES_CIPHER = Cipher.getInstance("DES/ECB ...
【AIX】查看当前目录下文件与文件夹大小
使用命令: du –sg ./* #以G为单位 du –sm ./* #以M为单位 du –sk ./* #以k为单位
PHP 反射初步测试
<?php //php反射机制 /* //用途 1 该扩展分析php程序,导出或提取出关于类,方法,属性,参数等详细信息,包括注释 //Reflection可以说是对php库函数: /class ...
weblogic部署存在中文乱码导致部署失败
问题描述: weblogic控制台显示错误,是受管节点console日志 <-- 下午10时19分16秒 CST> <Info> <Security> <BE ...
Ubuntu x86-64汇编(6)
寻址方式 Addressing Modes 地址和值 Addresses vs Values 在64bit架构中, 地址是64bit. 访问内存内容的唯一方式就是通过方括号, 不加方括号读取的只是地址 ...
SpannableStringUtil实现丰富文字效果
代码地址如下:http://www.demodashi.com/demo/15007.html 前言在android开发中,我们不免会用到 TextView 的各种显示效果,如字体样式,颜色,大小, ...
docker运行nginx为什么要使用 daemon off
再返回Nginx的docker仓库仔细查看说明,其实是有说明的 /捂脸- 就是在CMD后面加上exec nginx -g 'daemon off;',如下: command: /bin/bash -c ...
GCD 容易让人迷惑的几个问题
写在开头: 本文旨在阐述一些大家容易产生迷惑的GCD相关内容,如果是需要了解一些GCD概念或者基础用法,可以看看这两篇文章:GCD 扫盲篇.巧谈GCD . 目录: 迷惑一:队列和线程的关系迷惑二:G ...