本文首发于公众号:Hunter后端

原文链接:Python连接es笔记三之es更新操作

这一篇笔记介绍如何使用 Python 对数据进行更新操作。

对于 es 的更新的操作,不用到 Search() 方法,而是直接使用 es 的连接加上相应的函数来操作,本篇笔记目录如下:

  1. 获取连接
  2. update()
  3. update_by_query()
  4. 批量更新
  5. UpdateByQuery()

1、获取连接

如果使用的是之前的全局创建连接的方式:

  1. from elasticsearch_dsl import connections
  2. connections.configure(
  3. default={"hosts": "localhost:9200"},
  4. )

我们可以根据别名获取相应的连接:

  1. conn = connections.connections.get_connection("default")

或者我们直接使用 elasticsearch.Elasticsearch 模块来重新建立一个连接:

  1. from elasticsearch import Elasticsearch
  2. conn = Elasticsearch(hosts="localhost:9200")

前面介绍过,我们安装 elasticsearch_dsl 依赖的时候,会自动为我们安装上相应的 elasticsearch 模块,我们这里直接使用即可。

然后通过 conn 连接可以直接对数据进行更新,可用的方法有 update(),update_by_query() 以及一个批量的 bulk() 方法。

2、update()

update() 函数一般只用于指定 id 的更新操作,如果我们知道一条数据的 id,我们可以直接使用 update()。

比如对于 exam 这个 index 下 id=18 的数据,我们想要更新它的 name 字段和 address 字段分别为 王五和湖南省,我们可以如下操作:

  1. conn.update(
  2. index="exam",
  3. id=18,
  4. body={
  5. "doc": {
  6. "name": "王五2",
  7. "address": "湖南省",
  8. }
  9. }
  10. )

在上面的操作中,index 为指定的索引,id 参数为我们需要更新的 id,body 内 doc 下的字段即为我们要更新的数据。

3、update_by_query()

update_by_query() 函数不局限于 id 的查询更新,我们可以更新任意符合条件的数据,以下是一个简单的示例:

  1. conn.update_by_query(
  2. index="exam",
  3. body={
  4. "query": {
  5. "term": {"name": "张三丰"}
  6. },
  7. "script": {
  8. "source": "ctx._source.address = params.address",
  9. "params": {
  10. "address": "新地址",
  11. }
  12. }
  13. }
  14. )

在这里,index 参数还是指向对应的索引,body 内包含了需要更新查询的条件,这里都在 query 参数内,需要更新的数据在 script 下,通过脚本的形式来操作更新。

这里注意下,我这里用到的是 7.6.0 版本,所以 script 下使用的 source,更低一点版本用的字段可能是 inline,这里使用对应版本的参数即可。

在 script.source 中,内容为 ctx._source.address = params.address,意思是将符合条件数据的 address 字段内容更新为 params 的 address 的数据。

如果想要更改其他字段内容,注意前面 ctx._source 为固定写法,只需要更改后面的字段名即可。

在 script.params 中,我们则可以定义各种对应的字段及其内容。

更新多个字段

如果我们想同时更新多个字段,比如说符合条件的数据将 address 改为 新地址,将 age 字段改为 28,我们则需要将多个条件在 script.source 中使用分号 ; 连接起来,示例如下:

  1. conn.update_by_query(
  2. index="exam",
  3. body={
  4. "query": {
  5. "term": {"name": "新张三丰2"}
  6. },
  7. "script": {
  8. "source": "ctx._source.address = params.address; ctx._source.age = params.age",
  9. "params": {
  10. "address": "新地址3",
  11. "age": "28"
  12. }
  13. }
  14. }
  15. )

虽然这里更新多个字段需要使用分号连接,但是在实际的代码中我们不用这么写死,比如说我们需要更改三个字段,为 ["address", "name", "age"],我们如下操作:

  1. field_list = ["address", "name", "age"]
  2. source_list = [f"ctx._source.{key}=params.{key}" for key in field_list]
  3. params = {
  4. "address": "新地址3",
  5. "age": "28",
  6. "name": "new name"
  7. }
  8. conn.update_by_query(
  9. index="exam",
  10. body={
  11. "query": {
  12. "term": {"name": "新张三丰3"}
  13. },
  14. "script": {
  15. "source": ";".join(source_list),
  16. "params": params
  17. }
  18. }
  19. )

4、批量更新

如果我们想批量更新一批数据,这批数据各个字段的值都不一致,自定义的程度很大,使用 update_by_query() 函数已经不现实了,怎么办?

好解决,我们可以使用 helpers.bulk() 批量更新方法。

首先引入这个模块:

  1. from elasticsearch import helpers

假设我们系统里现在有 id 为 21,23,24 的几条数据,还是在 exam 这个索引下,我们来构造几条需要更新的数据来操作:

  1. action_1 = {
  2. "_op_type": "update",
  3. "_index": "exam",
  4. "_id": 21,
  5. "doc": {"age": 19, "name": "令狐冲", "address": "华山派"},
  6. }
  7. action_2 = {
  8. "_op_type": "update",
  9. "_index": "exam",
  10. "_id": 23,
  11. "doc": {"age": 20, "name": "杨过", "address": "终南山"},
  12. }
  13. action_3 = {
  14. "_op_type": "update",
  15. "_index": "exam",
  16. "_id": 24,
  17. "doc": {"age": 21, "name": "张无忌", "address": "武当"},
  18. }
  19. action_list = [action_1, action_2, action_3]
  20. helpers.bulk(conn, actions=action_list)

对于每一条需要更新的数据,有这几个参数:

_op_type:如果是更新操作,其值则是 update

_index:表示需要更新的数据所在的索引,这里是 exam

_id:表示这条需要更新的数据的 id

doc:是一个 dict 数据,其下包含了需要更新的字段及其对应的值

至此,一条需要更新的数据的结构就构造完毕了。

然后对于 helpers.bulk() 函数,接收的第一个参数为 es 连接,actions 参数是一个列表,其内容就是我们前面构造的数据的集合。

然后执行这个操作就可以发现 es 中对应的值已经更改了。

5、UpdateByQuery()

UpdateByQuery() 函数来源于 elasticsearch_dsl 模块,它的使用和 Search() 方法差不多,都是通过 using 和 index 参数来获取 es 连接和索引:

  1. from elasticsearch_dsl import connections
  2. from elasticsearch_dsl import UpdateByQuery
  3. from elasticsearch_dsl import Q as ES_Q
  4. connections.configure(
  5. default={"hosts": "localhost:9200"},
  6. )
  7. ubq = UpdateByQuery(using="default", index="exam")

使用这个方法更新数据的具体语法和 update_by_query 差不多,都是通过 script 的方式来操作,以下是一个简单示例:

  1. ubq = UpdateByQuery(using="default", index="exam")
  2. q1 = ES_Q("term", name="郭靖")
  3. ubq = ubq.query(q1)
  4. ubq = ubq.script(
  5. source="ctx._source.address=params.address",
  6. params={
  7. "address": "襄阳城"
  8. }
  9. )
  10. ubq.execute()

与 Search() 函数一样,都需要通过 execute() 函数来向 es 提交数据。

如果想获取更多后端相关文章,可扫码关注阅读:

Python连接es笔记三之es更新操作的更多相关文章

  1. Django笔记三十三之缓存操作

    本文首发于公众号:Hunter后端 原文链接:Django笔记三十三之缓存操作 这一节介绍一下如何在 Django 中使用 redis 做缓存操作. 在 Django 中可以有很多种方式做缓存,比如数 ...

  2. 白日梦的ES笔记三:万字长文 Elasticsearch基础概念统一扫盲

    目录 一.导读 二.彩蛋福利:账号借用 三.ES的Index.Shard及扩容机制 四.ES支持的核心数据类型 4.1.数字类型 4.2.日期类型 4.3.boolean类型 4.4.二进制类型 4. ...

  3. 【原】Learning Spark (Python版) 学习笔记(三)----工作原理、调优与Spark SQL

    周末的任务是更新Learning Spark系列第三篇,以为自己写不完了,但为了改正拖延症,还是得完成给自己定的任务啊 = =.这三章主要讲Spark的运行过程(本地+集群),性能调优以及Spark ...

  4. python 基础学习笔记(5)--文件操作

    **python 的文件操作** - [ ] 使用python来读写文件是非常简单的操作,我们使用open()来打开一个文件,获取到文件的语柄,然后通过文件语柄就可以进行各种各样的操作了. - [ ] ...

  5. Python——追加学习笔记(三)

    错误与异常 AttributeError:尝试访问未知的对象属性 eg. >>> class myClass(object): ... pass ... >>> m ...

  6. 《简明python教程》笔记三

    图形软件(GUI工具) 可供选择的GUI: 一.PyQT 是Qt工具包的python绑定.Qt工具包是构建KDE的基石.linux下使用免费,windows下使用收费. 二.PyGTK 是GTK+工具 ...

  7. 【Python】学习笔记三:序列

    sequence(序列) sequence(序列)是一组有序的元素的集合,序列可以有任何元素,也可以没有元素 元组与表的区别:一旦建立,tuple的各个元素不可再变更,而list的各个元素可以再变更 ...

  8. python 连接 mysql 的三种驱动

    连接 mysql 驱动 mysq1-client python2,3都能直接使用 对myaq1安装有要求,必须指定位置存在 配置文件 python-mysql python3 不支持 pymysql ...

  9. Python爬虫学习笔记(三)

    Cookies: 以抓取https://www.yaozh.com/为例 Test1(不使用cookies): 代码: import urllib.request # 1.添加URL url = &q ...

  10. python 3 学习笔记 (三)

    1. 字典 定义:{key1:value1,key2:value2},key-value结构,key必须可hash特性:1.可存放多个值2.可修改指定key对应的值,可变3.无序 1.1. 创建字典 ...

随机推荐

  1. C++/Qt网络通讯模块设计与实现(四)

    在C++/Qt网络通讯模块设计与实现(三)中提到了一个概念,即接受者所依附的线程:关注我微信公众号的技术朋友留言对该概念还是不解,这节就单独讲述这个概念的理论与实际应用,这种应用无处不在,因为与Qt的 ...

  2. Java (强/弱/软/虚)引用

    一.整体架构

  3. vue2双向绑定原理及源码解析

    首先我们要知道VUE实现双向绑定的步骤是什么: 实现一个监听器 Observer 对数据对象进行遍历,包括子属性对象的属性,利用 Object.defineProperty() 对属性都加上 sett ...

  4. VW

    <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...

  5. C#泛型的逆变协变(个人理解)

    前编 一般来说, 泛型的作用就类似一个占位符, 或者说是一个参数, 可以让我们把类型像参数一样进行传递, 尽可能地复用代码 我有个朋友, 在使用的过程中发现一个问题 IFace<object&g ...

  6. LRU缓存替换策略及C#实现

    目录 LRU缓存替换策略 核心思想 不适用场景 算法基本实现 算法优化 进一步优化 Benchmark LRU缓存替换策略 缓存是一种非常常见的设计,通过将数据缓存到访问速度更快的存储设备中,来提高数 ...

  7. golang pprof 监控系列(4) —— goroutine thread 统计原理

    golang pprof 监控系列(4) -- goroutine thread 统计原理 大家好,我是蓝胖子. 在之前 golang pprof监控 系列文章里我分别介绍了go trace以及go ...

  8. vue之字符串的方法

    目录 简介 indexOf方法 简介 本文会把遇到的字符串的方法慢慢补充进来 indexOf方法 indexOf方法判断字符串是否包含另一个字符串 判断结果如果包含返回的是索引,如果不包含,则返回-1 ...

  9. [GIT]辨析/区别: git reset HEAD 与 git reset --hard HEAD | 版本回撤

    1 场景1: 撤销到远程仓库或本地仓库的最新最近一次的正式版本 1.1 文由 时常有这样一种场景,不小心改动了部分文件,或修改了部分文件却发现无用,此时可能还没有git push,也可能push了:又 ...

  10. 【Diary】CSP-S 2020 游记

    一年 好快 从三百多天倒计时 一点一点掂着 又回来了 但是时间永远不会等待你. --??? CSP-J1/S1 CSP-J1/S1 Day0 请了一上午假. 这段时间都在摸鱼,作业没写( 多备赛一个上 ...