本文首发于公众号:Hunter后端

原文链接:Python连接es笔记二之查询方式汇总

上一节除了介绍使用 Python 连接 es,还有最简单的 query() 方法,这一节介绍一下几种其他的查询方式。

以下是本篇笔记目录:

  1. query() 方法介绍
  2. Q() 查询
  3. 排序
  4. 分页
  5. source() 指定返回字段
  6. extra() 操作
  7. count() 总数
  8. from_dict() 函数

1、query() 方法介绍

在上一节中介绍了 query() 的一个简单示例,如下:

s = Search(using="default").index("exam")

s = s.query("match", name="张三丰")

query() 中接受两个参数,第一个是字段查询的方式,比如这里是 match,也可以是 term,这个依照查询的目的来替换。

第二个则是查询的字段与值,比如这里是查询的 name 字段为 "张三丰" 的数据。

如果是有多个条件,比如 name="张三丰",address="中国" 的数据,这里的 = ,并非是完全等于的意思,而是会依照前面的查询方式,比如 match 或 term 进行类似的分词或者模糊搜索。

如果是上面多个条件的查询,可以直接在后面加上类似的 query():

s = s.query("match", name="张三丰").query("match", address="中国")

这两个 query() 通过链式操作连在一起转换成 es 语句就是使用 must 将多条件连接在一起,我们可以使用 to_dict() 方式来查看:

s.to_dict()

# {'query': {'bool': {'must': [{'match': {'name': '张三丰'}}, {'match': {'address': '中国'}}]}}}

2、Q() 查询

如果看过之前我写过的 Django 系列笔记,应该记得在 Django 里也有个 Q() 方法的查询,和这里的一样,也是用于条件的联合,与或非条件都可以实现。

引入方式如下:

from elasticsearch_dsl import Q

但是如果是在 Django 中使用 es 的连接,也是同样使用 Q() 方法,我们可以使用 as 来区分,这里我们对于 es 的 Q() 方法可以使用 ES_Q() 来区分:

from elasticsearch_dsl import Q as ES_Q

单个条件的使用 Q() 如下:

s = s.query(ES_Q("match", name="张三丰"))

如下使用 dict 形式的操作也是等效的:

s = s.query(ES_Q({"match": {"name": "张三丰"}}))

与操作

对于这两个条件,如果想要实现它们的与操作:

q1 = ES_Q("match", name="张三丰")
q2 = ES_Q("match", address="中国")

可以如下实现:

s = s.query(q1 & q2)

或操作

如果是想实现上面的或操作,可以如下:

s = s.query(q1 | q2)

非操作

如果是想取反,直接在条件前加一个 ~ 即可:

q1 = ~ES_Q("match", name="张三丰")
s = s.query(q1)

multi_match

如果是搜索多字段,可以如下操作:

q = ES_Q("multi_match", query="中国 张三丰", fields=["name", "address"])

s = s.query(q)

text.keyword 操作

对于 es 中 text 字段,前面我们介绍过 .keyword 的查询方式,是将 text 字段作为一个整体进行查询,在 ES_Q() 中,以下两种操作是等效的:

q = ES_Q({"term": {"address.keyword": "中国湖北省"}})

q = ES_Q("term", address__keyword="中国湖北省")

filter() 操作

在 es 中的 filter 操作,在 Python 中是一个 filter() 函数,可以直接使用:

q = ES_Q("term", name="张三丰")
s = s.filter(q)

range 操作

实现大小于的操作示例如下:

q = ES_Q({"range": {"age": {"gte": 21}}})
s = s.query(q)

exclude() 操作

如果是想取反,除了使用 ~Q(),还可以直接使用 exclude() 函数,这个和 Django 里的操作也是一样的:

q = ES_Q("term", name="张三丰")
s = s.exclude(q)

3、排序

如果是想对返回的结果进行排序操作,直接使用 .sort() 方法。

比如想对 age 字段排序,正序返回数据,可如下操作:

s = s.sort("age")

如果是想倒序返回,可以如下操作:

s = s.sort("-age")

多字段排序直接在后面跟上就行:

s = s.sort("-age", "name")

4、分页

Python 连接 es 进行分页,可以直接使用 Python 里的切片操作,比如:

s = s[5:10]

5、source() 指定返回字段

我们可以通过 source() 方法指定返回的字段:

s = s.source(["name", "address"])

source() 方法还可以接受 includes 和 excludes 参数来指定返回的字段或者不返回的字段,这个和 es 的原生处理方式是一致的:

s = s.source(
includes=["address"],
excludes=["name"]
)

6、extra() 操作

extra() 函数接受一些查询的额外属性,比如 size 参数决定返回条数,比如 from 参数可以决定从第几条数据开始返回,sort 参数决定排序方式,以及 _source 参数决定返回的字段。

比如我们想要返回的数据从第 2 条数据开始,返回两条,按照 name 字段进行排序,只返回 name 和 _id 字段,可以如下操作:

s = Search(using="default").index("exam")
s = s.extra(
sort="name",
_source=["name"],
**{
"from": 1,
"size": 2
}
)
response = s.execute()

7、count() 总数

前面介绍过获取符合条件的总数,可以通过 response.hits.total.value 的方式获得,其实对于 Search(),可以直接使用 count() 函数:

count = s.count()

8、from_dict() 函数

如果我们想直接运行 kibana 里执行的命令,可以使用 from_dict() 函数,比如:

s = s.from_dict(
{
"query": {
"term": {
"name": {
"value": "张三丰"
}
}
}
}
)

如果想获取更多后端相关文章,可扫码关注阅读:

Python连接es笔记二之查询方式汇总的更多相关文章

  1. 【原】Learning Spark (Python版) 学习笔记(二)----键值对、数据读取与保存、共享特性

    本来应该上周更新的,结果碰上五一,懒癌发作,就推迟了 = =.以后还是要按时完成任务.废话不多说,第四章-第六章主要讲了三个内容:键值对.数据读取与保存与Spark的两个共享特性(累加器和广播变量). ...

  2. hibernate 查询方式汇总

    主要摘自  http://blog.sina.com.cn/s/blog_7ffb8dd501014a6o.html ,http://blog.csdn.net/xingtianyiyun/artic ...

  3. Hibernate查询方式汇总

    Hibernate总的来说共有三种查询方式:HQL.QBC和SQL三种.但是细分可以有如下几种: 一.HQL查询方式    这一种我最常用,也是最喜欢用的,因为它写起来灵活直观,而且与所熟悉的SQL的 ...

  4. webdriver(python)学习笔记二

    自己开始一个脚本开始学习: # coding = utf-8 from selenium import webdriver browser = webdriver.Firefox() browser. ...

  5. [SAM4N学习笔记]按键程序(查询方式)

    一.准备工作:      将上一节搭建的工程复制一份,命名为"5.key scanf".这一节主要讲如何使用SAM4N的GPIO输入功能,实现按键的输入. 二.程序编写:      ...

  6. python 连接操作数据库(二)

    一.我们接着上期的博客继续对ORM框架进行补充,顺便把paramiko模块也给大家讲解一下: 1.ORM框架: 在连接操作数据库的第一个博客中也已经说了,sqlalchemy是一个ORM框架,总结就是 ...

  7. python基础学习笔记二之列表

    1.列表 ①列表的创建: ②列表的查询(索引): ③列表的切片操作: 此处要注意到:返回索引0到3的元素,顾头不顾尾. ④列表的增加: s.append()  #直接在结尾追加 s.insert()  ...

  8. StackExchange.Redis学习笔记(二) Redis查询 五种数据类型的应用

    ConnectionMultiplexer ConnectionMultiplexer 是StackExchange.Redis的核心对象,用这个类的实例来进行Redis的一系列操作,对于一个整个应用 ...

  9. Spring学习笔记二:注入方式

    转载请注明原文地址:http://www.cnblogs.com/ygj0930/p/6774608.html  我们说,IOC的实现方式是依赖注入,也就是把被依赖对象赋值到依赖对象的成员属性.怎么做 ...

  10. Python——追加学习笔记(二)

    文件处理 # 文件内移动 seek()方法可以在文件中移动文件指针到不同的位置,offset字节代表相对于某个位置偏移量,默认为0,代表从文件开头算起,1代表从当前位置算起,2代表从文件末尾算起. s ...

随机推荐

  1. 痞子衡嵌入式:恩智浦经典LPC系列MCU内部Flash IAP驱动入门

    大家好,我是痞子衡,是正经搞技术的痞子.今天痞子衡给大家介绍的是恩智浦经典LPC系列MCU内部Flash IAP驱动. LPC 系列 MCU 是恩智浦公司于 2003 年开始推出的非常具有代表性的产品 ...

  2. l洛谷第二题

    题目描述 给定一个 n\times nn×n 的正方形棋盘,几位玩家在上面玩三子棋. 三子棋的规则是每位玩家轮流写下一个字母,同一名玩家的字母相同.当有一名玩家在行.列或者斜线上连续组成了 33 个自 ...

  3. 利用 kubeadm 创建 kubernetes (k8s) 的高可用集群

    引言: kubeadm提供了两种不同的高可用方案. 堆叠方案:etcd服务和控制平面被部署在同样的节点中,对基础设施的要求较低,对故障的应对能力也较低 堆叠方案 最小三个Master(也称工作平面), ...

  4. kubernetes核心实战(三)--- ReplicationController

    5.ReplicationController ReplicationController 确保在任何时候都有特定数量的 Pod 副本处于运行状态.换句话说,ReplicationController ...

  5. pandas技巧

    1. 计算月初.2022-05-03 得到2022-05-01 df['month']=df['purchase_date'].apply(lambda x : x.replace(day=1))

  6. 如何训练个人的ChatGpt4

    如何在自己的计算机上安装类似 ChatGPT 的个人 AI 并在没有互联网的情况下运行它 本文旨在为任何人安装此软件.最初它有一个视频,伴随着操作方法,但是事情变化很快,我的三次尝试只是推迟了我发表这 ...

  7. 实时分布式低延迟OLAP数据库Apache Pinot探索实操

    @ 目录 概述 定义 特性 何时使用 部署 Local安装 快速启动 手动设置集群 Docker安装 快速启动 手动启动集群 Docker Compose 实操 批导入数据 流式导入数据 概述 定义 ...

  8. 吃透SpringMVC面试八股文

    说说你对 SpringMVC 的理解 SpringMVC是一种基于 Java 的实现MVC设计模型的请求驱动类型的轻量级Web框架,属于Spring框架的一个模块. 它通过一套注解,让一个简单的Jav ...

  9. ArcGIS切片服务获取切片方案xml文件(conf.xml)

    在使用ArcGIS进行影像.地形等切片时,往往需要保持一致的切片方案才能够更好的加载地图服务. 本文介绍如何获取已经发布好的ArcGIS服务的切片方案xml文件. 当然切片xml文件还可以通过工具Ge ...

  10. Django笔记二十六之数据库函数之数学公式函数

    本文首发于公众号:Hunter后端 原文链接:Django笔记二十六之数据库函数之数学公式函数 这一篇来介绍一下公式函数,主要是数学公式. 其中 sin,cos 这种大多数情况下用不上的就不介绍了,主 ...