python 操作es

Elasticsearch 是一个开源的搜索引擎，建立在一个全文搜索引擎库 Apache Lucene™ 基础之上。 Lucene 可能是目前存在的，不论开源还是私有的，拥有最先进，高性能和全功能搜索引擎功能的库。但是 Lucene 仅仅只是一个库。为了利用它，你需要编写 Java 程序，并在你的 java 程序里面直接集成 Lucene 包。更坏的情况是，你需要对信息检索有一定程度的理解才能明白 Lucene 是怎么工作的。Lucene 是很复杂的。
在上一篇博客中介绍了ElasticSearch的简单使用，接下来记录一下ElasticSearch的查询：
#创建index索引
#创建索引，索引的名字是my-index,如果已经存在了，就返回个400，
#这个索引可以现在创建，也可以在后面插入数据的时候再临时创建

es.indices.create(index='my-index',ignore)

#插入数据

#插入数据,(这里省略插入其他两条数据，后面用)

es.index(index="my-index",doc_type="test-type",id=,body={"any":"data01","timestamp":datetime.now()})

#get获取数据

#查询数据，两种get and search
#get获取

res = es.get(index="my-index", doc_type="test-type", id=)

es.get(index='indexName', doc_type='typeName', id='idValue')

#删除数据

delete：删除指定index、type、id的文档

es.delete(index='indexName', doc_type='typeName', id='idValue')

#条件删除

delete_by_query：删除满足条件的所有数据，查询条件必须符合DLS格式

query = {'query': {'match': {'sex': 'famale'}}}# 删除性别为女性的所有文档

query = {'query': {'range': {'age': {'lt': }}}}# 删除年龄小于11的所有文档

es.delete_by_query(index='indexName', body=query, doc_type='typeName')

#条件更新

update_by_query：更新满足条件的所有数据，写法同上删除和查询

#批量写入、删除、更新

delete_by_query：删除满足条件的所有数据，查询条件必须符合DLS格式

query = {'query': {'match': {'sex': 'famale'}}}# 删除性别为女性的所有文档

query = {'query': {'range': {'age': {'lt': }}}}# 删除年龄小于11的所有文档

es.delete_by_query(index='indexName', body=query, doc_type='typeName')

#批量更新也可以采用如下的方式进行json拼装，最后写入

for line in list:

            action = {

                "_index": self.index_name,

                "_type": self.index_type,

                "_id": i, #_id 也可以默认生成，不赋值

                "_source": {

                    "date": line['date'],

                    "source": line['source'].decode('utf8'),

                    "link": line['link'],

                    "keyword": line['keyword'].decode('utf8'),

                    "title": line['title'].decode('utf8')}

            }

            i +=

            ACTIONS.append(action)

success, _ = bulk(self.es, ACTIONS, index=self.index_name, raise_on_error=True)

查询所有数据
搜索所有数据

es.search(index="my_index",doc_type="test_type")

# 或者

body = {

    "query":{

        "match_all":{}

    }

}

es.search(index="my_index",doc_type="test_type",body=body)

#term与terms

body = {

    "query":{

        "term":{

            "name":"python"

        }

    }

}

# 查询name="python"的所有数据

es.search(index="my_index",doc_type="test_type",body=body)
terms

body = {
    "query":{
        "terms":{
            "name":[
                "python","android"
            ]
        }
    }
}
# 搜索出name="python"或name="android"的所有数据
es.search(index="my_index",doc_type="test_type",body=body)

#match与multi_match

# match:匹配name包含python关键字的数据

body = {

    "query":{

        "match":{

            "name":"python"

        }

    }

}

# 查询name包含python关键字的数据

es.search(index="my_index",doc_type="test_type",body=body)

# multi_match:在name和addr里匹配包含深圳关键字的数据

body = {

    "query":{

        "multi_match":{

            "query":"深圳",

            "fields":["name","addr"]

        }

    }

}

# 查询name和addr包含"深圳"关键字的数据

es.search(index="my_index",doc_type="test_type",body=body)

#ids

body = {

    "query":{

        "ids":{

            "type":"test_type",

            "values":[

                "",""

            ]

        }

    }

}

# 搜索出id为1或2d的所有数据

es.search(index="my_index",doc_type="test_type",body=body)

#复合查询bool

bool有3类查询关系，must(都满足),should(其中一个满足),must_not(都不满足)

body = {

    "query":{

        "bool":{

            "must":[

                {

                    "term":{

                        "name":"python"

                    }

                },

                {

                    "term":{

                        "age":

                    }

                }

            ]

        }

    }

}

# 获取name="python"并且age=18的所有数据

es.search(index="my_index",doc_type="test_type",body=body)

#切片式查询

body = {

    "query":{

        "match_all":{}

    }

    "from":    # 从第二条数据开始

    "size":    # 获取4条数据

}

# 从第2条数据开始，获取4条数据

es.search(index="my_index",doc_type="test_type",body=body)

#范围查询

body = {

    "query":{

        "range":{

            "age":{

                "gte":,       # >=

                "lte":        # <=

            }

        }

    }

}

# 查询18<=age<=30的所有数据

es.search(index="my_index",doc_type="test_type",body=body)

#前缀查询

body = {

    "query":{

        "prefix":{

            "name":"p"

        }

    }

}

# 查询前缀为"赵"的所有数据

es.search(index="my_index",doc_type="test_type",body=body)

#通配符查询

body = {

    "query":{

        "wildcard":{

            "name":"*id"

        }

    }

}

# 查询name以id为后缀的所有数据

es.search(index="my_index",doc_type="test_type",body=body)

#排序

body = {

    "query":{

        "match_all":{}

    }

    "sort":{

        "age":{                 # 根据age字段升序排序

            "order":"asc"       # asc升序，desc降序

        }

    }

}

#filter_path
响应过滤

# 只需要获取_id数据,多个条件用逗号隔开
es.search(index="my_index",doc_type="test_type",filter_path=["hits.hits._id"])

# 获取所有数据
es.search(index="my_index",doc_type="test_type",filter_path=["hits.hits._*"])

#count
执行查询并获取该查询的匹配数

# 获取数据量
es.count(index="my_index",doc_type="test_type")

#度量类聚合
获取最小值

body = {

    "query":{

        "match_all":{}

    },

    "aggs":{                        # 聚合查询

        "min_age":{                 # 最小值的key

            "min":{                 # 最小

                "field":"age"       # 查询"age"的最小值

            }

        }

    }

}
# 搜索所有数据，并获取age最小的值
es.search(index="my_index",doc_type="test_type",body=body)

获取最大值

body = {

    "query":{

        "match_all":{}

    },

    "aggs":{                        # 聚合查询

        "max_age":{                 # 最大值的key

            "max":{                 # 最大

                "field":"age"       # 查询"age"的最大值

            }

        }

    }

}

# 搜索所有数据，并获取age最大的值
es.search(index="my_index",doc_type="test_type",body=body)

获取和

body = {

    "query":{

        "match_all":{}

    },

    "aggs":{                        # 聚合查询

        "sum_age":{                 # 和的key

            "sum":{                 # 和

                "field":"age"       # 获取所有age的和

            }

        }

    }

}
# 搜索所有数据，并获取所有age的和
es.search(index="my_index",doc_type="test_type",body=body)

获取平均值


body = {

    "query":{

        "match_all":{}

    },

    "aggs":{                        # 聚合查询

        "avg_age":{                 # 平均值的key

            "sum":{                 # 平均值

                "field":"age"       # 获取所有age的平均值

            }

        }

    }

}

# 搜索所有数据，获取所有age的平均值

es.search(index="my_index",doc_type="test_type",body=body)

python 操作es的更多相关文章

es的查询、排序查询、分页查询、布尔查询、查询结果过滤、高亮查询、聚合函数、python操作es
今日内容概要 es的查询 Elasticsearch之排序查询 Elasticsearch之分页查询 Elasticsearch之布尔查询 Elasticsearch之查询结果过滤 Elasticse ...
python 操作 elasticsearch-7.0.2 遇到的问题
错误一:TypeError: search() got an unexpected keyword argument 'doc_type',得到不预期外的参数解决方法:elasticsearch7里 ...
python操作elasticsearch增、删、改、查
最近接触了个新东西--es数据库这东西虽然被用的很多,但我是前些天刚刚接触的,发现其资料不多,学起来极其痛苦,写个文章记录下导入库from elasticsearch import Elastic ...
Python（九） Python 操作 MySQL 之 pysql 与 SQLAchemy
本文针对 Python 操作 MySQL 主要使用的两种方式讲解: 原生模块 pymsql ORM框架 SQLAchemy 本章内容: pymsql 执行 sql 增\删\改\查语句 pymsql ...
Python 【第六章】：Python操作 RabbitMQ、Redis、Memcache、SQLAlchemy
Memcached Memcached 是一个高性能的分布式内存对象缓存系统,用于动态Web应用以减轻数据库负载.它通过在内存中缓存数据和对象来减少读取数据库的次数,从而提高动态.数据库驱动网站的速度 ...
练习：python 操作Mysql 实现登录验证用户权限管理
python 操作Mysql 实现登录验证用户权限管理
Python操作MySQL
本篇对于Python操作MySQL主要使用两种方式: 原生模块 pymsql ORM框架 SQLAchemy pymsql pymsql是Python中操作MySQL的模块,其使用方法和MySQLdb ...
Python操作Mysql之基本操作
pymysql python操作mysql依赖pymysql这个模块下载安装 pip3 install pymysql 操作mysql python操作mysql的时候,是通过”游标”来进行操作的. ...
Python操作RabbitMQ
RabbitMQ介绍 RabbitMQ是一个由erlang开发的AMQP(Advanced Message Queue )的开源实现的产品,RabbitMQ是一个消息代理,从“生产者”接收消息并传递消 ...

随机推荐

spring框架学习(一)——IOC/DI
什么是Spring框架: Spring是一个基于IOC和AOP的结构J2EE系统的框架: IOC 反转控制是Spring的基础,Inversion Of Control,简单说就是创建对象由以前的程 ...
Django---Http协议简述和原理,HTTP请求码,HTTP请求格式和响应格式(重点),Django的安装与使用,Django项目的创建和运行(cmd和pycharm两种模式),Django的基础文件配置,Web框架的本质,服务器程序和应用程序(wsgiref服务端模块,jinja2模板渲染模块)的使用
Django---Http协议简述和原理,HTTP请求码,HTTP请求格式和响应格式(重点),Django的安装与使用,Django项目的创建和运行(cmd和pycharm两种模式),Django的基 ...
Myeclipse6.5迁移到IDEA
背景 myeclipse开发的javaweb项目用svn管理.现要转用idea开发.因为发现idea实在是太好用了.myeclipse6.5是个纯净版,用了两年,对于新手来说用myeclipse6.5 ...
java中创建线程的3种方法
1.继承Thread类优点:可以直接使用Thread类中的方法,代码比较简单.缺点:继承Thread类之后不能继承其他类. 2.实现Runable接口优点:实现接口,比影响继承其他类或实现接口.缺点: ...
组件切换方式（Vue.js）
这里,我用一个注册登录两组件的切换实例来演示: 切换方式一 <!DOCTYPE html> <html lang="zh-CN"> <head> ...
CSS3 完善盒模型
CSS3 改善了传统盒模型结构,增强了盒子构成要素的功能,扩展了盒模型显示的方式. 改善结构:为盒子新增轮廓区: 增强功能:内容区增强 CSS 自动添加内容功能,增强内容移除.换行处理:允许多重定义背 ...
android中app卡顿优化问题
所谓app卡顿原因就是在运行时出现了丢帧,还可能是UI线程被阻塞.首先来一下丢帧现象,android每16ms会对界面进行一次渲染,如果app的绘制.计算等超过了16ms那么只能等下一个16ms才能 ...
FreeRTOS 任务通知模拟计数型信号量
举例 //释放计数型信号量任务函数 void SemapGive_task(void *pvParameters) { u8 key; while(1) { key = KEY_Scan(0); // ...
java接口中的成员方法和成员变量
接口的含义理解:接口可以理解成统一的"协议",而接口中的属性也属于协议中的内容;但是接口的属性都是公共的,静态的,最终的接口的成员特点:A:成员变量只能是常量.默认修饰符 pu ...
ApplicationContext的名称解释
如果说BeanFactory是Spring的心脏,那么Application就是完整的身躯.ApplicationContext就是由BeanFactory派生出来的. 1.ApplicationCo ...

python 操作es

python 操作es的更多相关文章

随机推荐

热门专题