python对接elasticsearch的基本操作

一.关于集群的基本操作

#!/usr/bin/env python

# -*- coding: utf-8 -*-

# author tom

from elasticsearch import Elasticsearch

from pprint import pprint

# 连接es，直接传一个ip字符串参数也可以，他会帮你封装成列表的

es_host = 'XXX.XX.XX.XXX'

#es = Elasticsearch(es_host,)

#es=Elasticsearch（['192.168.10.10', '192.168.10.11', '192.168.10.12']）   #连接集群

es = Elasticsearch([es_host],

                   # 在做任何操作之前，先进行嗅探

                   # sniff_on_start=True,

                   # 节点没有响应时，进行刷新，重新连接

                   # sniff_on_connection_fail=True,

                   # # 每 60 秒刷新一次

                   # sniffer_timeout=60

                   )

###########################关于基本信息的查看############

# #测试是否能连通

# pprint(es.ping())

# #查看集群的健康信息

# pprint(es.cluster.health())

# #查看当前集群的节点信息

# pprint(es.cluster.client.info())

# #查看集群的更多信息

# pprint(es.cluster.state())

# 使用cat查看更多信息

# pprint(es.cat.health())

# pprint(es.cat.master())

# pprint(es.cat.nodes())

# pprint(es.cat.count())

二.关于索引的基本操作

# 查看当前集群的所有的索引

# pprint(es.cat.indices())

# 创建索引

# 创建索引的时候可以指定body参数，就是mapping的type的配置信息

# mapping={}

# res=es.indices.create(index='my-index',ignore=True,body=mapping)

# pprint(res)

# pprint(es.cat.indices())

# 删除索引

# res=es.indices.delete(index='my-index')

# pprint(res)

# 判断索引是否存在

# res=es.indices.exists(index='my-index')

# pprint(res)

三.操作单条数据

# 插入数据的时候指定的索引可以不存在，但是不建议这么做，最好先判断，不存在集创建，这样不易出问题

# 添加一条数据

# 使用index新增可以不指定id，会随机生成一个id，

# 如果指定了id，当id存在的时候，就会对这条数据进行更新，id不存在则新建

# 这边要注意一下，使用index更新，他会用新的字典，直接替换原来的整个字典，与update方法是不一样的

# body = {'name': 'xiaosan', 'age': 18, 'sex': 'girl', }

# res = es.index(index='my-index', body=body, id='OokS028BE9BB6NkUgJnI')

# pprint(res)

#使用create新增一条数据

# 注意使用create新增数据必须指定id，create本质也是调用了index，如果id已经存在就会报错（ConflictError重复错误，所以少用）

# body = {'name': 'xiaosan', 'age': 18, 'sex': 'girl', }

# res=es.create(index='my-index',body=body,id=1)

# 查询一条数据(通过id来查询)

# res=es.get(index='my-index',id='OYkK028BE9BB6NkUOZll')

# pprint(res)

# 查询所有数据

# body = {'query': {'match_all': {}}}

# res = es.search(index='my-index', body=body)

# pprint(res)

# 删除数据(通过指定索引和id进行删除)

# res=es.delete(index='my-index',id='O4kZ028BE9BB6NkUUpm4')   #删除指定id

# pprint(res)

# print(es.delete_by_query(index='p2', body={"query": {"match": {"age": 20}}}))  #删除符合条件

# 更新数据(指定id更新数据，在es7之后要更新的数据需要用一个大字典包裹着，并且，key为doc )

# body={'doc':{'heigh':180}}   #这个更新操作是在原来的基础上增加一个字段，而如果字段原来存在就会进行替换

# res=es.update(index='my-index',id='OokS028BE9BB6NkUgJnI',body=body)

#判断指定id的数据是否存在

pprint(es.exists(index='person1', id='xVywInIBMTX0DMkCECea'))

四.关于多条数据或者高级操作

######### 使用term或者terms进行精确查询

body = {

    "query":{

        "term":{

            "name":"python"

        }

    }

}

######### 查询name="python"的所有数据

es.search(index="my-index",doc_type="test_type",body=body)

body = {

    "query":{

        "terms":{

            "name":[

                "python","android"

            ]

        }

    }

}

# 搜索出name="python"或name="android"的所有数据

res=es.search(index="my_index",doc_type="test_type",body=body)

print(res)

###########　match与multi_match

# match:匹配name包含python关键字的数据

body = {

    "query":{

        "match":{

            "name":"python"

        }

    }

}

# 查询name包含python关键字的数据

es.search(index="my_index",doc_type="test_type",body=body)

body = {

    "query":{

        "multi_match":{

            "query":"深圳",

            "fields":["name","addr"]

        }

    }

}

# 查询name和addr包含"深圳"关键字的数据

es.search(index="my_index",doc_type="test_type",body=body)

############ ids

body = {

    "query":{

        "ids":{

            "type":"test_type",

            "values":[

                "",""

            ]

        }

    }

}

# 搜索出id为1或2d的所有数据

es.search(index="my_index",doc_type="test_type",body=body)

########### 复合查询bool

#bool有3类查询关系，must(都满足),should(其中一个满足),must_not(都不满足)

body = {

    "query":{

        "bool":{

            "must":[

                {

                    "term":{

                        "name":"python"

                    }

                },

                {

                    "term":{

                        "age":18

                    }

                }

            ]

        }

    }

}

# 获取name="python"并且age=18的所有数据

es.search(index="my_index",doc_type="test_type",body=body)

#############  切片式查询

body = {

    "query":{

        "match_all":{}

    },

    "from":2,    # 从第二条数据开始

    "size":4    # 获取4条数据

}

# 从第2条数据开始，获取4条数据

es.search(index="my_index",doc_type="test_type",body=body)

###########范围查询

body = {

    "query":{

        "range":{

            "age":{

                "gte":18,       # >=18

                "lte":30        # <=30

            }

        }

    }

}

# 查询18<=age<=30的所有数据

es.search(index="my_index",doc_type="test_type",body=body)

#########前缀查询

body = {

    "query":{

        "prefix":{

            "name":"p"

        }

    }

}

# 查询前缀为"赵"的所有数据

es.search(index="my_index",doc_type="test_type",body=body)

######  通配符查询

body = {

    "query":{

        "wildcard":{

            "name":"*id"

        }

    }

}

# 查询name以id为后缀的所有数据

es.search(index="my_index",doc_type="test_type",body=body)

######## 排序

body = {

    "query":{

        "match_all":{}

    },

    "sort":{

        "age":{                 # 根据age字段升序排序

            "order":"asc"       # asc升序，desc降序

        }

    }

}

##########  filter_path

# 只需要获取_id数据,多个条件用逗号隔开

es.search(index="my_index",doc_type="test_type",filter_path=["hits.hits._id"])

#########   获取所有数据

es.search(index="my_index",doc_type="test_type",filter_path=["hits.hits._*"])

#度量类聚合

#获取最小值

body = {

    "query":{

        "match_all":{}

    },

    "aggs":{                        # 聚合查询

        "min_age":{                 # 最小值的key

            "min":{                 # 最小

                "field":"age"       # 查询"age"的最小值

            }

        }

    }

}

# 搜索所有数据，并获取age最小的值

es.search(index="my_index",doc_type="test_type",body=body)

body = {

    "query":{

        "match_all":{}

    },

    "aggs":{                        # 聚合查询

        "max_age":{                 # 最大值的key

            "max":{                 # 最大

                "field":"age"       # 查询"age"的最大值

            }

        }

    }

}

####### 搜索所有数据，并获取age最大的值

es.search(index="my_index",doc_type="test_type",body=body)

body = {

    "query":{

        "match_all":{}

    },

    "aggs":{                        # 聚合查询

        "sum_age":{                 # 和的key

            "sum":{                 # 和

                "field":"age"       # 获取所有age的和

            }

        }

    }

}

# 搜索所有数据，并获取所有age的和

es.search(index="my_index",doc_type="test_type",body=body)

#获取平均值

body = {

    "query":{

        "match_all":{}

    },

    "aggs":{                        # 聚合查询

        "avg_age":{                 # 平均值的key

            "sum":{                 # 平均值

                "field":"age"       # 获取所有age的平均值

            }

        }

    }

}

# 搜索所有数据，获取所有age的平均值

es.search(index="my_index",doc_type="test_type",body=body)

五.对返回的字段进行过滤

　　filter_path参数用于过滤减少es返回信息，可以指定返回相关的内容，还支持一些通配符的操作*

# 主要是对_source同一级的字段进行过滤

print(es.search(index="p1", body=body, filter_path=["hits.hits"]))

print(es.search(index="p1", body=body, filter_path=["hits.hits._source"]))

print(es.search(index="p1", body=body, filter_path=["hits.hits._source", "hits.total"]))

print(es.search(index="p1", body=body, filter_path=["hits.*"]))

print(es.search(index="p1", body=body, filter_path=["hits.hits._*"]))

六.获取数据量

#########  count

#执行查询并获取该查询的匹配数

########  获取数据量

es.count(index="my_index",doc_type="test_type")

pprint(es.count(index='person'))
pprint(es.count(index='person')['count'])

　　结果：

{'_shards': {'failed': 0, 'skipped': 0, 'successful': 1, 'total': 1},

 'count': 1}

1

python对接elasticsearch的基本操作的更多相关文章

django使用haystack对接Elasticsearch实现商品搜索
# 原创,转载请留言联系前言: 在做一个商城项目的时候,需要实现商品搜索功能. 说到搜索,第一时间想到的是数据库的 select * from tb_sku where name like %苹果手 ...
Elasticsearch使用系列-.NET6对接Elasticsearch
Elasticsearch使用系列-ES简介和环境搭建 Elasticsearch使用系列-ES增删查改基本操作+ik分词 Elasticsearch使用系列-基本查询和聚合查询+sql插件 Elas ...
python selenium webdriver入门基本操作
python selenium webdriver入门基本操作未经作者允许,禁止转载! from selenium import webdriver import time driver=webdr ...
Python数据分析库pandas基本操作
Python数据分析库pandas基本操作2017年02月20日 17:09:06 birdlove1987 阅读数:22631 标签: python 数据分析 pandas 更多个人分类: Pyt ...
Python 操作 ElasticSearch
Python 操作 ElasticSearch 学习了:https://www.cnblogs.com/shaosks/p/7592229.html 官网:https://elasticsearch- ...
Python 和 Elasticsearch 构建简易搜索
Python 和 Elasticsearch 构建简易搜索作者:白宁超 2019年5月24日17:22:41 导读:件开发最大的麻烦事之一就是环境配置,操作系统设置,各种库和组件的安装.只有它们都正 ...
Python操作ElasticSearch
Python批量向ElasticSearch插入数据 Python 2的多进程不能序列化类方法, 所以改为函数的形式. 直接上代码: #!/usr/bin/python # -*- coding:ut ...
python对接常用数据库，快速上手！
python对接常用数据库,快速上手! 很多同学在使用python进行自动化测试的时候,会涉及到数据库数据校验的问题,因为不知道如何在python中如何对数据库,这个时候会一脸茫然,今天在这里给大家汇 ...
笔记13：Python 和 Elasticsearch 构建简易搜索
Python 和 Elasticsearch 构建简易搜索 1 ES基本介绍概念介绍 Elasticsearch是一个基于Lucene库的搜索引擎.它提供了一个分布式.支持多租户的全文搜索引擎,它可 ...

随机推荐

mysql 优化2 慢查询
默认情况下mysql不记录慢查询日志,需要在启动的时候指定 bin\mysqld.exe - -slow-query-log 通过慢查询日志定位执行效率较低的SQL语句.慢查询日志记录了所有执行时间超 ...
mysql挖掘与探索------第2章索引1-1
1索引作用说起提高数据库性能,索引是最物美价廉的东西了.不用加内存,不用改程序,不用调sql,只要执行个正确的’create index’,查询速度就可能提高百倍千倍,这可真有诱惑力.可是天下没有免 ...
Java IO: 字符流的Piped和CharArray
作者: Jakob Jenkov 译者: 李璟(jlee381344197@gmail.com) 本章节将简要介绍管道与字符数组相关的reader和writer,主要涉及PipedReader.Pip ...
jtemplates使用+同内容列合并
function ImportStatistics(val, pros) { top.$.jBox.tip("导入已完成,正在统计整理导入的数据...", 'loading'); ...
iphone开发学习之路--基本语法
关键字:Objective-C(以下简称O-C)是C语言的一个超集,也就是C语言的语法O-C都是兼容的,所以为了避免冲突O-C的关键字都是以@符号开始的,比如:@class.@public .@try ...
用Hutton32玩转数字电路（一）：逻辑门
最近看到有人用Minecraft里面的红石电路制作出了计算器,还有一篇神文:<基于Minecraft实现的计算机工程>,视频在此,好像还能算浮点数.三角函数.我对红石不是太了解,那能不能用 ...
Win32下双缓冲绘图技术
一:双缓冲原理为了解决窗口刷新频率过快所带来的闪烁问题,利用双缓冲技术进行绘图.所谓双缓冲技术,就是将资源加载到内存,然后复制内存数据到设备DC(这个比较快),避免了直接在设备DC上绘图(这个比较慢 ...
转：Zabbix-3.0.x使用OneAlert发送告警
转自: http://blog.sina.com.cn/s/blog_87113ac20102w7il.html ( 标签: onealert 分类: zab OneAlert 是国内首个 Saa ...
CORS’s source, Principle and Implementation
跨域资源共享(CORS) 是一种机制,它使用额外的 HTTP 头来告诉浏览器让运行在一个 origin (domain) 上的Web应用被准许访问来自不同源服务器上的指定的资源.当一个资源从与该资源 ...
Jmeter之Beanshell---使用Java处理JSON块
原文出处:https://www.cnblogs.com/xpp142857/p/7374281.html [环境] ①Jmeter版本:3.1,JDK:1.7 ②前置条件:将json.jar包置于. ...

python对接elasticsearch的基本操作

一.关于集群的基本操作

二.关于索引的基本操作

三.操作单条数据

四.关于多条数据或者高级操作

五.对返回的字段进行过滤

六.获取数据量

python对接elasticsearch的基本操作的更多相关文章

随机推荐

热门专题