【转】elasticsearch的查询器query与过滤器filter的区别

很多刚学elasticsearch的人对于查询方面很是苦恼，说实话es的查询语法真心不简单… 当然你如果入门之后，会发现elasticsearch的rest api设计是多么有意思。

说正题，elasticsearch的查询有两部分组成：query and filter 。

下面是官方的query vs filter的介绍，其实说的也是不明不白的.

https://www.elastic.co/guide/en/elasticsearch/guide/current/_queries_and_filters.html

文章会后续更新，如果文章被转走了，请到原文地址瞅瞅： http://xiaorui.cc/?p=2317

Query查询器与 Filter 过滤器

尽管我们之前已经涉及了查询DSL，然而实际上存在两种DSL：查询DSL（query DSL）和过滤DSL（filter DSL）。

过滤器（filter）通常用于过滤文档的范围，比如某个字段是否属于某个类型，或者是属于哪个时间区间

* 创建日期是否在2014-2015年间？

* status字段是否为success？

* lat_lon字段是否在某个坐标的10公里范围内？

查询器（query）的使用方法像极了filter，但query更倾向于更准确的查找。

* 与full text search的匹配度最高

* 正则匹配

* 包含run单词，如果包含这些单词：runs、running、jog、sprint，也被视为包含run单词

* 包含quick、brown、fox。这些词越接近，这份文档的相关性就越高

查询器会计算出每份文档对于某次查询有多相关（relevant），然后分配文档一个相关性分数：_score。而这个分数会被用来对匹配了的文档进行相关性排序。相关性概念十分适合全文搜索（full-text search），这个很难能给出完整、“正确”答案的领域。

query filter在性能上对比：filter是不计算相关性的，同时可以cache。因此，filter速度要快于query。

下面是使用query语句查询的结果,第一次查询用了300ms,第二次用了280ms.

Python

#blog:  http://xiaorui.cc

{

    "size": 1,

    "query": {

        "bool": {

            "must": [

                {

                    "terms": {

                        "keyword": [

                            "手机",

                            "iphone"

                        ]

                    }

                },

                {

                    "range": {

                        "cdate": {

                            "gt": "2015-11-09T11:00:00"

                        }

                    }

                }

            ]

        }

    }

}

{

    "took": 51,

    "timed_out": false,

    "_shards": {

        "total": 30,

        "successful": 30,

        "failed": 0

    },

    "hits": {

        "total": 6818,

        "max_score": 0,

        "hits": []

    }

}

#blog:  http://xiaorui.cc

{

	"size":1,

	"query":{

		"bool":{

			"must":[

				{

					"terms":{

						"keyword":[

							"手机",

							"iphone"

						]

					}

				},

				{

					"range":{

						"cdate":{

							"gt":"2015-11-09T11:00:00"

						}

					}

				}

			]

		}

	}

}

{

	"took":51,

	"timed_out":false,

	"_shards":{

		"total":30,

		"successful":30,

		"failed":0

	},

	"hits":{

		"total":6818,

		"max_score":0,

		"hits":[]

	}

}

下面是使用filter查询出来的结果,第一次查询时间是280ms,第二次130ms…. 速度确实快了不少，也证明filter走了cache缓存。但是如果我们对比下命中的数目，query要比filter要多一点，换句话说，更加的精准。

Python

#blog: xiaorui.cc

{

    "size": 0,

    "filter": {

        "bool": {

            "must": [

                {

                    "terms": {

                        "keyword": [

                            "手机",

                            "iphone"

                        ]

                    }

                },

                {

                    "range": {

                        "cdate": {

                            "gt": "2015-11-09T11:00:00"

                        }

                    }

                }

            ]

        }

    }

}

{

    "took": 145,

    "timed_out": false,

    "_shards": {

        "total": 30,

        "successful": 30,

        "failed": 0

    },

    "hits": {

        "total": 6804,

        "max_score": 0,

        "hits": []

    }

}<span style="font-size:13.2px;line-height:1.5;"></span>

#blog: xiaorui.cc

{

	"size":0,

	"filter":{

		"bool":{

			"must":[

				{

					"terms":{

						"keyword":[

							"手机",

							"iphone"

						]

					}

				},

				{

					"range":{

						"cdate":{

							"gt":"2015-11-09T11:00:00"

						}

					}

				}

			]

		}

	}

}

{

	"took":145,

	"timed_out":false,

	"_shards":{

		"total":30,

		"successful":30,

		"failed":0

	},

	"hits":{

		"total":6804,

		"max_score":0,

		"hits":[]

	}

}<spanstyle="font-size:13.2px;line-height:1.5;"></span>

如果你想同时使用query和filter查询的话，需要使用 {query:{filtered：{}}} 来包含这两个查询语法。他们的好处是，借助于filter的速度可以快速过滤出文档，然后再由query根据条件来匹配。

"query": {

        "filtered": {

            "query":  { "match": { "email": "business opportunity" }},

            "filter": { "term": { "folder": "inbox" }}

        }

    }

}

{   "size":0,

    "query": {

        "filtered": {

            "query": {

                "bool": {

                    "should": [],

                    "must_not": [

                    ],

                    "must": [

                        {

                         "term": {

                                "channel_name":"微信自媒体微信"

                            }

                        }

                    ]

                }

            }

        }，

        "filter":{

            "range": {

                "idate": {

                    "gte": "2015-09-01T00:00:00",

                    "lte": "2015-09-10T00:00:00"

                    }

                }

        }

    }

}

    "query":{

        "filtered":{

            "query":  {"match":{"email":"business opportunity"}},

            "filter":{"term":{"folder":"inbox"}}

        }

    }

}

{  "size":0,

    "query":{

        "filtered":{

            "query":{

                "bool":{

                    "should":[],

                    "must_not":[

                    ],

                    "must":[

                        {

                         "term":{

                                "channel_name":"微信自媒体微信"

                            }

                        }

                    ]

                }

            }

        }，

        "filter":{

            "range":{

                "idate":{

                    "gte":"2015-09-01T00:00:00",

                    "lte":"2015-09-10T00:00:00"

                    }

                }

        }

    }

}

我们这业务上关于elasticsearch的查询语法基本都是用query filtered方式进行的，我也推荐大家直接用这样的方法。should ，must_not, must 都是列表，列表里面可以写多个条件。这里再啰嗦一句，如果你的查询是范围和类型比较粗大的，用filter ！如果是那种精准的，就用query来查询。

{

”bool”:{

”should”:[], #相当于OR条件

”must_not”:[], #必须匹配的条件，这里的条件都会被反义

”must”:[] #必须要有的

}

END..

【转】elasticsearch的查询器query与过滤器filter的区别的更多相关文章

struts2的拦截器(Interceptor)与过滤器(Filter)
一.拦截器与过滤器的区别: 1.filter基于回调函数,我们需要实现的filter接口中doFilter方法就是回调函数,而interceptor则基于Java本身的反射机制,这是两者最本质的区别. ...
ElasticSearch中如何让query should等同于filter should
bool query must The clause (query) must appear in matching documents. should The clause (query) shou ...
拦截器(Inteceptor)，过滤器(Filter)，切面(Aspect)处理HttpServiceReqeust请求
1.拦截器 java里的拦截器是动态拦截Action调用的对象.它提供了一种机制可以使开发者可以定义在一个action执行的前后执行的代码,也可以在一个action执行前阻止其执行,同时也提供了一种可 ...
拦截器Interceptor和过滤器Filter的区别
(1)过滤器(Filter):当你有一堆东西的时候,你只希望选择符合你要求的某一些东西.定义这些要求的工具,就是过滤器.(理解:就是一堆字母中取一个B) (2)拦截器(Interceptor):在一个 ...
ElasticSearch的 Query DSL 和 Filter DSL
Elasticsearch支持很多查询方式,其中一种就是DSL,它是把请求写在JSON里面,然后进行相关的查询. Query DSL 与 Filter DSL DSL查询语言中存在两种:查询DSL(q ...
elasticsearch 高级查询
高级查询子条件查询 (特定字段查询所指特定值) 复合条件查询 (以一定的逻辑组合子条件查询) 一.子条件查询子条件查询分为 query context.filter context 1.query ...
Swoole 实战：MySQL 查询器的实现（协程连接池版）
目录需求分析使用示例模块设计 UML 类图入口事务连接池连接查询器的组装总结需求分析本篇我们将通过 Swoole 实现一个自带连接池的 MySQL 查询器: 支持通过链式调用构造 ...
Elasticsearch查询——布尔查询Bool Query
Elasticsearch在2.x版本的时候把filter查询给摘掉了,因此在query dsl里面已经找不到filter query了.其实es并没有完全抛弃filter query,而是它的设计与 ...
elasticsearch query 和 filter 的区别
Query查询器与 Filter 过滤器尽管我们之前已经涉及了查询DSL,然而实际上存在两种DSL:查询DSL(query DSL)和过滤DSL(filter DSL).过滤器(filter)通常 ...

随机推荐

[2014-02-19]ConfigurationSection：让web.config配置更有条理
本文针对新手使用Web.config的配置信息,一般都习惯于使用 ConfigurationManager.AppSettings["ConfigKey"] 当程序不断迭代,开发 ...
websphere：rs.getDate()无法使用的解决方法
参考java.text.SimpleDateFormat 在tomcat中我们可以根据数据的类型将结果集获取到,但在websphere中却无法实现,原因不详. 现在有两种解决方法: 第一种方法是当字符 ...
MySql-python的API手记
--------------------python控制mysql的API--------------------#import MySQLdb:引用对应的开发包#conn=MySQLdb.conne ...
CountDownLatch与CyclicBarrier
对于AbstractQueuedSynchronizer衍生出来的并发工具类,这一篇再介绍俩. 场景1:有4个大文件的数据需要统计,最终将所有的统计结果进行加工,得到最后的分析数据.为了加速处理过程, ...
JUnit 3.8.1 源码学习
JUnit 3.8.1 源码学习环境搭建(源码加载配置) 由于IDE自身含有JUint插件,因此通过正常途径是没有源码加载入口的,因此需通过手动加载扩展JAR,然后再添加对应源码JAR,如图:项目右 ...
六,ESP8266 TCP Client
今天不知道是不是让我姐挺失望.......很多时候都不知道自己努力的方向对不对,,以后能不能带给家人最美好的期盼...... Init.lua 没啥改变,,就改了一下加载Client.lua gpio ...
团队作业8----第二次项目冲刺（Beta阶段）第三天
BETA阶段冲刺第三天 1.小会议ing 2.每个人的工作 (1) 昨天已完成的工作注册账号时时添加了账号相同不能添加的功能,以防两个账号一样的情况: 老师账号注册时添加一个密令: (2) 今天计划 ...
团队作业8----第二次项目冲刺（Beta阶段）第五天
BETA阶段冲刺第五天 1.小会议ing 2.每个人的工作 (1)昨天已完成的工作文件读取的方式采用按钮的: (2) 今天计划完成的工作 (3) 工作中遇到的困难: 林莹:源代码的部分我们已经初步完 ...
201521123091 《Java程序设计》第9周学习总结
Java 第九周总结第九周的作业. 目录 1.本章学习总结 2.Java Q&A 3.码云上代码提交记录及PTA实验总结 1.本章学习总结 1.1 以你喜欢的方式(思维导图或其他)归纳总结异 ...
201521123095 《Java程序设计》第5周学习总结
1. 本周学习总结 1.1 尝试使用思维导图总结有关多态与接口的知识点. 2. 书面作业 1.1 com.parent包中Child.java文件能否编译通过?哪句会出现错误?试改正该错误.并分析输出 ...

【转】elasticsearch的查询器query与过滤器filter的区别

【转】elasticsearch的查询器query与过滤器filter的区别的更多相关文章

随机推荐

热门专题