elasticsearch query 和 filter 的区别

Query查询器与 Filter 过滤器

尽管我们之前已经涉及了查询DSL，然而实际上存在两种DSL：查询DSL（query DSL）和过滤DSL（filter DSL）。
过滤器（filter）通常用于过滤文档的范围，比如某个字段是否属于某个类型，或者是属于哪个时间区间
* 创建日期是否在2014-2015年间？
* status字段是否为success？

* lat_lon字段是否在某个坐标的10公里范围内？

查询器（query）的使用方法像极了filter，但query更倾向于更准确的查找。

* 与full text search的匹配度最高

* 正则匹配

* 包含run单词，如果包含这些单词：runs、running、jog、sprint，也被视为包含run单词
* 包含quick、brown、fox。这些词越接近，这份文档的相关性就越高
查询器会计算出每份文档对于某次查询有多相关（relevant），然后分配文档一个相关性分数：_score。而这个分数会被用来对匹配了的文档进行相关性排序。相关性概念十分适合全文搜索（full-text search），这个很难能给出完整、“正确”答案的领域。

query filter在性能上对比：filter是不计算相关性的，同时可以cache。因此，filter速度要快于query。

下面是使用query语句查询的结果,第一次查询用了300ms,第二次用了280ms.

Python

#blog: http://xiaorui.cc

{

"size": 1,

"query": {

"bool": {

"must": [

{

"terms": {

"keyword": [

"手机",

"iphone"

]

}

{

"range": {

"cdate": {

"gt": "2015-11-09T11:00:00"

}

]

}

{

"took": 51,

"timed_out": false,

"_shards": {

"total": 30,

"successful": 30,

"failed": 0

"hits": {

"total": 6818,

"max_score": 0,

"hits": []

}

下面是使用filter查询出来的结果,第一次查询时间是280ms,第二次130ms…. 速度确实快了不少，也证明filter走了cache缓存。但是如果我们对比下命中的数目，query要比filter要多一点，换句话说，更加的精准。

Python

#blog: xiaorui.cc

{

"size": 0,

"filter": {

"bool": {

"must": [

{

"terms": {

"keyword": [

"手机",

"iphone"

]

}

{

"range": {

"cdate": {

"gt": "2015-11-09T11:00:00"

}

]

}

{

"took": 145,

"timed_out": false,

"_shards": {

"total": 30,

"successful": 30,

"failed": 0

"hits": {

"total": 6804,

"max_score": 0,

"hits": []

}

}<span style="font-size:13.2px;line-height:1.5;"></span>

如果你想同时使用query和filter查询的话，需要使用 {query:{filtered：{}}} 来包含这两个查询语法。他们的好处是，借助于filter的速度可以快速过滤出文档，然后再由query根据条件来匹配。

Python

"query": {

"filtered": {

"query": { "match": { "email": "business opportunity" }},

"filter": { "term": { "folder": "inbox" }}

}

{ "size":0,

"query": {

"filtered": {

"query": {

"bool": {

"should": [],

"must_not": [

"must": [

{

"term": {

"channel_name":"微信自媒体微信"

}

]

}

}，

"filter":{

"range": {

"idate": {

"gte": "2015-09-01T00:00:00",

"lte": "2015-09-10T00:00:00"

}

我们这业务上关于elasticsearch的查询语法基本都是用query filtered方式进行的，我也推荐大家直接用这样的方法。should ，must_not, must 都是列表，列表里面可以写多个条件。这里再啰嗦一句，如果你的查询是范围和类型比较粗大的，用filter ！如果是那种精准的，就用query来查询。

{

”bool”:{

”should”:[], #相当于OR条件

”must_not”:[], #必须匹配的条件，这里的条件都会被反义

”must”:[] #必须要有的

}

END..

原文地址：

http://xiaorui.cc/2015/11/09/elasticsearch%e7%9a%84%e6%9f%a5%e8%af%a2%e5%99%a8query%e4%b8%8e%e8%bf%87%e6%bb%a4%e5%99%a8filter%e7%9a%84%e5%8c%ba%e5%88%ab/

转载时必须以链接形式注明原始出处及本声明。

elasticsearch query 和 filter 的区别的更多相关文章

Elasticsearch query和filter的区别
1.关于Query context和filter context 查询语句的表现行为取决于使用了查询上下文方式还是过滤上下文方式. Query context:查询上下文,回答了“文档是如何被查询语句 ...
ElasticSearch - query vs filter
query vs filter 来自stackoverflow Stackoverflow - queries-vs-filters Question 题主希望知道Query和Filter的区别 An ...
以bank account 数据为例，认识elasticsearch query 和 filter
Elasticsearch 查询语言(Query DSL)认识(一) 一.基本认识查询子句的行为取决于 query context filter context 也就是执行的是查询(query)还是 ...
elasticsearch中query和filter的区别
参考博客来自: https://mp.weixin.qq.com/s/tiiveCW3W-oDIgxvlwsmXA?utm_medium=hao.caibaojian.com&utm_sour ...
Elasticsearch 之 query与filter区别
转载: http://xiaorui.cc/category/elasticsearch/ http://blog.csdn.net/asia_kobe/article/details/5056301 ...
【转】elasticsearch的查询器query与过滤器filter的区别
很多刚学elasticsearch的人对于查询方面很是苦恼,说实话es的查询语法真心不简单- 当然你如果入门之后,会发现elasticsearch的rest api设计是多么有意思. 说正题,ela ...
Elasticsearch系列(二)--query、filter、aggregations
本文基于ES6.4版本,我也是出于学习阶段,对学习内容做个记录,如果文中有错误,请指出. 实验数据: index:book type:novel mappings: { "mappings& ...
Elasticsearch DSL中Query与Filter的不同
Elasticsearch支持很多查询方式,其中一种就是DSL,它是把请求写在JSON里面,然后进行相关的查询. 举个DSL例子 GET _search { "query": { ...
Query DSL for elasticsearch Query
Query DSL Query DSL (资料来自: http://www.elasticsearch.cn/guide/reference/query-dsl/) http://elasticsea ...

随机推荐

Leetcode207. Course Schedule课程表
现在你总共有 n 门课需要选,记为 0 到 n-1. 在选修某些课程之前需要一些先修课程. 例如,想要学习课程 0 ,你需要先完成课程 1 ,我们用一个匹配来表示他们: [0,1] 给定课程总量以及它 ...
Python学习笔记（六）——类和对象
1.self的用法全面理解self 2. 继承子类继承父类,自动拥有父类的全部方法 >>> class Animal: def run(self): print('Animal ...
php 引用文件
require_once :为了避免重复加载文件. 用意:加载文件一次. require_once() 语句在脚本执行期间包括并运行指定文件.此行为和require()语句类似,唯一区别是:如果该文件 ...
nginx的配置：目的是使用nginx反向代理后，应用程序获取用户真实ip
一.了解nginx Nginx是lgor Sysoev为俄罗斯访问量第二的rambler.ru站点设计开发的.从2004年发布至今,凭借开源的力量,已经接近成熟与完善. Nginx功能丰富,可作为HT ...
js--判断当前环境是否为iphonex环境
/** * 判断是否是iphonex */ function getIsIphonex () { var u = navigator.userAgent; var isIOS = !!u.match( ...
(1)python tkinter-窗体
1.导入自带的包名 import tkinter 2.创建一个窗体对象 form=Tkinter.Tk() 3.显示窗体(这句应该是所有的设置部署完最后执行的一句代码) form.mainloop() ...
http://www.2cto.com/ 红黑联盟
http://www.2cto.com/ 红黑联盟,一个不错的学习或者开阔眼界的网站,内部由中文书写.比较适合国人.
十条服务器端优化Web性能的技巧总结
原文地址:http://www.jb51.net/yunying/452723.html 提高 web 应用的性能从来没有比现在更重要过.网络经济的比重一直在增长:全球经济超过 5% 的价值是在因特网 ...
java中字符数组与字符串之间互相转换的方法
public static void main(String[] args) { //1.字符数组转换成字符串 //(1)直接在构造String时转换 char[] array = new cha ...
19.SimLogin_case05
# 使用自造的cookies登录马蜂窝 import requests from lxml import etree str = 'mfw_uuid=5bcfcc20-b235-fbbe-c1d6-a ...

elasticsearch query 和 filter 的区别

elasticsearch query 和 filter 的区别的更多相关文章

随机推荐

热门专题