Elasticsearch 之 query与filter区别

转载:

http://xiaorui.cc/category/elasticsearch/

http://blog.csdn.net/asia_kobe/article/details/50563016

参考官方文档说明如下：https://www.elastic.co/guide/en/elasticsearch/guide/current/_queries_and_filters.html#_performance_differences
主要意思是：
fiter是精确查询，对待的文档检索的结果是是/否；query对应文档检索是对文档相关性评分。
表现（性能Performance）区别：filter返回是和条件匹配的一个简单的列表这是很快可以计算得到的并且也很容易在内存中做缓存；query不仅要找到匹配的文档，而且还要计算每个文档的相关性（评分），这就很明显比filter花费更多的计算。
想看下官方文档的翻译：

Query查询器与 Filter 过滤器

尽管我们之前已经涉及了查询DSL，然而实际上存在两种DSL：查询DSL（query DSL）和过滤DSL（filter DSL）。

过滤器（filter）通常用于过滤文档的范围，比如某个字段是否属于某个类型，或者是属于哪个时间区间

创建日期是否在2014-2015年间？
status字段是否为success？
lat_lon字段是否在某个坐标的10公里范围内？

查询器（query）的使用方法像极了filter，但query更倾向于更准确的查找。

与full text search的匹配度最高
正则匹配
包含run单词，如果包含这些单词：runs、running、jog、sprint，也被视为包含run单词
包含quick、brown、fox。这些词越接近，这份文档的相关性就越高

查询器会计算出每份文档对于某次查询有多相关（relevant），然后分配文档一个相关性分数：_score。而这个分数会被用来对匹配了的文档进行相关性排序。相关性概念十分适合全文搜索（full-text search），这个很难能给出完整、“正确”答案的领域。

query filter在性能上对比：filter是不计算相关性的，同时可以cache。因此，filter速度要快于query。

query与filter区别如下：

1. query是要相关性评分的，filter不要；

2. query结果无法缓存，filter可以。

所以，选择参考：

1. 全文搜索、评分排序，使用query；

2. 是非过滤，精确匹配，使用filter。

过滤器（filter）通常用于过滤文档的范围，比如某个字段是否属于某个类型，或者是属于哪个时间区间。

参考博客:http://xiaorui.cc/2015/11/09/elasticsearch的查询器query与过滤器filter的区别/

下面是使用query语句查询的结果,第一次查询用了300ms,第二次用了280ms.

#blog:  http://xiaorui.cc

{

    "size": 1,

    "query": {

        "bool": {

            "must": [

                {

                    "terms": {

                        "keyword": [

                            "手机",

                            "iphone"

                        ]

                    }

                },

                {

                    "range": {

                        "cdate": {

                            "gt": "2015-11-09T11:00:00"

                        }

                    }

                }

            ]

        }

    }

}

{

    "took": 51,

    "timed_out": false,

    "_shards": {

        "total": 30,

        "successful": 30,

        "failed": 0

    },

    "hits": {

        "total": 6818,

        "max_score": 0,

        "hits": []

    }

}

下面是使用filter查询出来的结果,第一次查询时间是280ms,第二次130ms…. 速度确实快了不少，也证明filter走了cache缓存。但是如果我们对比下命中的数目，query要比filter要多一点，换句话说，更加的精准。

#blog: xiaorui.cc

{

    "size": 0,

    "filter": {

        "bool": {

            "must": [

                {

                    "terms": {

                        "keyword": [

                            "手机",

                            "iphone"

                        ]

                    }

                },

                {

                    "range": {

                        "cdate": {

                            "gt": "2015-11-09T11:00:00"

                        }

                    }

                }

            ]

        }

    }

}

{

    "took": 145,

    "timed_out": false,

    "_shards": {

        "total": 30,

        "successful": 30,

        "failed": 0

    },

    "hits": {

        "total": 6804,

        "max_score": 0,

        "hits": []

    }

}

如果你想同时使用query和filter查询的话，需要使用 {query:{filtered：{}}} 来包含这两个查询语法。他们的好处是，借助于filter的速度可以快速过滤出文档，然后再由query根据条件来匹配。

    "query": {

        "filtered": {

            "query":  { "match": { "email": "business opportunity" }},

            "filter": { "term": { "folder": "inbox" }}

        }

    }

}

{   "size":0,

    "query": {

        "filtered": {

            "query": {

                "bool": {

                    "should": [],

                    "must_not": [

                    ],

                    "must": [

                        {

                         "term": {

                                "channel_name":"微信自媒体微信"

                            }

                        }

                    ]

                }

            }

        }，

        "filter":{

            "range": {

                "idate": {

                    "gte": "2015-09-01T00:00:00",

                    "lte": "2015-09-10T00:00:00"

                    }

                }

        }

    }

}

我们这业务上关于elasticsearch的查询语法基本都是用query filtered方式进行的，我也推荐大家直接用这样的方法。should ，must_not, must 都是列表，列表里面可以写多个条件。这里再啰嗦一句，如果你的查询是范围和类型比较粗大的，用filter ！如果是那种精准的，就用query来查询。

{

   ”bool”:{

     ”should”:[],   #相当于OR条件

     ”must_not”:[],  #必须匹配的条件，这里的条件都会被反义

     ”must”:[]        #必须要有的

  }

}

Elasticsearch 之 query与filter区别的更多相关文章

elasticsearch中query和filter的区别
参考博客来自: https://mp.weixin.qq.com/s/tiiveCW3W-oDIgxvlwsmXA?utm_medium=hao.caibaojian.com&utm_sour ...
elasticsearch query 和 filter 的区别
Query查询器与 Filter 过滤器尽管我们之前已经涉及了查询DSL,然而实际上存在两种DSL:查询DSL(query DSL)和过滤DSL(filter DSL).过滤器(filter)通常 ...
ElasticSearch的 Query DSL 和 Filter DSL
Elasticsearch支持很多查询方式,其中一种就是DSL,它是把请求写在JSON里面,然后进行相关的查询. Query DSL 与 Filter DSL DSL查询语言中存在两种:查询DSL(q ...
ElasticSearch - query vs filter
query vs filter 来自stackoverflow Stackoverflow - queries-vs-filters Question 题主希望知道Query和Filter的区别 An ...
Elasticsearch(5) --- Query查询和Filter查询
Elasticsearch(5) --- Query查询和Filter查询这篇博客主要分为 :Query查询和Filter查询.有关复合查询.聚合查询也会单独写篇博客. 一.概念 1.概念一个查询 ...
Elasticsearch系列(二)--query、filter、aggregations
本文基于ES6.4版本,我也是出于学习阶段,对学习内容做个记录,如果文中有错误,请指出. 实验数据: index:book type:novel mappings: { "mappings& ...
以bank account 数据为例，认识elasticsearch query 和 filter
Elasticsearch 查询语言(Query DSL)认识(一) 一.基本认识查询子句的行为取决于 query context filter context 也就是执行的是查询(query)还是 ...
Elasticsearch DSL中Query与Filter的不同
Elasticsearch支持很多查询方式,其中一种就是DSL,它是把请求写在JSON里面,然后进行相关的查询. 举个DSL例子 GET _search { "query": { ...
ES的Query、Filter、Metric、Bucketing使用详解
由于笔者在实际项目仅仅将ES用作索引数据库,并没有深入研究过ES的搜索功能.而且鉴于笔者的搜索引擎知识有限,本文将仅仅介绍ES简单(非全文)的查询API. 笔者原本打算在本文中介绍聚合API的内容,但 ...

随机推荐

NOI退役啦
没进前一百签的上交一本高三加油喽
AB序列凹函数的性质
链接:https://www.nowcoder.com/acm/contest/113/B来源:牛客网题目描述给长度为n的序列A,长度为m的序列B.可以给A序列里每个元素加上x且B序列里每个元素减 ...
shell面试经典70例
转载自:http://www.imooc.com/article/1131 1) 如何向脚本传递参数 ? ./script argument 例子: 显示文件名称脚本 ./show.sh file1. ...
汕头市队赛 SRM 09 B 撕书
B 撕书II-3 SRM 09 背景&&描述琉璃手头有一黑一白两本魔法书,一本是<缟玛瑙的不在证明>,另一本是<白色相簿1.5> 传说同时打开这两本书 ...
CodeVS1611_APIO2009_抢掠计划_C++
题目:http://codevs.cn/problem/1611/ 关于题解请戳这里:http://www.cnblogs.com/hadilo/p/5892765.html 下面给一个可以A的代码, ...
GPS经纬度的表示方法及换算
想要认识GPS中的经纬度,就必须先了解GPS,知道经纬度的来源: 1. GPS系统组成 GPS是 Gloabal Positioning System 的简称,意为全球定位系统,主要由地面的控制站.天 ...
List<?>和List<Class<?>>区别及泛型相关
?表示是任意类型,但是编译器不能确定他是什么类型,所以你add的时候什么参数也不能传给它Class<?>表示任意类型的Class对象,list里面可以添加任何类型的Class对象,其它的对 ...
python的ORM框架SQLAlchemy
本节内容 ORM介绍 sqlalchemy安装 sqlalchemy基本使用多外键关联多对多关系表结构设计作业一.ORM介绍如果写程序用pymysql和程序交互,那是不是要写原生sql语句 ...
AC日记——Count on a tree II spoj
Count on a tree II 思路: 树上莫队: 先分块,然后,就好办了: 来,上代码: #include <cmath> #include <cstdio> #inc ...
HDU 3466 Proud Merchants【贪心 + 01背包】
Recently, iSea went to an ancient country. For such a long time, it was the most wealthy and powerfu ...

Elasticsearch 之 query与filter区别

Elasticsearch 之 query与filter区别的更多相关文章

随机推荐

热门专题