ElasticSearch 聚合函数

一、简单聚合

桶：简单来说就是满足特定条件的文档的集合。

指标：大多数指标是简单的数学运算（例如最小值、平均值、最大值，还有汇总），这些是通过文档的值来计算。

桶能让我们划分文档到有意义的集合，但是最终我们需要的是对这些桶内的文档进行一些指标的计算。分桶是一种达到目的的手段：它提供了一种给文档分组的方法来让我们可以计算感兴趣的指标。在实践中，指标能让你计算像平均薪资、最高出售价格、95%的查询延迟这样的数据。

例如，桶和指标可以类似映射成SQL查询语句

SELECT COUNT(color)   //相当于桶

FROM table

GROUP BY color       //相当于指标

桶在概念上类似于 SQL 的分组（GROUP BY），而指标则类似于 COUNT() 、 SUM() 、 MAX() 等统计方法。

 curl -XGET 'http://192.9.8.222:9200/wymlib/ym_literature/_search?pretty=true' -d '

 {

   "size": 0,

   "aggregations": {

     "popular_author": {

       "terms": {

         "field": "author"

       }

     }

   }

 }'

结果显示： 
1 {

   "took" : 2803,

   "timed_out" : false,

   "_shards" : {

     "total" : 5,

     "successful" : 5,

     "failed" : 0

   },

   "hits" : {

     "total" : 25,

     "max_score" : 0.0,

     "hits" : [ ]

   },

   "aggregations" : {     //1

     "popular_author" : { //2

       "doc_count_error_upper_bound" : 0,

       "sum_other_doc_count" : 0,

       "buckets" : [ {    //3

         "key" : "王阳明",

         "doc_count" : 4

       }, {

         "key" : "阳明",

         "doc_count" : 4

       }, {

         "key" : "胡",

         "doc_count" : 2

       }, {

         "key" : "大大",

         "doc_count" : 1

       }, {

         "key" : "建",

         "doc_count" : 1

       }, {

         "key" : "徐",

         "doc_count" : 1

       }, {

         "key" : "杰",

         "doc_count" : 1

       }, {

         "key" : "闯",

         "doc_count" : 1

       } ]

     }

   }

 }

//1 聚合操作被置于顶层参数 aggs 之下（如果你愿意，完整形式 aggregations 同样有效）。

//2 然后，可以为聚合指定一个我们想要名称，本例中是： popular_colors 。

//3 最后，定义单个桶的类型 terms(这里出现的是buckets) 。

注意：可能会注意到我们将 size 设置成 0 。我们并不关心搜索结果的具体内容，所以将返回记录数设置为 0 来提高查询速度。设置 size: 0 与 Elasticsearch 1.x 中使用 count 搜索类型等价。

二、基于metric的聚合

因为不是特别了解，我暂且将它理解为基于指标的聚合，后面如果发现不对，再来改正。

 curl -XGET 'http://192.9.8.222:9200/test_es_order_index/test_es_order_type/_search?pretty=true' -d '

 {

   "aggregations": {

     "sum_age": {

       "sum": {

         "field": "age"

       }

     }

   }

 }'

结果：（age 一个是29 一个是21求和后是50）

 "aggregations" : {

     "sum_age" : {

       "value" : 50.0

     }

   }

stats统计：

 curl -XGET 'http://192.9.8.222:9200/test_es_order_index/test_es_order_type/_search?pretty=true' -d '

 {

   "size":0,

   "aggregations": {

     "stats_age": {

       "stats": {

         "field": "age"

       }

     }

   }

 }'

结果（请求后会直接显示多种聚合结果）：

 {

   "took" : 2,

   "timed_out" : false,

   "_shards" : {

     "total" : 5,

     "successful" : 5,

     "failed" : 0

   },

   "hits" : {

     "total" : 7,

     "max_score" : 0.0,

     "hits" : [ ]

   },

   "aggregations" : {

     "stats_age" : {

       "count" : 2,

       "min" : 21.0,

       "max" : 29.0,

       "avg" : 25.0,

       "sum" : 50.0

     }

   }

 }

【Reference】

【1】 http://www.cnblogs.com/xing901022/p/4947436.html

【2】 https://www.elastic.co/guide/cn/elasticsearch/guide/current/_aggregation_test_drive.html

【3】 http://www.cnblogs.com/xing901022/p/4944043.html

ElasticSearch 聚合函数的更多相关文章

elasticsearch聚合函数
计算每个tag下的商品数量 GET /ecommerce/product/_search { "aggs": { //聚合 "group_by_tags": ...
elasticsearch 聚合函数 max double精度损失bug
测试样例数据{ "size" : 0, "query" : { "bool" : { "must" : { " ...
Elasticsearch聚合——aggregation
聚合提供了分组并统计数据的能力.理解聚合的最简单的方式是将其粗略地等同为SQL的GROUP BY和SQL聚合函数.在Elasticsearch中,你可以在一个响应中同时返回命中的数据和聚合结果.你可以 ...
ElasticSearch聚合（转）
ES之五:ElasticSearch聚合前言说完了ES的索引与检索,接着再介绍一个ES高级功能API – 聚合(Aggregations),聚合功能为ES注入了统计分析的血统,使用户在面对大数据提 ...
Elasticsearch聚合语句
聚合的范围是search query过滤出的数据四种聚合类型: 一.Bucketing 桶聚合,常规的分类然后计算每个分类的文档数量二.Metric 分类并对一组文档进行sum.avg等数学运算 ...
es的查询、排序查询、分页查询、布尔查询、查询结果过滤、高亮查询、聚合函数、python操作es
今日内容概要 es的查询 Elasticsearch之排序查询 Elasticsearch之分页查询 Elasticsearch之布尔查询 Elasticsearch之查询结果过滤 Elasticse ...
可以这样去理解group by和聚合函数
写在前面的话:用了好久group by,今天早上一觉醒来,突然感觉group by好陌生,总有个筋别不过来,为什么不能够select * from Table group by id,为什么一定不能是 ...
TSQL 聚合函数忽略NULL值
max,min,sum,avg聚合函数会忽略null值,但不代表聚合函数不返回null值,如果表为空表,或聚合列都是null,则返回null.count 聚合函数忽略null值,如果聚合列都是null ...
SQL Server 聚合函数算法优化技巧
Sql server聚合函数在实际工作中应对各种需求使用的还是很广泛的,对于聚合函数的优化自然也就成为了一个重点,一个程序优化的好不好直接决定了这个程序的声明周期.Sql server聚合函数对一组值 ...

随机推荐

php解析mpp文件中的资源
获取层级的project任务参考启动javabridge java -jar JavaBridge.jar SERVLET_LOCAL: 1.读取mpp文件 $file_path = " ...
BarTender表单的人性化设计—分组框
BarTender 2016已经支持用户输入信息.从相同位置查询数据库和筛选数据记录,那就是数据输入表单了.这个功能相信迎合了很多用户的需求,主要作用体现在打印时数据输入. 对于表单的设计,不同的客户 ...
BarTender连接不上数据库怎么办
由于各种原因,在使用BarTender连接到数据库时,有可能会出现无法连接的问题,下面下编就针对两种BarTender无法连接到数据库的问题,来教大家解决的方法. 第一种 BarTender无权打开文 ...
DB索引、索引覆盖、索引优化
###########索引########### @see http://mp.weixin.qq.com/s/4W4iVOZHdMglk0F_Ikao7A 聚集索引(clustered inde ...
yii中缓存（cache）详解
缓存是用于提升网站性能的一种即简单又有效的途径.通过存储相对静态的数据至缓存以备所需,我们可以省去生成这些数据的时间.在 Yii 中使用缓存主要包括配置和访问缓存组件 . 内部方法一.缓存配置: 1 ...
线程同步 – lock和Monitor
在多线程代码中,多个线程可能会访问一些公共的资源(变量.方法逻辑等等),这些公共资源称为临界区(共享区):临界区的资源是不安全,所以需要通过线程同步对多个访问临界区的线程进行控制. 同样,有些时候我们 ...
iOS - 解决Unable to add a source with url `https://github.com/CocoaPods/Specs.git` named
1 本来cocopods没有问题,最近创建项目,利用cocopods导入第三方库的时候,出现如下错误: [!] Unable to add a source with url `https://gi ...
【Cesium】flyTo
// 1. Fly to a position with a top-down view viewer.camera.flyTo({ destination : Cesium.Cartesian3.f ...
U3D 使用VS编程组件
http://visualstudiogallery.msdn.microsoft.com/6e536faa-ce73-494a-a746-6a14753015f1 http://visualstud ...
OpenCV——轮廓面积及长度计算
计算轮廓面积: double contourArea(InputArray contour, bool oriented=false ) InputArray contour:输入的点,一般是图像的轮 ...

ElasticSearch 聚合函数

ElasticSearch 聚合函数的更多相关文章

随机推荐

热门专题