Elasticsearch聚合—

聚合提供了分组并统计数据的能力。理解聚合的最简单的方式是将其粗略地等同为SQL的GROUP BY和SQL聚合函数。在Elasticsearch中，你可以在一个响应中同时返回命中的数据和聚合结果。你可以使用简单的API同时运行查询和多个聚合，并以一次返回，这避免了来回的网络通信，这是非常强大和高效的。

作为开始的一个例子，我们按照state分组，按照州名的计数倒序排序：

curl -XPOST 'localhost:9200/bank/_search?pretty' -d '

        {

          "size": 0,

          "aggs": {

            "group_by_state": {

              "terms": {

                "field": "state"

              }

            }

          }

        }'

在SQL中，上面的聚合在概念上类似于：

SELECT COUNT(*) from bank GROUP BY state ORDER BY COUNT(*) DESC

响应（其中一部分）是：

"hits" : {

            "total" : 1000,

            "max_score" : 0.0,

            "hits" : [ ]

          },

          "aggregations" : {

            "group_by_state" : {

              "buckets" : [ {

                "key" : "al",

                "doc_count" : 21

              }, {

                "key" : "tx",

                "doc_count" : 17

              }, {

                "key" : "id",

                "doc_count" : 15

              }, {

                "key" : "ma",

                "doc_count" : 15

              }, {

                "key" : "md",

                "doc_count" : 15

              }, {

                "key" : "pa",

                "doc_count" : 15

              }, {

                "key" : "dc",

                "doc_count" : 14

              }, {

                "key" : "me",

                "doc_count" : 14

              }, {

                "key" : "mo",

                "doc_count" : 14

              }, {

                "key" : "nd",

                "doc_count" : 14

              } ]

            }

          }

        }

我们可以看到AL（abama）有21个账户，TX有17个账户，ID（daho）有15个账户，依此类推。

注意我们将size设置成0，这样我们就可以只看到聚合结果了，而不会显示命中的结果。

在先前聚合的基础上，现在这个例子计算了每个州的账户的平均余额（还是按照账户数量倒序排序的前10个州）：

curl -XPOST 'localhost:9200/bank/_search?pretty' -d '

        {

          "size": 0,

          "aggs": {

            "group_by_state": {

              "terms": {

                "field": "state"

              },

              "aggs": {

                "average_balance": {

                  "avg": {

                    "field": "balance"

                  }

                }

              }

            }

          }

        }'

注意，我们把average_balance聚合嵌套在了group_by_state聚合之中。这是所有聚合的一个常用模式。你可以任意的聚合之中嵌套聚合，这样你就可以从你的数据中抽取出想要的概述。

基于前面的聚合，现在让我们按照平均余额进行排序：

curl -XPOST 'localhost:9200/bank/_search?pretty' -d '

        {

          "size": 0,

          "aggs": {

            "group_by_state": {

              "terms": {

                "field": "state",

                "order": {

                  "average_balance": "desc"

                }

              },

              "aggs": {

                "average_balance": {

                  "avg": {

                    "field": "balance"

                  }

                }

              }

            }

          }

        }'

下面的例子显示了如何使用年龄段（20-29，30-39，40-49）分组，然后在用性别分组，然后为每一个年龄段的每一个性别计算平均账户余额：

curl -XPOST 'localhost:9200/bank/_search?pretty' -d '

        {

          "size": 0,

          "aggs": {

            "group_by_age": {

              "range": {

                "field": "age",

                "ranges": [

                  {

                    "from": 20,

                    "to": 30

                  },

                  {

                    "from": 30,

                    "to": 40

                  },

                  {

                    "from": 40,

                    "to": 50

                  }

                ]

              },

              "aggs": {

                "group_by_gender": {

                  "terms": {

                    "field": "gender"

                  },

                  "aggs": {

                    "average_balance": {

                      "avg": {

                        "field": "balance"

                      }

                    }

                  }

                }

              }

            }

          }

        }'

Elasticsearch聚合——aggregation的更多相关文章

ElasticSearch聚合（转）
ES之五:ElasticSearch聚合前言说完了ES的索引与检索,接着再介绍一个ES高级功能API – 聚合(Aggregations),聚合功能为ES注入了统计分析的血统,使用户在面对大数据提 ...
Elasticsearch：aggregation介绍
聚合(aggregation)功能集是整个Elasticsearch产品中最令人兴奋和有益的功能之一,主要是因为它提供了一个非常有吸引力对之前的facets的替代. 在本教程中,我们将解释Elasti ...
ElasticSearch聚合分析
聚合用于分析查询结果集的统计指标,我们以观看日志分析为例,介绍各种常用的ElasticSearch聚合操作. 目录: 查询用户观看视频数和观看时长聚合分页器查询视频uv 单个视频uv 批量查询视频 ...
UML的关联(Association), 聚合(Aggregation), 组合(Composition)区别
转载:http://blog.csdn.net/ocean181/article/details/6117369 UML的关联(Association), 聚合(Aggregation), 组合(Co ...
Elasticsearch聚合问题
在测试Elasticsearch聚合的时候报了一个错误.具体如下: GET /megacorp/employee/_search { "aggs": { "all_int ...
ElasticSearch Cardinality Aggregation聚合计算的误差
使用ES不久,今天发现生产环境数据异常,其使用的ES版本是2.1.2,其它版本也类似.通过使用ES的HTTP API进行查询,发现得到的数据跟javaClient API 查询得到的数据不一致,于是对 ...
ElasticSearch聚合
前言说完了ES的索引与检索,接着再介绍一个ES高级功能API – 聚合(Aggregations),聚合功能为ES注入了统计分析的血统,使用户在面对大数据提取统计指标时变得游刃有余.同样的工作,你在 ...
ElasticSearch 聚合查询百分比
这里用的是es5.6.9 bucket_script :它执行一个脚本,该脚本可以对多桶聚合中的指定度量执行每桶计算,指定的度量标准必须为数字,并且脚本必须返回数值. 官方语法 https://www ...
ElasticSearch6.0 高级应用之多字段聚合Aggregation（二）
ElasticSearch6.0 多字段聚合网上完整的资料很少 ,所以作者经过查阅资料,编写了聚合高级使用例子例子是根据电商搜索实际场景模拟出来的希望给大家带来帮助! 下面我们开始吧! 1. 创建 ...

随机推荐

this和static关键字
this和static关键字一.关键字this this表示对象自身的引用 this的作用 1.用来区别当前类对象的成员与参数成员 2.用来调用其它构造方法构造方法: 1.每个类默认情况都有一个默 ...
.Net开发小技巧
.NET项目开发中的小技巧 1.不要频繁的创建对象...这个损失是巨大的...new太多了,后果比较严重. 2.打开数据库后要及时的关闭连接,如果你不能做到一个open后跟一个close,那也没关系, ...
C# 可空引用类型
可空引用类型是C#8.0计划新增的一个功能,不过已经发布了预览版本,今天我们来体验一下可空引用类型. 安装您必须下载Visual Studio 2017 15.5预览版(目前最新发布版本是15.4) ...
python的Windows下的安装
1.先打开网址http://www.python.org/download/: 2.在下载列表中选择Window平台安装包, 找到最后 web-based installer 是需要通过联网完成安装的 ...
asp.net web api 文件上传
1正确的做法 public class AvaterController : BaseApiController { [HttpPost] public async Task<IHttpActi ...
mybatis中sql语句的批量插入
 <insert id="insertReceiveemail"> <!-- 生成一条U ...
React+Redux实现追书神器网页版
引言由于现在做的react-native项目没有使用到redux等框架,写了一段时间想深入学习react,有个想法想做个demo练手下,那时候其实还没想好要做哪一个类型的,也看了些动漫的,小说阅读, ...
CSS实现盒子高度撑开且以最高的为高
前端开发中,常常会有需求两个盒子并排排列,高度以最高的为准,且高度是内容撑开的,类似于这样如果不是用 table 布局,而是用 div 布局,两个子盒子浮动来实现的话,实际上默认写出来是这样的此时 ...
IBM的websphere MQ的c#使用
1.关于websphere MQ的常用名词(针对Websphere MQ7.5版本) 队列管理器:为应用程序提供消息传递服务的程序.使用消息队列接口(MQI)的应用程序可以将消息放置到队列并可从队列中 ...
深入浅出多线程——ReentrantLock (一)
ReentrantLock是一个排它重入锁,与synchronized关键字语意类似,但比其功能更为强大.该类位于java.util.concurrent.locks包下,是Lock接口的实现类.基本 ...

Elasticsearch聚合——aggregation

Elasticsearch聚合——aggregation的更多相关文章

随机推荐

热门专题