011-elasticsearch5.4.3【四】-聚合操作【二】-桶聚合【bucket】过滤、嵌套、反转、分组、排序、范围

一、概述

　　bucketing（桶）聚合：划分不同的“桶”，将数据分配到不同的“桶”里。非常类似sql中的group语句的含义。

　　metric既可以作用在整个数据集上，也可以作为bucketing的子聚合作用在每一个“桶”中的数据集上。当然，我们可以把整个数据集合看做一个大“桶”，所有的数据都分配到这个大“桶”中。

1.1、Global聚合

AggregationBuilders

    .global("agg")

    .subAggregation(AggregationBuilders.terms("genders").field("gender"));

使用

import org.elasticsearch.search.aggregations.bucket.global.Global;

// sr is here your SearchResponse object

Global agg = sr.getAggregations().get("agg");

agg.getDocCount(); // Doc count

1.2、过滤聚合

AggregationBuilders

    .filter("agg", QueryBuilders.termQuery("gender", "male"));

使用

import org.elasticsearch.search.aggregations.bucket.filter.Filter;

// sr is here your SearchResponse object

Filter agg = sr.getAggregations().get("agg");

agg.getDocCount(); // Doc count

1.3、多过滤聚合【类似分组聚合,只是筛选出关注的】

AggregationBuilder aggregation =

    AggregationBuilders

        .filters("agg",

            new FiltersAggregator.KeyedFilter("men", QueryBuilders.termQuery("gender", "male")),

            new FiltersAggregator.KeyedFilter("women", QueryBuilders.termQuery("gender", "female")));

使用

import org.elasticsearch.search.aggregations.bucket.filters.Filters;

// sr is here your SearchResponse object

Filters agg = sr.getAggregations().get("agg");

// For each entry

for (Filters.Bucket entry : agg.getBuckets()) {

    String key = entry.getKeyAsString();            // bucket key

    long docCount = entry.getDocCount();            // Doc count

    logger.info("key [{}], doc_count [{}]", key, docCount);

}

结果

key [men], doc_count [4982]

key [women], doc_count [5018]

1.4、MIssing 聚合

AggregationBuilders.missing("agg").field("gender");

使用

import org.elasticsearch.search.aggregations.bucket.missing.Missing;

// sr is here your SearchResponse object

Missing agg = sr.getAggregations().get("agg");

agg.getDocCount(); // Doc count

1.5、嵌套

AggregationBuilders.nested("agg", "resellers");

使用

import org.elasticsearch.search.aggregations.bucket.nested.Nested;

// sr is here your SearchResponse object

Nested agg = sr.getAggregations().get("agg");

agg.getDocCount(); // Doc count

1.6、反转嵌套

AggregationBuilder aggregation =

    AggregationBuilders

        .nested("agg", "resellers")

        .subAggregation(

                AggregationBuilders

                        .terms("name").field("resellers.name")

                        .subAggregation(

                                AggregationBuilders

                                        .reverseNested("reseller_to_product")

                        )

        );

使用

import org.elasticsearch.search.aggregations.bucket.nested.Nested;

import org.elasticsearch.search.aggregations.bucket.nested.ReverseNested;

import org.elasticsearch.search.aggregations.bucket.terms.Terms;

// sr is here your SearchResponse object

Nested agg = sr.getAggregations().get("agg");

Terms name = agg.getAggregations().get("name");

for (Terms.Bucket bucket : name.getBuckets()) {

    ReverseNested resellerToProduct = bucket.getAggregations().get("reseller_to_product");

    resellerToProduct.getDocCount(); // Doc count

}

1.7、子聚合

AggregationBuilder aggregation = AggregationBuilders.children("agg", "reseller");

使用

import org.elasticsearch.search.aggregations.bucket.children.Children;

// sr is here your SearchResponse object

Children agg = sr.getAggregations().get("agg");

agg.getDocCount(); // Doc count

1.8、Terms 聚合【按某个字段分组】

AggregationBuilders.terms("genders").field("gender");

使用

import org.elasticsearch.search.aggregations.bucket.terms.Terms;

// sr is here your SearchResponse object

Terms genders = sr.getAggregations().get("genders");

// For each entry

for (Terms.Bucket entry : genders.getBuckets()) {

    entry.getKey();      // Term

    entry.getDocCount(); // Doc count

}

1.9、排序【Order】

通过doc_count以递增方式对存储桶进行排序：

AggregationBuilders

    .terms("genders")

    .field("gender")

    .order(Terms.Order.count(true))

按字母顺序按顺序升序方式排序存储桶：

AggregationBuilders

    .terms("genders")

    .field("gender")

    .order(Terms.Order.term(true))

通过单值度量子聚合（由聚合名称标识）对存储桶进行排序：

AggregationBuilders

    .terms("genders")

    .field("gender")

    .order(Terms.Order.aggregation("avg_height", false))

    .subAggregation(

        AggregationBuilders.avg("avg_height").field("height")

    )

1.10、范围聚合

AggregationBuilder aggregation =

        AggregationBuilders

                .range("agg")

                .field("height")

                .addUnboundedTo(1.0f)               // from -infinity to 1.0 (excluded)

                .addRange(1.0f, 1.5f)               // from 1.0 to 1.5 (excluded)

                .addUnboundedFrom(1.5f);            // from 1.5 to +infinity

使用

import org.elasticsearch.search.aggregations.bucket.range.Range;

// sr is here your SearchResponse object

Range agg = sr.getAggregations().get("agg");

// For each entry

for (Range.Bucket entry : agg.getBuckets()) {

    String key = entry.getKeyAsString();             // Range as key

    Number from = (Number) entry.getFrom();          // Bucket from

    Number to = (Number) entry.getTo();              // Bucket to

    long docCount = entry.getDocCount();    // Doc count

    logger.info("key [{}], from [{}], to [{}], doc_count [{}]", key, from, to, docCount);

}

结果

key [*-1.0], from [-Infinity], to [1.0], doc_count [9]

key [1.0-1.5], from [1.0], to [1.5], doc_count [21]

key [1.5-*], from [1.5], to [Infinity], doc_count [20]

1.11、日期范围聚合

AggregationBuilder aggregation =

        AggregationBuilders

                .dateRange("agg")

                .field("dateOfBirth")

                .format("yyyy")

                .addUnboundedTo("1950")    // from -infinity to 1950 (excluded)

                .addRange("1950", "1960")  // from 1950 to 1960 (excluded)

                .addUnboundedFrom("1960"); // from 1960 to +infinity

使用

import org.elasticsearch.search.aggregations.bucket.range.Range;

// sr is here your SearchResponse object

Range agg = sr.getAggregations().get("agg");

// For each entry

for (Range.Bucket entry : agg.getBuckets()) {

    String key = entry.getKeyAsString();                // Date range as key

    DateTime fromAsDate = (DateTime) entry.getFrom();   // Date bucket from as a Date

    DateTime toAsDate = (DateTime) entry.getTo();       // Date bucket to as a Date

    long docCount = entry.getDocCount();                // Doc count

    logger.info("key [{}], from [{}], to [{}], doc_count [{}]", key, fromAsDate, toAsDate, docCount);

}

结果

key [*-1950], from [null], to [1950-01-01T00:00:00.000Z], doc_count [8]

key [1950-1960], from [1950-01-01T00:00:00.000Z], to [1960-01-01T00:00:00.000Z], doc_count [5]

key [1960-*], from [1960-01-01T00:00:00.000Z], to [null], doc_count [37]

更多，如significantTerms、IP范围聚合、直方图聚合、日期直方图聚合、GEO距离聚合等地址

011-elasticsearch5.4.3【四】-聚合操作【二】-桶聚合【bucket】过滤、嵌套、反转、分组、排序、范围的更多相关文章

JDK1.8聚合操作
在java8 JDK包含许多聚合操作(如平均值,总和,最小,最大,和计数),返回一个计算流stream的聚合结果.这些聚合操作被称为聚合操作.JDK除返回单个值的聚合操作外,还有很多聚合操作返回一个c ...
Java自学-集合框架聚合操作
聚合操作步骤 1 : 聚合操作 JDK8之后,引入了对集合的聚合操作,可以非常容易的遍历,筛选,比较集合中的元素. 像这样: String name =heros .stream() .sorted ...
010-elasticsearch5.4.3【四】-聚合操作【一】-度量聚合【metrics】-min、max、sum、avg、count
一.概述度量类型聚合主要针对的number类型的数据,需要ES做比较多的计算工作参考向导:地址 import org.elasticsearch.search.aggregations.Aggre ...
基于 MongoDB 动态字段设计的探索 (二) 聚合操作
业务需求及设计见前文:基于 MongoDB 动态字段设计的探索根据专业计算各科平均分 (总分.最高分.最低分) public Object avg(String major){ Aggregatio ...
Elasticsearch学习(4) spring boot整合Elasticsearch的聚合操作
之前已将spring boot原生方式介绍了,接下将结介绍的是Elasticsearch聚合操作.聚合操作一般来说是解决一下复杂的业务,比如mysql中的求和和分组,由于博主踩的坑比较多,所以博客可能 ...
Linq聚合操作之Aggregate,Count,Sum,Distinct源码分析
Linq聚合操作之Aggregate,Count,Sum,Distinct源码分析一:Linq的聚合运算 1. 常见的聚合运算:Aggregate,Count, Sum, Distinct,Max, ...
MongoDB - 增删改查及聚合操作
目录 MongoDB - 增删改查及聚合操作一. 数据库操作(database) 1. 创建及查看库 2. 删除库二. 集合collectionc=操作(相当于SQL数据库中的表table) 1. ...
大数据项目2(Java8聚合操作)
前言:为很好的理解这些方法,你需要熟悉java8特性Lambda和方法引用的使用一:简介我们用集合的目的,往往不是简单的仅仅把数据保存哪里.而是要检索(遍历)或者去计算或统计....操作集合里面的 ...
数据分析入门——pandas之DataFrame多层/多级索引与聚合操作
一.行多层索引 1.隐式创建在构造函数中给index.colunms等多个数组实现(datafarme与series都可以) df的多级索引创建方法类似: 2.显式创建pd.MultiIndex 其 ...

随机推荐

nginx运行出现 file not found 错误处理原因
在阿里云装nginx+php+mysql nginx运行出现 file not found 错误处理原因 1,第一情况 location ~ \.php$ { # root html; fastcgi ...
算法（C#版）动态规划和贪心算法
https://blog.csdn.net/kouzhuanjing1849/article/details/88954811
HTTPS和HTTP的区别，http协议的特征
http协议传输的数据都是没有经过加密的,也就是明文,所以http用于传输数据并不安全.而https是是使用了ssl(secure socket layer)协议+http协议构成的可加密传输,身份认 ...
毛玻璃效果 css
毛玻璃效果 <style> .container{ width: 287px; height: 285px; background-image: url(img/background.pn ...
CSS行内框（内联元素）
行内框在一行中水平布置.可以使用水平内边距.边框和外边距调整它们的间距.但是,垂直内边距.边框和外边距不影响行内框的高度.由一行形成的水平框称为行框(Line Box),行框的高度总是足以容纳它包含的 ...
python基础知识之数据类型
一.与用户的交互古时候,我们去银行取钱,需要有一个银行业务员等着我们把自己的账号密码输入给他, 然后他去进行验证,成功后,我们再将取款金额输入/告诉他骄傲的现代人,会为客户提供一台ATM机(就是一 ...
如何利用scrapy新建爬虫项目
抓取豆瓣top250电影数据,并将数据保存为csv.json和存储到monogo数据库中,目标站点:https://movie.douban.com/top250 一.新建项目打开cmd命令窗口,输 ...
Codeforces Round #573 (Div. 2) D. Tokitsukaze, CSL and Stone Game （博弈，思维）
D. Tokitsukaze, CSL and Stone Game time limit per test1 second memory limit per test256 megabytes in ...
Django【第18篇】：Django之缓存
Django 之缓存一.缓存由于Django是动态网站,所有每次请求均会去数据进行相应的操作,当程序访问量大时,耗时必然会更加明显,最简单解决方式是使用:缓存,缓存将一个某个views的返回值保存 ...
去掉html中的标签
//去掉html中的图片 String regEx_image = "(<img.*src\\s*=\\s*(.*?)[^>]*?>)"; Pattern p_s ...