011-elasticsearch5.4.3【四】-聚合操作【二】-桶聚合【bucket】过滤、嵌套、反转、分组、排序、范围

一、概述

　　bucketing（桶）聚合：划分不同的“桶”，将数据分配到不同的“桶”里。非常类似sql中的group语句的含义。

　　metric既可以作用在整个数据集上，也可以作为bucketing的子聚合作用在每一个“桶”中的数据集上。当然，我们可以把整个数据集合看做一个大“桶”，所有的数据都分配到这个大“桶”中。

1.1、Global聚合

AggregationBuilders

    .global("agg")

    .subAggregation(AggregationBuilders.terms("genders").field("gender"));

使用

import org.elasticsearch.search.aggregations.bucket.global.Global;

// sr is here your SearchResponse object

Global agg = sr.getAggregations().get("agg");

agg.getDocCount(); // Doc count

1.2、过滤聚合

AggregationBuilders

    .filter("agg", QueryBuilders.termQuery("gender", "male"));

使用

import org.elasticsearch.search.aggregations.bucket.filter.Filter;

// sr is here your SearchResponse object

Filter agg = sr.getAggregations().get("agg");

agg.getDocCount(); // Doc count

1.3、多过滤聚合【类似分组聚合,只是筛选出关注的】

AggregationBuilder aggregation =

    AggregationBuilders

        .filters("agg",

            new FiltersAggregator.KeyedFilter("men", QueryBuilders.termQuery("gender", "male")),

            new FiltersAggregator.KeyedFilter("women", QueryBuilders.termQuery("gender", "female")));

使用

import org.elasticsearch.search.aggregations.bucket.filters.Filters;

// sr is here your SearchResponse object

Filters agg = sr.getAggregations().get("agg");

// For each entry

for (Filters.Bucket entry : agg.getBuckets()) {

    String key = entry.getKeyAsString();            // bucket key

    long docCount = entry.getDocCount();            // Doc count

    logger.info("key [{}], doc_count [{}]", key, docCount);

}

结果

key [men], doc_count [4982]

key [women], doc_count [5018]

1.4、MIssing 聚合

AggregationBuilders.missing("agg").field("gender");

使用

import org.elasticsearch.search.aggregations.bucket.missing.Missing;

// sr is here your SearchResponse object

Missing agg = sr.getAggregations().get("agg");

agg.getDocCount(); // Doc count

1.5、嵌套

AggregationBuilders.nested("agg", "resellers");

使用

import org.elasticsearch.search.aggregations.bucket.nested.Nested;

// sr is here your SearchResponse object

Nested agg = sr.getAggregations().get("agg");

agg.getDocCount(); // Doc count

1.6、反转嵌套

AggregationBuilder aggregation =

    AggregationBuilders

        .nested("agg", "resellers")

        .subAggregation(

                AggregationBuilders

                        .terms("name").field("resellers.name")

                        .subAggregation(

                                AggregationBuilders

                                        .reverseNested("reseller_to_product")

                        )

        );

使用

import org.elasticsearch.search.aggregations.bucket.nested.Nested;

import org.elasticsearch.search.aggregations.bucket.nested.ReverseNested;

import org.elasticsearch.search.aggregations.bucket.terms.Terms;

// sr is here your SearchResponse object

Nested agg = sr.getAggregations().get("agg");

Terms name = agg.getAggregations().get("name");

for (Terms.Bucket bucket : name.getBuckets()) {

    ReverseNested resellerToProduct = bucket.getAggregations().get("reseller_to_product");

    resellerToProduct.getDocCount(); // Doc count

}

1.7、子聚合

AggregationBuilder aggregation = AggregationBuilders.children("agg", "reseller");

使用

import org.elasticsearch.search.aggregations.bucket.children.Children;

// sr is here your SearchResponse object

Children agg = sr.getAggregations().get("agg");

agg.getDocCount(); // Doc count

1.8、Terms 聚合【按某个字段分组】

AggregationBuilders.terms("genders").field("gender");

使用

import org.elasticsearch.search.aggregations.bucket.terms.Terms;

// sr is here your SearchResponse object

Terms genders = sr.getAggregations().get("genders");

// For each entry

for (Terms.Bucket entry : genders.getBuckets()) {

    entry.getKey();      // Term

    entry.getDocCount(); // Doc count

}

1.9、排序【Order】

通过doc_count以递增方式对存储桶进行排序：

AggregationBuilders

    .terms("genders")

    .field("gender")

    .order(Terms.Order.count(true))

按字母顺序按顺序升序方式排序存储桶：

AggregationBuilders

    .terms("genders")

    .field("gender")

    .order(Terms.Order.term(true))

通过单值度量子聚合（由聚合名称标识）对存储桶进行排序：

AggregationBuilders

    .terms("genders")

    .field("gender")

    .order(Terms.Order.aggregation("avg_height", false))

    .subAggregation(

        AggregationBuilders.avg("avg_height").field("height")

    )

1.10、范围聚合

AggregationBuilder aggregation =

        AggregationBuilders

                .range("agg")

                .field("height")

                .addUnboundedTo(1.0f)               // from -infinity to 1.0 (excluded)

                .addRange(1.0f, 1.5f)               // from 1.0 to 1.5 (excluded)

                .addUnboundedFrom(1.5f);            // from 1.5 to +infinity

使用

import org.elasticsearch.search.aggregations.bucket.range.Range;

// sr is here your SearchResponse object

Range agg = sr.getAggregations().get("agg");

// For each entry

for (Range.Bucket entry : agg.getBuckets()) {

    String key = entry.getKeyAsString();             // Range as key

    Number from = (Number) entry.getFrom();          // Bucket from

    Number to = (Number) entry.getTo();              // Bucket to

    long docCount = entry.getDocCount();    // Doc count

    logger.info("key [{}], from [{}], to [{}], doc_count [{}]", key, from, to, docCount);

}

结果

key [*-1.0], from [-Infinity], to [1.0], doc_count [9]

key [1.0-1.5], from [1.0], to [1.5], doc_count [21]

key [1.5-*], from [1.5], to [Infinity], doc_count [20]

1.11、日期范围聚合

AggregationBuilder aggregation =

        AggregationBuilders

                .dateRange("agg")

                .field("dateOfBirth")

                .format("yyyy")

                .addUnboundedTo("1950")    // from -infinity to 1950 (excluded)

                .addRange("1950", "1960")  // from 1950 to 1960 (excluded)

                .addUnboundedFrom("1960"); // from 1960 to +infinity

使用

import org.elasticsearch.search.aggregations.bucket.range.Range;

// sr is here your SearchResponse object

Range agg = sr.getAggregations().get("agg");

// For each entry

for (Range.Bucket entry : agg.getBuckets()) {

    String key = entry.getKeyAsString();                // Date range as key

    DateTime fromAsDate = (DateTime) entry.getFrom();   // Date bucket from as a Date

    DateTime toAsDate = (DateTime) entry.getTo();       // Date bucket to as a Date

    long docCount = entry.getDocCount();                // Doc count

    logger.info("key [{}], from [{}], to [{}], doc_count [{}]", key, fromAsDate, toAsDate, docCount);

}

结果

key [*-1950], from [null], to [1950-01-01T00:00:00.000Z], doc_count [8]

key [1950-1960], from [1950-01-01T00:00:00.000Z], to [1960-01-01T00:00:00.000Z], doc_count [5]

key [1960-*], from [1960-01-01T00:00:00.000Z], to [null], doc_count [37]

更多，如significantTerms、IP范围聚合、直方图聚合、日期直方图聚合、GEO距离聚合等地址

011-elasticsearch5.4.3【四】-聚合操作【二】-桶聚合【bucket】过滤、嵌套、反转、分组、排序、范围的更多相关文章

JDK1.8聚合操作
在java8 JDK包含许多聚合操作(如平均值,总和,最小,最大,和计数),返回一个计算流stream的聚合结果.这些聚合操作被称为聚合操作.JDK除返回单个值的聚合操作外,还有很多聚合操作返回一个c ...
Java自学-集合框架聚合操作
聚合操作步骤 1 : 聚合操作 JDK8之后,引入了对集合的聚合操作,可以非常容易的遍历,筛选,比较集合中的元素. 像这样: String name =heros .stream() .sorted ...
010-elasticsearch5.4.3【四】-聚合操作【一】-度量聚合【metrics】-min、max、sum、avg、count
一.概述度量类型聚合主要针对的number类型的数据,需要ES做比较多的计算工作参考向导:地址 import org.elasticsearch.search.aggregations.Aggre ...
基于 MongoDB 动态字段设计的探索 (二) 聚合操作
业务需求及设计见前文:基于 MongoDB 动态字段设计的探索根据专业计算各科平均分 (总分.最高分.最低分) public Object avg(String major){ Aggregatio ...
Elasticsearch学习(4) spring boot整合Elasticsearch的聚合操作
之前已将spring boot原生方式介绍了,接下将结介绍的是Elasticsearch聚合操作.聚合操作一般来说是解决一下复杂的业务,比如mysql中的求和和分组,由于博主踩的坑比较多,所以博客可能 ...
Linq聚合操作之Aggregate,Count,Sum,Distinct源码分析
Linq聚合操作之Aggregate,Count,Sum,Distinct源码分析一:Linq的聚合运算 1. 常见的聚合运算:Aggregate,Count, Sum, Distinct,Max, ...
MongoDB - 增删改查及聚合操作
目录 MongoDB - 增删改查及聚合操作一. 数据库操作(database) 1. 创建及查看库 2. 删除库二. 集合collectionc=操作(相当于SQL数据库中的表table) 1. ...
大数据项目2(Java8聚合操作)
前言:为很好的理解这些方法,你需要熟悉java8特性Lambda和方法引用的使用一:简介我们用集合的目的,往往不是简单的仅仅把数据保存哪里.而是要检索(遍历)或者去计算或统计....操作集合里面的 ...
数据分析入门——pandas之DataFrame多层/多级索引与聚合操作
一.行多层索引 1.隐式创建在构造函数中给index.colunms等多个数组实现(datafarme与series都可以) df的多级索引创建方法类似: 2.显式创建pd.MultiIndex 其 ...

随机推荐

SGU 521 North-East ( 二维LIS 线段树优化 )
521. "North-East" Time limit per test: 0.5 second(s)Memory limit: 262144 kilobytes input: ...
jmeter性能测试抛除工具用命令测试的方法
1.我们有时会遇到那种图片或文件大的传输数据,容易将jmeter测试工具卡死,这个时候就需要抛除测试工具,直接用命令进行测试(window和linux都适用) 2.首先在jmeter工具上把性能测试脚 ...
oracle PL/SQL编程基础知识
在oracle中使用pl/sql来扩展SQL的功能,使得SQL能够更加的灵活,功能更加强大,效率更高.pl/sql让sql也能执行判断,循环等操作.主要记录一下pl/sql的基本语法和基本条件判断语句 ...
简单的物流项目实战，WPF的MVVM设计模式(五)
开始界面 <Grid> <Grid.RowDefinitions> <RowDefinition/> <RowDefinition/> <RowD ...
Ubuntu下通过apache建立虚拟主机
一个搞前端交互的,总会遇到这样那样的,不需要写代码去解决的问题,怎么搞?答:只能去大海里捞,问题很明确但答案不一定靠谱,因为回答的人不用去考虑你是否会给自己系统搞崩溃. 那么我只能把自己经过验证的答案 ...
iOS特殊界面旋屏设置的方法之一
1.AppDelegate.h @property (assign, nonatomic) BOOL allowRotation; 2.AppDelegate.m #pragma mark - 自动旋 ...
十一、Boostrap-X-editable
一.官网 http://vitalets.github.io/x-editable/index.html 二.实践在jQuery中ajax配置项中的使用type与method的区别: type 和m ...
python基础操作---string
#coding:utf-8 var1 = 'Hello World!' print var1[::] print len(var1) print var1[0:len(var1)] print var ...
LNMP小项目搭建，Centos7.6环境搭建Linux+nginx+mysql+php，wordpress个人博客的搭建(完整搭建步骤)
一.LNMP搭建,基于nginx服务器搭建wordpress个人博客准备环境:centos7.6环境下web服务器(nginx+php):主机名:web01,ip:192.168.248.172my ...
MySQL高可用集群方案
一.Mysql高可用解决方案方案一:共享存储一般共享存储采用比较多的是 SAN/NAS 方案. 方案二:操作系统实时数据块复制这个方案的典型场景是 DRBD,DRBD架构(MySQL+DRBD+ ...