Elasticsearch聚合 Date Histogram聚合

转 http://www.cnblogs.com/xing901022/p/4951603.html

Elasticsearch的聚合主要分成两大类：metric和bucket,2.0中新增了pipeline还没有研究。本篇还是来介绍Bucket聚合中的常用聚合——date histogram.参考：官方文档

用法

Date histogram的用法与histogram差不多，只不过区间上支持了日期的表达式。

{

"aggs":{

    "articles_over_time":{

        "date_histogram":{

            "field":"date",

            "interval":"month"

            }

        }

    }

}

interval字段支持多种关键字：`year`, `quarter`, `month`, `week`, `day`, `hour`, `minute`, `second`

当然也支持对这些关键字进行扩展使用，比如一个半小时可以定义成如下：

{

    "aggs":{

        "articles_over_time":{

            "date_histogram":{

                "field":"date",

                "interval":"1.5h"

                }

            }

        }

}

返回的结果可以通过设置format进行格式化:

{

    "aggs":{

        "articles_over_time":{

            "date_histogram":{

                "field":"date",

                "interval":"1M",

                "format":"yyyy-MM-dd"

                }

            }

        }

    }

得到的结果如下：

{

    "aggregations":{

        "articles_over_time":{

            "buckets":[{

                "key_as_string":"2013-02-02",

                "key":1328140800000,

                "doc_count":1

            },{

                "key_as_string":"2013-03-02",

                "key":1330646400000,

                "doc_count":2

            },

            ...

            ]}

        }

}

其中key_as_string是格式化后的日期，key显示了是日期时间戳，

time_zone时区的用法

在es中日期支持时区的表示方法，这样就相当于东八区的时间。

{

    "aggs":{

        "by_day":{

            "date_histogram":{

                "field":"date",

                "interval":"day",

                "time_zone":"+08:00"

            }

        }

    }

}

offset 使用偏移值，改变时间区间

默认情况是从凌晨0点到午夜24:00，如果想改变时间区间，可以通过下面的方式，设置偏移值：

{"aggs":{

    "by_day":{

        "date_histogram":{

            "field":"date",

            "interval":"day",

            "offset":"+6h"

            }

        }

    }

}

那么桶的区间就改变为：

"aggregations":{

    "by_day":{

        "buckets":[{

            "key_as_string":"2015-09-30T06:00:00.000Z",

            "key":1443592800000,

            "doc_count":1

        },{

            "key_as_string":"2015-10-01T06:00:00.000Z",

            "key":1443679200000,

            "doc_count":1

        }]

    }

}

Missing Value缺省字段

当遇到没有值的字段，就会按照缺省字段missing value来计算：

{

    "aggs":{

        "publish_date":{

            "date_histogram":{

                "field":"publish_date",

                "interval":"year",

                "missing":"2000-01-01"

            }

        }

    }

}

其他

对于其他的一些用法，这里就不过多赘述了，比如脚本、Order、min_doc_count过滤，extended_bounds等都是支持的。

Elasticsearch聚合 Date Histogram聚合的更多相关文章

Elasticsearch聚合之 Date Histogram聚合
Elasticsearch的聚合主要分成两大类:metric和bucket,2.0中新增了pipeline还没有研究.本篇还是来介绍Bucket聚合中的常用聚合--date histogram.参考: ...
Elasticsearch聚合之 Histogram 直方图聚合
Elasticsearch支持最直方图聚合,它在数字字段自动创建桶,并会扫描全部文档,把文档放入相应的桶中.这个数字字段既可以是文档中的某个字段,也可以通过脚本创建得出的. 桶的筛选规则举个例子,有 ...
ElasticSearch 2 (37) - 信息聚合系列之内存与延时
ElasticSearch 2 (37) - 信息聚合系列之内存与延时摘要控制内存使用与延时版本 elasticsearch版本: elasticsearch-2.x 内容 Fielddata ...
elasticsearch系列六：聚合分析（聚合分析简介、指标聚合、桶聚合）
一.聚合分析简介 1. ES聚合分析是什么? 聚合分析是数据库中重要的功能特性,完成对一个查询的数据集中数据的聚合计算,如:找出某字段(或计算表达式的结果)的最大值.最小值,计算和.平均值等.ES作为 ...
Elasticsearch(9) --- 聚合查询(Bucket聚合)
Elasticsearch(9) --- 聚合查询(Bucket聚合) 上一篇讲了Elasticsearch聚合查询中的Metric聚合:Elasticsearch(8) --- 聚合查询(Metri ...
ElasticSearch 2 (34) - 信息聚合系列之多值排序
ElasticSearch 2 (34) - 信息聚合系列之多值排序摘要多值桶(terms.histogram 和 date_histogram)动态生成很多桶,Elasticsearch 是如何 ...
ElasticSearch 2 (31) - 信息聚合系列之时间处理
ElasticSearch 2 (31) - 信息聚合系列之时间处理摘要如果说搜索是 Elasticsearch 里最受欢迎的功能,那么按时间创建直方图一定排在第二位.为什么需要使用时间直方图? ...
ElasticSearch 2 (30) - 信息聚合系列之条形图
ElasticSearch 2 (30) - 信息聚合系列之条形图摘要版本 elasticsearch版本: elasticsearch-2.x 内容聚合还有一个令人激动的特性就是能够十分容易地 ...
Elasticsearch学习之深入聚合分析二---案例实战
以一个家电卖场中的电视销售数据为背景,来对各种品牌,各种颜色的电视的销量和销售额,进行各种各样角度的分析,首先建立电视销售的索引,然后添加几条销售记录 PUT /tvs { "mappin ...

随机推荐

研究生flag
是时候定个计划了,感觉日子一天天水,不加油学点东西,迟早要掉队…… 刷刷算法题库吧,貌似选几个管用的刷刷——https://hihocoder.com/problemset 争取明年三月份的PAT顶级 ...
ueditor+word粘贴上传
公司做的项目要用到文本上传功能. 网上找了很久,大部分都有一些不成熟的问题,终于让我找到了一个成熟的项目. 下面就来看看: 1.打开工程: 对于文档的上传我们需要知道这个项目是否符合我们的初衷. 运行 ...
笔记 Bioinformatics Algorithms Chapter7
一.Lloyd算法算法1 Lloyd Algorithm k_mean clustering * Centers to Clusters: After centers have been selec ...
hibernate之查询
Query对象方便的对数据库和持久化对象进行查询,两种表达方式:HQL和SQL; Query经常用来绑定查询参数,限制查询条数.并最终执行查询语句. HQL 查询一个简单类(查询所有) @Test ...
软工网络15团队作业4——Alpha阶段敏捷冲刺（一）
第 1 篇 Scrum 冲刺: 各个成员在 Alpha 阶段认领的任务成员任务预期任务量/小时曾艺佳学习模块:单词及其释义单词发音例句学习添加笔记 ...
Leetcod--20. Valid Parentheses(极简洁的括号匹配)
Given a string containing just the characters '(', ')', '{', '}', '[' and ']', determine if the inpu ...
noip第16课作业
1. 猴子吃桃 [问题描述] 猴子第一天摘了若干个桃子,当即吃了一半,还不解馋,又多吃了一个:第二天,吃剩下的桃子的一半,还不过瘾,又多吃了一个:以后每天都吃前一天剩下的一半多一个,到第10天想再吃时 ...
elasticsearch5环境搭建
1.下载ElasticSearch https://www.elastic.co/cn/downloads/elasticsearch#ga-release 因为是windows版本,所以下载zip即 ...
编写高质量iOS与OS X代码的52个有效方法
第一章重点: 第一条:OC的起源 OC由smalltalk语言演化而来的语言为消息结构(messaging structure)语言,其运行时所因执行的的代码由运行环境来决定:函数调用(functio ...
input和raw_input
Python2.X使用raw_input() Python3.X废弃了raw_input()函数,使用input()函数替代它 code: data=input("please input ...