Elasticsearch聚合 Date Histogram聚合

转 http://www.cnblogs.com/xing901022/p/4951603.html

Elasticsearch的聚合主要分成两大类：metric和bucket,2.0中新增了pipeline还没有研究。本篇还是来介绍Bucket聚合中的常用聚合——date histogram.参考：官方文档

用法

Date histogram的用法与histogram差不多，只不过区间上支持了日期的表达式。

{

"aggs":{

    "articles_over_time":{

        "date_histogram":{

            "field":"date",

            "interval":"month"

            }

        }

    }

}

interval字段支持多种关键字：`year`, `quarter`, `month`, `week`, `day`, `hour`, `minute`, `second`

当然也支持对这些关键字进行扩展使用，比如一个半小时可以定义成如下：

{

    "aggs":{

        "articles_over_time":{

            "date_histogram":{

                "field":"date",

                "interval":"1.5h"

                }

            }

        }

}

返回的结果可以通过设置format进行格式化:

{

    "aggs":{

        "articles_over_time":{

            "date_histogram":{

                "field":"date",

                "interval":"1M",

                "format":"yyyy-MM-dd"

                }

            }

        }

    }

得到的结果如下：

{

    "aggregations":{

        "articles_over_time":{

            "buckets":[{

                "key_as_string":"2013-02-02",

                "key":1328140800000,

                "doc_count":1

            },{

                "key_as_string":"2013-03-02",

                "key":1330646400000,

                "doc_count":2

            },

            ...

            ]}

        }

}

其中key_as_string是格式化后的日期，key显示了是日期时间戳，

time_zone时区的用法

在es中日期支持时区的表示方法，这样就相当于东八区的时间。

{

    "aggs":{

        "by_day":{

            "date_histogram":{

                "field":"date",

                "interval":"day",

                "time_zone":"+08:00"

            }

        }

    }

}

offset 使用偏移值，改变时间区间

默认情况是从凌晨0点到午夜24:00，如果想改变时间区间，可以通过下面的方式，设置偏移值：

{"aggs":{

    "by_day":{

        "date_histogram":{

            "field":"date",

            "interval":"day",

            "offset":"+6h"

            }

        }

    }

}

那么桶的区间就改变为：

"aggregations":{

    "by_day":{

        "buckets":[{

            "key_as_string":"2015-09-30T06:00:00.000Z",

            "key":1443592800000,

            "doc_count":1

        },{

            "key_as_string":"2015-10-01T06:00:00.000Z",

            "key":1443679200000,

            "doc_count":1

        }]

    }

}

Missing Value缺省字段

当遇到没有值的字段，就会按照缺省字段missing value来计算：

{

    "aggs":{

        "publish_date":{

            "date_histogram":{

                "field":"publish_date",

                "interval":"year",

                "missing":"2000-01-01"

            }

        }

    }

}

其他

对于其他的一些用法，这里就不过多赘述了，比如脚本、Order、min_doc_count过滤，extended_bounds等都是支持的。

Elasticsearch聚合 Date Histogram聚合的更多相关文章

Elasticsearch聚合之 Date Histogram聚合
Elasticsearch的聚合主要分成两大类:metric和bucket,2.0中新增了pipeline还没有研究.本篇还是来介绍Bucket聚合中的常用聚合--date histogram.参考: ...
Elasticsearch聚合之 Histogram 直方图聚合
Elasticsearch支持最直方图聚合,它在数字字段自动创建桶,并会扫描全部文档,把文档放入相应的桶中.这个数字字段既可以是文档中的某个字段,也可以通过脚本创建得出的. 桶的筛选规则举个例子,有 ...
ElasticSearch 2 (37) - 信息聚合系列之内存与延时
ElasticSearch 2 (37) - 信息聚合系列之内存与延时摘要控制内存使用与延时版本 elasticsearch版本: elasticsearch-2.x 内容 Fielddata ...
elasticsearch系列六：聚合分析（聚合分析简介、指标聚合、桶聚合）
一.聚合分析简介 1. ES聚合分析是什么? 聚合分析是数据库中重要的功能特性,完成对一个查询的数据集中数据的聚合计算,如:找出某字段(或计算表达式的结果)的最大值.最小值,计算和.平均值等.ES作为 ...
Elasticsearch(9) --- 聚合查询(Bucket聚合)
Elasticsearch(9) --- 聚合查询(Bucket聚合) 上一篇讲了Elasticsearch聚合查询中的Metric聚合:Elasticsearch(8) --- 聚合查询(Metri ...
ElasticSearch 2 (34) - 信息聚合系列之多值排序
ElasticSearch 2 (34) - 信息聚合系列之多值排序摘要多值桶(terms.histogram 和 date_histogram)动态生成很多桶,Elasticsearch 是如何 ...
ElasticSearch 2 (31) - 信息聚合系列之时间处理
ElasticSearch 2 (31) - 信息聚合系列之时间处理摘要如果说搜索是 Elasticsearch 里最受欢迎的功能,那么按时间创建直方图一定排在第二位.为什么需要使用时间直方图? ...
ElasticSearch 2 (30) - 信息聚合系列之条形图
ElasticSearch 2 (30) - 信息聚合系列之条形图摘要版本 elasticsearch版本: elasticsearch-2.x 内容聚合还有一个令人激动的特性就是能够十分容易地 ...
Elasticsearch学习之深入聚合分析二---案例实战
以一个家电卖场中的电视销售数据为背景,来对各种品牌,各种颜色的电视的销量和销售额,进行各种各样角度的分析,首先建立电视销售的索引,然后添加几条销售记录 PUT /tvs { "mappin ...

随机推荐

以太坊虚拟机（EVM）
转载链接:https://ethfans.org/posts/solidity-chapter1-introduciton-to-smart-contracts 概括总览: 以太坊虚拟机(EVM)是以 ...
python基本数据类型之字符串（一）
python中字符串中有很多方法,具体方法如下图所示: 分割方法字符串的分割方法: 1.join方法: join方法是字符串方法中最重要的方法之一,它的作用是将某一字符插入到字符串中用作连接. 具体 ...
mysql主从复制Error1205
主从架构.今天发现从库SQL线程报错,主从复制停止了.查看错误发现: Last_SQL_Errno: 1205 Last_SQL_Error: Slave SQL thread ...
Linux 禁ping和开启ping操作
方法一: # echo 1 > /proc/sys/net/ipv4/icmp_echo_ignore_all 如果要恢复,只要: # echo 0 > /proc/sys/net ...
Properties类、序列化流与反序列化流、打印流、commons-IO
Properties类特点: 1.Hashtable的子类,map集合中的方法都可以用: 2.该集合没有泛型,键值都是字符串: 3.是一个可以持久化的属性集,键值可以存到集合中,也可存到持久化的设备 ...
20155326刘美岑2016-2017-2《Java程序设计》第三周学习总结
20155326刘美岑2016-2017-2<Java程序设计>第三周学习总结教材学习内容总结基本类型和类类型基本类型:第三章中讲述的那几种,short.long.int.byte. ...
数字签名、数字证书的原理以及证书的获得java版
数字签名原理简介(附数字证书) 首先要了解什么叫对称加密和非对称加密,消息摘要这些知识. 1. 非对称加密在通信双方,如果使用非对称加密,一般遵从这样的原则:公钥加密,私钥解密.同时,一般一个密钥加 ...
nginx 访问频率控制
Nginx访问频率控制 HTTP服务器的吞吐率(单位时间吞吐量)通常有一个上限,尤其是普通配置的机器,在带宽够的情况下,用压测工具经常能把服务器压出翔,为了线上环境稳定性,防止恶意攻击影响到其他用户, ...
源自KPI交谈的思考
说明白一件事情不容易前言跟领导谈及下半年KPI的时候,问我什么打算/计划,在交谈过程中,有几个有意思的点问题 Q: 目标是hold住服务端,那么怎么样才算hold住服务端? Q: 如何推动别人去 ...
工作随笔——获取当前Java程序PID
小知识,记录下: JVM:1.8 // spring boot 中可以使用 String pid = ManagementFactory.getRuntimeMXBean().getSystemPro ...