ElasticSearch 分组查询的几个例子
facets接口可以根据query返回统计数据,其中的 terms_stats 是分组统计,根据key的情况返回value的统计数据,类似group by的意思。
"terms_stats" : { "key_field" : "", "value_field" : "" }
例子:查询每个ip的请求执行时间
查询语句:
1: {
2: "size": 0,
3: "facets": {
4: "ips_stats": {
5: "terms_stats": {
6: "key_field": "nginx_log.@fields.ip",
7: "value_field": "nginx_log.@fields.request_time",
8: "size": 5
9: }
10: }
11: }
12: }
说明:
- 第2行的 size 表示 hits 命中的返回0条;
- 第3行的facets,第5行的terms_stats 是做分组查询的必要关键字。
- 第4行的 ips_stats 是对这个分组查询的命名,可以自己随便起。
- 第6行 key_field 表示对 nginx_log.@fields.ip 字段进行分组。
- 第7行 value_field 表示 对 nginx_log.@fields.request_time 的值进行分组后的运算。
- 第8行的 size 表示分组运算,最多返回多少行。
这个例子的查询结果如下,这里简单起见,只返回了2条。:
1: {
2: "took": 35641,
3: "timed_out": false,
4: "_shards": {
5: "total": 5,
6: "successful": 5,
7: "failed": 0
8: },
9: "hits": {
10: "total": 193109307,
11: "max_score": 1,
12: "hits": []
13: },
14: "facets": {
15: "ips_stats": {
16: "_type": "terms_stats",
17: "missing": 0,
18: "terms": [
19: {
20: "term": "180.149.157.110",
21: "count": 1871112,
22: "total_count": 1871112,
23: "min": 0.016,
24: "max": 80.306,
25: "total": 545853.1529999943,
26: "mean": 0.2917266058899704
27: },
28: {
29: "term": "59.49.225.22",
30: "count": 515179,
31: "total_count": 515179,
32: "min": 0,
33: "max": 600.004,
34: "total": 27793.9160000002,
35: "mean": 0.053950017372602924
36: }
37: ]
38: }
39: }
40: }
从结果我们可以看到,我们对 每个ip的执行时间计算了 个数、最大最小值,平均值,合计的计算。
相关技术参考:http://stackoverflow.com/questions/16549001/elasticsearch-order-responses-and-then-facet/16568770
例子:按照每个ip的请求数排序
查询JSON
1: {
2: "size": 0,
3: "facets": {
4: "time_stats": {
5: "terms_stats": {
6: "key_field": "nginx_log.@fields.ip",
7: "value_field": "nginx_log.@fields.request_time",
8: "size": 2,
9: "order": "total"
10: }
11: }
12: }
13: }
只比上述查询多了一个 order 属性.输出结果格式跟上面一样,只不过是排好序的,就不罗列了.
例子:查询整个网站的执行时间
查询json:
1: {
2: "query": {
3: "match_all": {}
4: },
5: "size": 0,
6: "facets": {
7: "stat1": {
8: "statistical": {
9: "field": "nginx_log.@fields.request_time"
10: }
11: }
12: }
13: }
说明:
- 最初的查询条件我们没有写,意味着取全部,如果你想查询指定范围,可以在这里书写。第2-4行。第5行的size表示查询条件显示的数据条数。
- statistical 是对一个数字字段做统计的facet。
结果:
1: {
2: "took": 4824,
3: "timed_out": false,
4: "_shards": {
5: "total": 5,
6: "successful": 5,
7: "failed": 0
8: },
9: "hits": {
10: "total": 193109307,
11: "max_score": 1,
12: "hits": []
13: },
14: "facets": {
15: "stat1": {
16: "_type": "statistical",
17: "count": 142590544,
18: "total": 59320216.00531181,
19: "min": 0,
20: "max": 5347.085,
21: "mean": 0.4160178812790826,
22: "sum_of_squares": 14578358539.95768,
23: "variance": 102.06623708075713,
24: "std_deviation": 10.102783630304923
25: }
26: }
27: }
这个方法的更多参考:
ElasticSearch 分组查询的几个例子的更多相关文章
- ElasticSearch 分组查询
curl -XPOST 'localhost:9200/bank/_search?pretty' -d ' { "size": 0, "aggs": { &qu ...
- ElasticSearch DSL 查询
公号:码农充电站pro 主页:https://codeshellme.github.io DSL(Domain Specific Language)查询也叫做 Request Body 查询,它比 U ...
- 08章 分组查询、子查询、原生SQL
一.分组查询 使用group by关键字对数据分组,使用having关键字对分组数据设定约束条件,从而完成对数据分组和统计 1.1 聚合函数:常被用来实现数据统计功能 ① count() 统计记录条数 ...
- SQL分组查询group by
注意:select 后的字段,必须要么包含在group by中,要么包含在having 后的聚合函数里. 1. GROUP BY 是分组查询, 一般 GROUP BY 是和聚合函数配合使用 group ...
- SQL group by分组查询(转)
本文导读:在实际SQL应用中,经常需要进行分组聚合,即将查询对象按一定条件分组,然后对每一个组进行聚合分析.创建分组是通过GROUP BY子句实现的.与WHERE子句不同,GROUP BY子句用于归纳 ...
- mongodb使用mongoose分组查询
一个分组查询的例子: model.aggregate([{$match: ops}, {$unwind: '$details'}, {$sort: {create_at: -1}}, { $group ...
- SQL分组查询GroupBy
一.分组查询1.使用group by进行分组查询在使用group by关键字时,在select列表中可以指定的项目是有限制的,select语句中仅许以下几项:〉被分组的列〉为每个分组返回一个值得表达式 ...
- Oracle和MySQL分组查询GROUP BY
Oracle和MySQL分组查询GROUP BY 真题1.Oracle和MySQL中的分组(GROUP BY)有什么区别? 答案:Oracle对于GROUP BY是严格的,所有要SELECT出来的字段 ...
- Oracle_group by分组查询_深入
Oracle_group by分组查询_深入 本文导读:在实际SQL应用中,经常需要进行分组聚合,即将查询对象按一定条件分组,然后对每一个组进行聚合分析. 创建分 ...
随机推荐
- Windows Server 2016-Hyper-V 2016新增功能
本文解释了Windows Server 2016和Microsoft Hyper-V Server 2016上Hyper-V的新增功能和变更功能. 与Connected Standby兼容(新) 在使 ...
- 简述KVM架构和Xen架构
暑假最后一篇更新,因为,,,明天我就回学校了. 以下均为个人理解,如果有不对的地方还望各位dalao不吝赐教. 虚拟化 虚拟化是通过Hypervisor程序实现的,Hypervisor的作用是将硬件虚 ...
- Docker: docker image常用命令实战
#docker列出镜像[root@192 ~]# docker imagesREPOSITORY TAG IMAGE ID CREATED SIZEnginx latest 881bd08c0b08 ...
- 文件下载中使用inputStream流获取文件大小
inputStream.available()获取的是文件的字节大小 InputStream inputStream = new FileInputStream(new File(path)); re ...
- C语言 排序算法总结
#include<stdio.h> #include<stdlib.h> //作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ # ...
- #000 Python 入门第一题通过扩展,学到了更多的知识
#1写在前面的话 我觉得这样学习或许能够在学习的过程中事半功倍 第一道简单的python编写代码输出10行带标号的“Hello,world.”,具体效果参阅输入输出示例 1:Hello,world. ...
- 微信小程序跳转微信小程序新增配置项目 navigateToMiniProgramAppIdList
每个小程序可跳转的其他小程序数量限制为不超过 10 个 从 2.4.0 版本以及指定日期(具体待定)开始,开发者提交新版小程序代码时,如使用了跳转其他小程序功能,则需要在代码配置中声明将要跳转的小程序 ...
- 【Teradata】数值类型
1.Decimal(n,m) 十进位小数 n为最大数值位数(取值1-38),m为小数位数(取值0-n). decimal(3,2) -9.99 to 9.99 decimal(4,4) - ...
- 前端性能优化成神之路-HTTP压缩开启gzip
什么是HTTP压缩 HTTP压缩是指: Web服务器和浏览器之间压缩传输的”文本内容“的方法. HTTP采用通用的压缩算法,比如gzip来压缩HTML,Javascript, CSS文件. 能大大减少 ...
- DBCA静默方式建库
使用DBCA的图形方式建库实在有诸多不便,但是使用静默方式建库就比较方便了,一个命令即可搞定. 使用dbca安装oracle数据库实例也有差不多两种方法:一种就是根据模板文件进行安装,在上文中提到了在 ...