MongoDB的分组统计 group

　　mongodb中的分组聚合用$group，而且处理的最大数据量为100M如果超出需要写入到磁盘，使用格式如下：

{ $group: { _id: <expression>, <field1>: { <accumulator1> : <expression1> }, ... } }

　　其中_id属性是必须要有的，目的是用来指定分组的字段或依据，field1为自定义字段，accumulator为累加器，下面以统计每天用户注册数为列

db.user.aggregate([

    {

        $group:{

            _id:{

                year:{$year:{$add:["$time",28800000]}},//time为注册时间 $year表示获取年份，用add是因为mongodb存的是UTC时间需要增加8个小时

                month:{$month:{$add:["$time",28800000]}},//$month获取月份

                day:{$dayOfMonth:{$add:["$time",28800000]}}//$dayOfMonth获取多少号

            }

            count:{$sum:1}//$sum为累计，1表示累加数

        }

    }

])

　　如果只想注册地区为四川的则在$goup前增加一个$match：

{

    $match:{

         location:"SiChuan"

    }

},

　　以上两个聚合操作的java实现方式：

DBObject filterCond = new BasicDBObject();

filterCond.put("location", "SiChuan");

DBObject match = new BasicDBObject("$match", filterCond);

BasicDBList dateList = new BasicDBList();
dateList.add("$time");
dateList.add(28800000);//解决timezone 8小时时差
DBObject time = new BasicDBObject("$add", dateList);

DBObject group = new BasicDBObject(); 
DBObject groupDate = new BasicDBObject(); 
groupDate.put("year", new BasicDBObject("$year", time)); 
groupDate.put("month", new BasicDBObject("$month", time)); 
groupDate.put("day", new BasicDBObject("$dayOfMonth", time)); 
group.put("$group", new BasicDBObject("_id", groupDate));

AggregationOutput output = coll.aggregate(match, group); 
Iterator iterator = output.results().iterator();

　　更多的聚合操作请参见这》》》http://docs.mongodb.org/manual/reference/operator/aggregation-pipeline/

MongoDB的分组统计 group的更多相关文章

mongodb mapredReduce 多个条件分组（group by）
from:https://my.oschina.net/chiyong/blog/289138 Mongodb 没有传统数据库的group函数,如果分组需要走MapReduce.这种MR与Hadoop ...
Java对MongoDB进行分组操作并统计各个分组的数量
最近在检索MongoDB的数据时需要用到分组操作,由于没有现成的说明文档可参考,只能是在代码中不断调试.摸索前进:目前已现实了Java对MongoDB的分组操作,并统计各个分组的数量.现通过示例详细解 ...
sql group by hour 按小时分组统计
Time字段以小时分组统计 select datepart(hour,time) hour,count(1) count from table where Similarity<75 group ...
Shell学习笔记：awk实现group by分组统计功能
日常部分数据以 txt 的文件格式提供,为避免入库之后再进行统计的麻烦,故学习 shell 进行处理,减少工作量. 1.样例数据 # test.txt YD5Gxxx|6618151|68254490 ...
MongoDB 的分组操作 In C#
C#对mongodb的分组查询操作,主要通过脚本或Aggregate方法来实现,以下通过一些实例作解析: 参考资料:http://www.tuicool.com/articles/2iqUZj h ...
Linq to SQL 语法查询(链接查询，子查询 & in操作 & join，分组统计等)
Linq to SQL 语法查询(链接查询,子查询 & in操作 & join,分组统计等) 子查询描述:查询订单数超过5的顾客信息查询句法: var 子查询 = from c i ...
DataTable、List使用groupby进行分组和分组统计；List、DataTable查询筛选方法
DataTable分组统计: .用两层循环计算,前提条件是数据已经按分组的列排好序的. DataTable dt = new DataTable(); dt.Columns.AddRange(new ...
每日学习心得：CustomValidator验证控件验证用户输入的字符长度、Linq 多字段分组统计、ASP.NET后台弹出confirm对话框，然后点击确定，执行一段代码
2013-9-15 1. CustomValidator验证控件验证用户输入的字符长度在实际的开发中通常会遇到验证用户输入的字符长度的问题,通常的情况下,可以写一个js的脚本或者函数,在ASP ...
ORACLE的分组统计之ROLLUP(一)
Oracle 9i以后,扩展了group by 的功能,能够满足大部分多维数据的分析统计功能,主要表现: 1. rollup,cube,grouping sets 扩展group by字句提供了丰富的 ...

随机推荐

recent.css常用的页面初始化样式
<style> @charset "utf-8"; body,div,dl,dt,dd,ul,ol,li,h1,h2,h3,h4,h5,h6,pre,code,form ...
TCP/IP协议原理与应用笔记27：网际协议（IP）之选项（Options）
1. 选项(Options) (1)作用:网络测试或者调试,可选 (2)格式:0~40 bytes 2. 选项类型:
免费公测：RDS只读实例
免费公测:RDS只读实例简要介绍在对数据库有少量写请求,但有大量的读请求的应用场景下,单个实例可能无法抵抗读取压力, 甚至对主流程业务产生影响.为了实现读取能力的弹性扩展,分担数据库压力,阿里 ...
【Python Lib】解析HTML利器 BeautifulSoup
- - 官方API文档,中文版 http://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html - 以后会把常用的摘录出来
如何将你自己的Python package发布到PyPI上
零.前言最近做了一个小工具,查询IP或者域名的归属地.做完之后想发布到PyPI上,这样大家就可以通过pip来安装了. 在发布的过程中遇到了一些问题,也学到了很多东西.记录到这篇文章中.希望对大家有所 ...
linux_过程问题记录
常见问题1:-bash: rz: command not found 解决: 安装lrzsz: 解决命令:yum -y install lrzsz 常见问题2:linux 解压乱码解决11.到htt ...
第五节关于SpringMVC中Ajax的配置和应用[下午]
成熟,不是学会表达,而是学会咽下,当你一点一点学会克制住很多东西,才能驾驭好人生. 还有一周,祥云19就算结算了,一个半月的相处希望,胖先生算一个合格的老师小白,小蔡,2婷婷,小猴,小恒,小崔,小龙 ...
IO输入输出
编写TextRw.java的Java应用程序,程序完成的功能是:首先向TextRw.txt中写入自己的学号和姓名,读取TextRw.txt中信息并将其显示在屏幕上. package com.hanqi ...
SharePoint 2010 配置基于MemberShip的身份验证
场景:通常需要为sharepoint打通其他的系统整合到sharepoint认证,ad通常是为内部域用户,外网访问的可以使用membership来登录,那么这个既可以内部用户访问,外部用户也可以访问 ...
linux /etc/sysctl.conf 禁止别人ping自己
vi /etc/sysctl.conf如果希望屏蔽别人 ping 你的主机,则加入以下代码:# Disable ping requestsnet.ipv4.icmp_echo_ignore_all = ...

MongoDB的分组统计 group

MongoDB的分组统计 group的更多相关文章

随机推荐

热门专题