MongoDB 聚合

MongoDB中聚合(aggregate)主要用于处理数据(诸如统计平均值,求和等)，并返回计算后的数据结果。有点类似sql语句中的 count(*)。

基本语法为：db.collection.aggregate( [ <stage1>, <stage2>, ... ] )

现在在mycol集合中有以下数据：

{ "_id" : 1, "name" : "tom", "sex" : "男", "score" : 100, "age" : 34 }
{ "_id" : 2, "name" : "jeke", "sex" : "男", "score" : 90, "age" : 24 }
{ "_id" : 3, "name" : "kite", "sex" : "女", "score" : 40, "age" : 36 }
{ "_id" : 4, "name" : "herry", "sex" : "男", "score" : 90, "age" : 56 }
{ "_id" : 5, "name" : "marry", "sex" : "女", "score" : 70, "age" : 18 }
{ "_id" : 6, "name" : "john", "sex" : "男", "score" : 100, "age" : 31 }

1、$sum 计算总和。

　　Sql: select sex,count(*) from mycol group by sex

　　MongoDb: db.mycol.aggregate([{group: {_id: 'group: {_id: 'sex', personCount: {$sum: 1}}}])

　　Sql: select sex,sum(score) totalScore from mycol group by sex

　　MongoDb: db.mycol.aggregate([{group: {_id: 'group: {_id: 'sex', totalScore: {sum:′score'}}}])

2、$avg 计算平均值

　　Sql: select sex,avg(score) avgScore from mycol group by sex

　　Mongodb: db.mycol.aggregate([{group: {_id: 'group: {_id: 'sex', avgScore: {avg:′score'}}}])

3、$max 获取集合中所有文档对应值得最大值。

　　Sql: select sex,max(score) maxScore from mycol group by sex

　　Mongodb: db.mycol.aggregate([{group: {_id: 'group: {_id: 'sex', maxScore : {max:′score'}}}])

4、$min 获取集合中所有文档对应值得最小值。

　　Sql: select sex,min(score) minScore from mycol group by sex

　　Mongodb: db.mycol.aggregate([{group: {_id: 'group: {_id: 'sex', minScore : {min:′score'}}}])

5、$push 把文档中某一列对应的所有数据插入值到一个数组中。

　　Mongodb: db.mycol.aggregate([{group: {_id: 'group: {_id: 'sex', scores : {push:′score'}}}])

6、$addToSet 把文档中某一列对应的所有数据插入值到一个数组中,去掉重复的

　　db.mycol.aggregate([{group: {_id: 'group: {_id: 'sex', scores : {addToSet:′score'}}}])

7、 $first 根据资源文档的排序获取第一个文档数据。

　　 db.mycol.aggregate([{group: {_id: 'group: {_id: 'sex', firstPerson : {first:′name'}}}])

8、 $last 根据资源文档的排序获取最后一个文档数据。

　　 db.mycol.aggregate([{group: {_id: 'group: {_id: 'sex', lastPerson : {last:′name'}}}])

9、全部统计 null

　　db.mycol.aggregate([{group:{_id:null,totalScore:{group:{_id:null,totalScore:{push:'$score'}}}])

例子

　　现在在t2集合中有以下数据：

　　{ "country" : "china", "province" : "sh", "userid" : "a" }
　　{ "country" : "china", "province" : "sh", "userid" : "b" }
　　{ "country" : "china", "province" : "sh", "userid" : "a" }
　　{ "country" : "china", "province" : "sh", "userid" : "c" }
　　{ "country" : "china", "province" : "bj", "userid" : "da" }
　　{ "country" : "china", "province" : "bj", "userid" : "fa" }

　　需求是统计出每个country/province下的userid的数量（同一个userid只统计一次）

　　过程如下。

　　首先试着这样来统计：

　　db.t2.aggregate([ { group: {"_id": { "country" : "group: {"_id": { "country" : "country", "prov": "province"} , "number":{province"} , "number":{sum:1}} } ])

　　结果是错误的：

　　原因是，这样来统计不能区分userid相同的情况（上面的数据中sh有两个 userid = a)

　　为了解决这个问题，首先执行一个group，其id 是 country, province, userid三个field：

　　db.t2.aggregate([ { group: {"_id": { "country" : "group: {"_id": { "country" : "country", "province": "province","uid":"province","uid":"userid" } } } ])

　　可以看出，这步的目的是把相同的userid只剩下一个。

　　然后第二步，再第一步的结果之上再执行统计：

　　db.t2.aggregate([
　　{ group: {"_id": { "country" : "group: {"_id": { "country" : "country", "province": "province","uid":"province","uid":"userid" } } } ,
　　{ group: {"_id": { "country" : "group: {"_id": { "country" : "_id.country", "province": "_id.province" }, count : {_id.province" }, count : {sum : 1 } } }
　　])

　　这回就对了

　　加入一个$project操作符，把_id去掉

　　db.t2.aggregate([ { group: {"_id": { "country" : "group: {"_id": { "country" : "country", "province": "province","uid":"province","uid":"userid" } } } ,
　　{ group: {"_id": { "country" : "group: {"_id": { "country" : "_id.country", "province": "_id.province" }, count: {_id.province" }, count: {sum : 1 } } },
　　{ project : {"_id": 0, "country" : "project : {"_id": 0, "country" : "_id.country", "province" : "$_id.province", "count" : 1}}
　　])

　　最终结果如下：

管道的概念

管道在Unix和Linux中一般用于将当前命令的输出结果作为下一个命令的参数。

MongoDB的聚合管道将MongoDB文档在一个管道处理完毕后将结果传递给下一个管道处理。管道操作是可以重复的。

表达式：处理输入文档并输出。表达式是无状态的，只能用于计算当前聚合管道的文档，不能处理其它的文档。

这里我们介绍一下聚合框架中常用的几个操作：

$project：修改输入文档的结构。可以用来重命名、增加或删除域，也可以用于创建计算结果以及嵌套文档。
match：用于过滤数据，只输出符合条件的文档。match：用于过滤数据，只输出符合条件的文档。match使用MongoDB的标准查询操作。
$limit：用来限制MongoDB聚合管道返回的文档数。
$skip：在聚合管道中跳过指定数量的文档，并返回余下的文档。
$unwind：将文档中的某一个数组类型字段拆分成多条，每条包含数组中的一个值。
$group：将集合中的文档分组，可用于统计结果。
$sort：将输入文档排序后输出。
$geoNear：输出接近某一地理位置的有序文档。

1、$project实例

　　 db.mycol.aggregate({$project:{name : 1, score : 1}})

　　这样的话结果中就只还有_id,name和score三个字段了，默认情况下_id字段是被包含的，如果要想不包含_id话可以这样:

　　db.mycol.aggregate({$project:{_id : 0, name : 1, score : 1}})

2、$match实例

　　match用于获取分数大于30小于并且小于100的记录，然后将符合条件的记录送到下一阶段match用于获取分数大于30小于并且小于100的记录，然后将符合条件的记录送到下一阶段group管道操作符进行处理

　　db.mycol.aggregate([{match :{score: {gt: 30, lt: 100}}},{group:{_id:'sex',count:{sum:1}}}])　

3、完整实例

db.cost_price.aggregate([

    {"$match":{"sku_id":{"$in":[,,]},"work_time":{"$lte":"2018-01-01"}}},

    {"$group":{"_id":"$sku_id","cost_price":{"$last":"$cost_price"},"work_time":{"$last":"$work_time"}}},

    {"$project" : {"cost_price" :  ,"work_time" :  }}

 ]);

mongodb MongoDB 聚合 group（转）的更多相关文章

mongodb MongoDB 聚合 group
MongoDB 聚合 MongoDB中聚合(aggregate)主要用于处理数据(诸如统计平均值,求和等),并返回计算后的数据结果.有点类似sql语句中的 count(*). 基本语法为:db.col ...
mongodb聚合 group
MongoDB中聚合(aggregate)主要用于处理数据(诸如统计平均值,求和等),并返回计算后的数据结果.有点类似sql语句中的 count(*). 基本语法为:db.collection.agg ...
MongoDB 聚合Group(一)
原文:http://blog.csdn.net/congcong68/article/details/45012717 一．简介 db.collection.group()使用JavaScript,它 ...
【翻译】MongoDB指南/聚合——聚合管道
[原文地址]https://docs.mongodb.com/manual/ 聚合聚合操作处理数据记录并返回计算后的结果.聚合操作将多个文档分组,并能对已分组的数据执行一系列操作而返回单一结果.Mo ...
MongoDB数据库聚合
前面的话聚合操作主要用于对数据的批量处理,将记录按条件分组以后,然后再进行一系列操作,例如,求最大值.最小值.平均值,求和等操作.聚合操作还能够对记录进行复杂的操作,主要用于数理统计和数据挖掘.在 ...
MongoDB,分组,聚合
使用聚合,db.集合名.aggregate- 而不是find 管道在Unix和Linux中一般用于将当前命令的输出结果作为下一个命令的参数.MongoDB的聚合管道将MongoDB文档在一个管道处理完 ...
mongodb高级聚合查询
在工作中会经常遇到一些mongodb的聚合操作,特此总结下.mongo存储的可以是复杂类型,比如数组.对象等mysql不善于处理的文档型结构,并且聚合的操作也比mysql复杂很多. 注:本文基于 mo ...
Yii2的mongodb的聚合操作
最近项目使用到mongodb的聚合操作,但是yii文档中对这方面资料较少,记录下 $where['created_time'] = ['$gt' => "$start_date_str ...
mongodb高级聚合查询（转）
在工作中会经常遇到一些mongodb的聚合操作,特此总结下.mongo存储的可以是复杂类型,比如数组.对象等mysql不善于处理的文档型结构,并且聚合的操作也比mysql复杂很多. 注:本文基于 mo ...

随机推荐

python反编译chm文件并生成pdf文件
# -*- coding: utf-8 -*- import os import os.path import logging import pdfkit original_chm = r'C:\Us ...
React学习笔记一：入门知识概览
一:安装react 1:直接下载react源码包,把需要用到的js文件引入自己的页面即可. 2:BootCDN 的 React CDN 库: 在页面代码中导入即可: <head> < ...
Java关闭Socket来终止线程
Java代码: package Threads; import java.io.BufferedReader; import java.io.IOException; import java.io.I ...
C#和JAVA的RSA密钥、公钥转换
C#的秘钥跟JAVA的密钥区别 RSA对于程序本身是没有区别的,其格式都是相同的.对于不同的程序来说,存储使用的语法(包装的类)会有所不同. RSA语法和语法标准有很多,大的类型大概分为ASN.1 ...
java的配置方式简介
1,java的配置方式简介java的配置方式是为了代替使用xml配置方式,主要使用两个注解:@Configuration//通过该注解来表明该类是一个spring的配置,相当于一个xml文件@Comp ...
Redis从入门到精通：初级篇（转）
原文链接:http://www.cnblogs.com/xrq730/p/8890896.html,转载请注明出处,谢谢 Redis从入门到精通:初级篇平时陆陆续续看了不少Redis的文章了,工作中 ...
SpringBoot中mybatis配置自动转换驼峰标识没有生效
mybatis提供了一个配置: #开启驼峰命名转换 mybatis.configuration.map-underscore-to-camel-case=true 使用该配置可以让mybatis自动将 ...
Q值, 电感Q因素, 电感品质因素, Inductor Q, Quality Factor
Q值基本概念 Q值, 品质因素, Quality Factor 是广泛使用于物理和工程领域的一个参数, 这指的是一个机械或非机械的组件里, 共振(谐振)的能量损失比例, 是衡量一个元件或谐振回路性能的 ...
Centos6.x 设置终端超时, 加强用户密码策略
1. 密码有效期, 密码长度 $ more /etc/login.defs # Password aging controls: # # PASS_MAX_DAYS Maximum number of ...
IntelliJ IDEA遇到Unable to parse template “Class”错误
在新安装的Ubuntu16下运行IntelliJ IDEA时, 遇到一个错误,在新建class的时候,提示Unable to parse template “Class” 通过查看 Settings ...

mongodb MongoDB 聚合 group（转）

MongoDB 聚合

管道的概念

mongodb MongoDB 聚合 group（转）的更多相关文章

随机推荐

热门专题