MongoDB聚合(aggregate)
一、基础
1、什么是聚合?
聚合是基于数据处理的聚合管道,每个文档通过一个有多个阶段(stage)组成的管道
可以对每个阶段的管道进行分组、过滤等功能,然后经过一系列的处理,输出相应的结果
db.集合名称.aggregate({管道: {表达式}})
有点像Django中ORM聚合的语法
2、常用管道
$group: 将集合中的文档分组,用于统计结果
$match: 过滤数据,只输出符合条件的文档
$project: 修改输入文档的结构,如重命名、增加、删除字段、创建计算结果 $sort: 将输入文档排序后输出
$limit: 限制聚合管道返回的文档数
$skip: 跳过指定数量的文档,并返回余下的文档
$unwind(): 将列表(数组)类型的字段进行拆分
3、常用表达式
处理输入文档,并输出
语法: 表达式:'$列名'
常用表达式
$sum: 计算总和, $sum:1 表示以一倍计数
$avg: 计数平均值
$min: 获取最小值
$max: 获取最大值
$push: 在结果文档中插入值到一个数组中
$first: 根据资源文档的排序获取第一个文档数据
$last: 根据资源文档的排序获取最后一个文档数据
二、常用管道用法
1、$group
作用: 将集合中的文档分组,可用于统计结果
_id表示分组的依据,使用某个字段的格式为'$字段'
格式
db.集合名称.aggregate({$group:{ _id: '$字段', 自定义字段: {表达式: '$字段'}}}) db.stu.aggregate({$group: {_id: '$gender'}})
db.stu.aggregate({$group: {_id: '$gender', count: {$sum: 1}}})
db.stu.aggregate({$group: {_id: '$gender', avg_age: {$avg: '$age'}}})
db.stu.aggregate({$group: {_id: '$hometown', min_age: {$min: '$age'}, count: {$sum: 1}}}) 注意:
_id后面的值,表示按照什么分组,格式'$字段'
count, avg_count是自定义的字段
表达式的值是'$字段'
Group by null
将集合中所用文档分为一组,即该集合就是一个组
# 求学生的总量和平均年龄
db.stu.aggregate({$group: {_id: null, count:{$sum: 1}, avg_age:{$avg: '$age'}}})
补充
# 插入数据 db.test.insert({country: "china", province: "sh", userid: "a"})
db.test.insert({country: "china", province: "sh", userid: "b"})
db.test.insert({country: "china", province: "sh", userid: "a"})
db.test.insert({country: "china", province: "sh", userid: "c"})
db.test.insert({country: "china", province: "bj", userid: "da"})
db.test.insert({country: "china", province: "bj", userid: "fa"}) # 1.去重
能够同时按照多个键进行分组,若文档中的每个字段都进行分组,那么可以实现去重的功能
db.test.aggregate({$group: {_id: {country: '$country', province: '$province'}}})
# 2.取字典嵌套的字典中的值
_id: {contry: '$_id.country'}
例子
db.test.aggregate(
{$group: {_id: {country: '$country', province: '$province', userid: '$userid'}}},
{$group: {_id: {country: '$_id.country', province: '$_id.province'}, count: {$sum: 1}}},
{$project: {country: '$_id.country', province: '$_id.province', count: '$count', _id: 0}}
)
2、$project
作用:修改输入文档的结构,如重命名、增加(显示)、删除(隐藏)字段,创建计算结果
1.显示和隐藏
格式:
db.集合名称.aggregate({$project: {_id: 0, 字段:1}})
值为0,是隐藏
值为1,是显示
示例
db.stu.aggregate({$project: {_id: 0, name: 1, hometown: 1, age: 1, gender: 1}})
注意: 显示、隐藏字段和投影差不多
2.重命名
例子
db.stu.aggregate({$group: {_id: '$gender', count: {$sum: 1}, avg: {$avg: '$age'}}}, {$project: {_id: 0,gender: '$_id', counter: '$count', avg_age: '$avg'}})
注意:
重命名字段格式 {新的字段名: '$旧的字段名称'}
管道符之间用逗号隔
3、$match
作用: 用于过滤数据,只输出符合条件的文档
注意: match是管道命令,能将结果交给下一个管道,find不可以
例子
db.stu.aggregate({$match: {age: {$lte: 18}}})
# 过滤->分组->重命名、显示
db.stu.aggregate({$match: {age: {$lte: 18}}}, {$group: {_id: '$gender', count: {$sum: 1}}}, {$project: {gender: '$_id', _id: 0, count: 1}})
4、$limit和$skip
$limit
限制聚合管道返回的文档数
例子
db.stu.aggregate({$limit: 2}) $skip
跳过指定数量的聚合管道文档。并返回剩下的文档
例子
db.stu.aggregate({$skip: 2})
db.stu.aggregate({$limit: 2}, {$skip: 3})
注意顺序:先写skip,再写limit
5、$unwind
# unwind 解开,松开
作用: 将文档中的某一个数组类型字段拆分成多条,每条包含数组中的一个值
格式:
db.集合名称.aggregate({$unwind: '$字段名称'})
例子
db.t2.insert({_id: 1, item:'t-shirt', size: ['S', 'M', 'L']})
db.t2.aggregate({$unwind: '$size'})
结果:
{ "_id" : 1, "item" : "t-shirt", "size" : "S" }
{ "_id" : 1, "item" : "t-shirt", "size" : "M" }
{ "_id" : 1, "item" : "t-shirt", "size" : "L" } # 补充 db.集合名称.aggregate({
$unwind: {
path: '$字段名称',
preserveNullAndEmptyArrays: <boolean> # 防止数据丢失
}
})
属性preserveNullAndEmptyArrays值
为false表示抛弃属性值为空的文档
为true表示保留属性值为空的文档 例子
db.t3.aggregate({$unwind: {path: '$size', preserveNullAndEmptyArrays: false}})
MongoDB聚合(aggregate)的更多相关文章
- mongodb 聚合(aggregate)
MongoDB中文手册|官方文档中文版 https://docs.mongoing.com/ 聚合操作处理数据记录和 return 计算结果.聚合操作将来自多个文档的值组合在一起,并且可以对分组数 ...
- MongoDB的aggregate聚合
聚合框架中常用的几个操作: $project:修改输入文档的结构.可以用来重命名.增加或删除域,也可以用于创建计算结果以及嵌套文档.(显示的列,相当遇sql 的) $match:用于过滤数据,只输出符 ...
- mongodb的聚合aggregate|group|match|project|sort|limit|skip|unwind
聚合 aggregate 聚合(aggregate)主要用于计算数据,类似sql中的sum().avg() 语法 db.集合名称.aggregate([{管道:{表达式}}]) 管道 管道在Unix和 ...
- MongoDB(七):聚合aggregate
1. 聚合aggregate 聚合主要用于计算数据,类似sql中的sum().avg() 语法: db.集合名称.aggregate([{管道:{表达式}}]) stu准备的数据: db.stu.in ...
- mongodb聚合查询-aggregate
Mongodb-aggregate 在工作中经常遇到一些mongodb的聚合操作,和mysql对比起来,mongo存储的可以是复杂的类型,比如数组,字典等mysql不善于处理的文档型结构,但是mong ...
- MongoDB 聚合管道(Aggregation Pipeline)
管道概念 POSIX多线程的使用方式中, 有一种很重要的方式-----流水线(亦称为"管道")方式,"数据元素"流串行地被一组线程按顺序执行.它的使用架构可参考 ...
- mongodb MongoDB 聚合 group
MongoDB 聚合 MongoDB中聚合(aggregate)主要用于处理数据(诸如统计平均值,求和等),并返回计算后的数据结果.有点类似sql语句中的 count(*). 基本语法为:db.col ...
- MongoDB 聚合
聚合操作过程中的数据记录和计算结果返回.聚合操作分组值从多个文档,并可以执行各种操作,分组数据返回单个结果.在SQL COUNT(*)和group by 相当于MongoDB的聚集. aggregat ...
- MongoDB聚合
--------------------MongoDB聚合-------------------- 1.aggregate(): 1.概念: 1.简介 ...
随机推荐
- java 面试题之银行业务系统
1.需求 模拟实现银行业务调度系统逻辑,具体需求如下: 银行内有6个业务窗口,1 - 4号窗口为普通窗口,5号窗口为快速窗口,6号窗口为VIP窗口. 有三种对应类型的客户:VIP客户,普通客户,快速客 ...
- H3C在设备上使用TFTP服务
- linux 每-CPU 的变量
每-CPU 变量是一个有趣的 2.6 内核的特性. 当你创建一个每-CPU 变量, 系统中每个处理 器获得它自己的这个变量拷贝. 这个可能象一个想做的奇怪的事情, 但是它有自己的优点. 存取每-CPU ...
- CF1228——记一次和紫名失之交臂的CF
CF1228--记一次和紫名失之交臂的CF 第无数次和暴涨失之交臂 A 题目大意给定\(l,r\)输出任意一个\(l,r\)之间的每一位都不同的数 \((l <= r <= 10^5)\) ...
- Linux USB 和 sysfs
由于单个 USB 物理设备的复杂性, 设备在 sysfs 中的表示也非常复杂. 物理 USB 设备 (通过 struct usb_device 表示)和单个 USB 接口(由 struct usb_i ...
- promise 讲解
Promise的出现 解决了 js 回调地狱得问题 回调地狱图 Promise解决回调地狱 是不是美观多了.. 实例化Promise时传入方法里的两个参数 resolve(成功的回调)和reject ...
- TCP&IP基础概念复习
第一章概述 NII(National Information Infrastructure):国家信息基础设施 GII(Global Information Infrastructure):全球信息基 ...
- Mysql的SQL优化指北
概述 在一次和技术大佬的聊天中被问到,平时我是怎么做Mysql的优化的?在这个问题上我只回答出了几点,感觉回答的不够完美,所以我打算整理一次SQL的优化问题. 要知道怎么优化首先要知道一条SQL是怎么 ...
- 洛谷$P3877\ [TJOI2010]$打扫房间 网络流
正解:网络流 解题报告: 传送门$QwQ$ 昂考虑把题目的约束条件详细化?就说每个格点能向四连通连边,问能否做到每个格点度数等于2? $umm$就先黑白染色建两排点呗,然后就$S$向左侧连流量为2的边 ...
- 【C++】CCFCSP201803-1跳一跳
// // main.cpp // CCFCSP20180318_1_跳一跳 // // Created by T.P on 2018/3/23. // Copyright © 2018年 T.P. ...