MongoDB聚合类操作
MongoDB中聚合(aggregate)主要用于处理数据(诸如统计平均值,求和等),并返回计算后的数据结果。有点类似sql语句中的 count(*)
语法:db.tablename.aggregate(aggregate_operation)
一、聚合表达式类型及举例(来自菜鸟教程)
| 表达式 | 描述 | 实例 |
| $sum | 计算总和。 | db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : "$likes"}}}]) |
| $avg | 计算平均值 | db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$avg : "$likes"}}}]) |
| $min | 获取集合中所有文档对应值得最小值。 | db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$min : "$likes"}}}]) |
| $max | 获取集合中所有文档对应值得最大值。 | db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$max : "$likes"}}}]) |
| $push | 在结果文档中插入值到一个数组中。 | db.mycol.aggregate([{$group : {_id : "$by_user", url : {$push: "$url"}}}]) |
| $addToSet | 在结果文档中插入值到一个数组中,但不创建副本。 | db.mycol.aggregate([{$group : {_id : "$by_user", url : {$addToSet : "$url"}}}]) |
| $first | 根据资源文档的排序获取第一个文档数据。 | db.mycol.aggregate([{$group : {_id : "$by_user", first_url : {$first : "$url"}}}]) |
| $last | 根据资源文档的排序获取最后一个文档数据 | db.mycol.aggregate([{$group : {_id : "$by_user", last_url : {$last : "$url"}}}]) |
如下,大家看我的代码举例
我的示例数据库中有同名的课程,除了name字段的内容相同,其他的内容是不一样的,在这里我使用了$group管道和$sum表达式,
db.basiclesson.aggregate([{$group:{_id:"$name",num_tutorial:{$sum:1}}}]),在这里{$group:{_id:"$name",num_tutorial:{$sum:1}}代表以“name”作为分组的字段,统计每个分组的数据行数
可能有很多小伙伴不理解为什么前面要使用_id,后面又跟上"name",即这处的表达:_id:"$name",在这里,前面_id必须是数据的主键,因为在进行统计计算时,它是需要向程序内部传递一个可以用作累加的字段
> db.basiclesson.find()
{ "_id" : ObjectId("5f1fdb6f122ecd20144058e9"), "name" : "JAVA" }
{ "_id" : ObjectId("5f1feb50122ecd20144058ea"), "name" : "SQL Server", "desc" : "这是一个测试课程" }
{ "_id" : ObjectId("5f1febce122ecd20144058eb"), "name" : "MongoDB", "desc" : "这是一个测试课程" }
{ "_id" : "001", "name" : "Oracle", "level" : 1, "price" : 10000 }
{ "_id" : "002", "name" : "C语言", "level" : 1, "price" : 5000 }
{ "_id" : "003", "name" : "C语言", "level" : 2, "price" : 8000 }
{ "_id" : ObjectId("5f21271e4b787aeb982bc254"), "name" : "计算机网络", "level" : "2", "price" : 1000 }
{ "_id" : ObjectId("5f212fb24b787aeb982bc255"), "name" : "计算机网络", "level" : 2 }
> db.basiclesson.aggregate([{$group:{_id:"$name",num_tutorial:{$sum:1}}}])
{ "_id" : "SQL Server", "num_tutorial" : 1 }
{ "_id" : "Oracle", "num_tutorial" : 1 }
{ "_id" : "JAVA", "num_tutorial" : 1 }
{ "_id" : "C语言", "num_tutorial" : 2 }
{ "_id" : "MongoDB", "num_tutorial" : 1 }
{ "_id" : "计算机网络", "num_tutorial" : 2 }
大家看我下面的截图,我尝试将_id改为name,此时程序就会报错,提示“字段name 必须是一个累加器类型的对象”

二、管道
菜鸟教程中的介绍:
管道在Unix和Linux中一般用于将当前命令的输出结果作为下一个命令的参数。
MongoDB的聚合管道将MongoDB文档在一个管道处理完毕后将结果传递给下一个管道处理。管道操作是可以重复的。
表达式:处理输入文档并输出。表达式是无状态的,只能用于计算当前聚合管道的文档,不能处理其它的文档。
| 表达式 | 说明 | 举例 | 我的理解 |
|
$project |
修改输入文档的结构。可以用来重命名、增加或删除域,也可以用于创建计算结果以及嵌套文档 |
db.article.aggregate({$project:{title:1 ,author:1}}) |
相当于SQL查询时指定查询的字段,其中_id默认显示,如果将字段值设置为1;则显示,设置为0,则不显示 |
| $match | 用于过滤数据,只输出符合条件的文档。$match使用MongoDB的标准查询操作 |
db.articles.aggregate( [ { $match : { score : { $gt : 70, $lte : 90 } } }, { $group: { _id: null, count: { $sum: 1 } } } ] ) |
相当于SQL中的条件查询,输出符合条件的数据,效果同直接使用同类的操作符,注意,这里一定不要漏掉中括号,可以直接使用条件查询搞定,例如这里举例中,如果不用统计最后的数据条数,可以改为db.articles.find({score:{$gt : 70, $lte : 90}}) |
| $limit | 用来限制MongoDB聚合管道返回的文档数 |
db.article.aggregate( { $limit : 3 }) |
相当于SQL中的topN,即显示前N条数据,可以直接用limit()方法,即db.tablename.find().limit(NUMBER) |
| $skip | 在聚合管道中跳过指定数量的文档,并返回余下的文档 | db.article.aggregate( { $skip : 5 }) | 显示前N条数据之后的数据,与$limit刚好形成互补,可以直接用skip()方法,即db.tablename.find().skip(NUMBER) |
| $unwind | 将文档中的某一个数组类型字段拆分成多条,每条包含数组中的一个值 | 待测试说明 | |
| $group | 将集合中的文档分组,可用于统计结果 | db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : "$likes"}}}]) | 相当于SQL中的group by,将数据按指定字段进行分组统计 |
| $sort | 将输入文档排序后输出 | db.basiclesson.aggregate({$sort:({"name":1})}) | 相当于SQL中的order by,个人觉得直接用操作符中的sort方法即可,效果一样,即db.tablename.find().sort({key:1/-1}) |
| $geoNear | 输出接近某一地理位置的有序文档 | 暂时没有做数据测试,不好描述 |
总结:我觉得管道有些不是太好理解,有些与其本身的一些函数功能相同,目前还没发现管道的作用是在哪,希望有大神指点一二
MongoDB聚合类操作的更多相关文章
- MongoDB 聚合操作
在MongoDB中,有两种方式计算聚合:Pipeline 和 MapReduce.Pipeline查询速度快于MapReduce,但是MapReduce的强大之处在于能够在多台Server上并行执行复 ...
- MongoDB 聚合操作(转)
在MongoDB中,有两种方式计算聚合:Pipeline 和 MapReduce.Pipeline查询速度快于MapReduce,但是MapReduce的强大之处在于能够在多台Server上并行执行复 ...
- MongoDB聚合查询及Python连接MongoDB操作
今日内容概要 聚合查询 Python操作MongoDB 第三方可视化视图工具 今日内容详细 聚合查询 Python操作MongoDB 数据准备 from pymongo import MongoCli ...
- Java对MongoDB进行分组操作并统计各个分组的数量
最近在检索MongoDB的数据时需要用到分组操作,由于没有现成的说明文档可参考,只能是在代码中不断调试.摸索前进:目前已现实了Java对MongoDB的分组操作,并统计各个分组的数量.现通过示例详细解 ...
- 【翻译】MongoDB指南/CRUD操作(二)
[原文地址]https://docs.mongodb.com/manual/ MongoDB CRUD操作(二) 主要内容: 更新文档,删除文档,批量写操作,SQL与MongoDB映射图,读隔离(读关 ...
- MongoDB 聚合管道(Aggregation Pipeline)
管道概念 POSIX多线程的使用方式中, 有一种很重要的方式-----流水线(亦称为"管道")方式,"数据元素"流串行地被一组线程按顺序执行.它的使用架构可参考 ...
- MongoDB的CRUD操作
1. 前言 在上一篇文章中,我们介绍了MongoDB.现在,我们来看下如何在MongoDB中进行常规的CRUD操作.毕竟,作为一个存储系统,它的基本功能就是对数据进行增删改查操作. MongoDB中的 ...
- Mongodb学习笔记四(Mongodb聚合函数)
第四章 Mongodb聚合函数 插入 测试数据 ;j<;j++){ for(var i=1;i<3;i++){ var person={ Name:"jack"+i, ...
- mongodb MongoDB 聚合 group
MongoDB 聚合 MongoDB中聚合(aggregate)主要用于处理数据(诸如统计平均值,求和等),并返回计算后的数据结果.有点类似sql语句中的 count(*). 基本语法为:db.col ...
- MongoDB 聚合
聚合操作过程中的数据记录和计算结果返回.聚合操作分组值从多个文档,并可以执行各种操作,分组数据返回单个结果.在SQL COUNT(*)和group by 相当于MongoDB的聚集. aggregat ...
随机推荐
- kubernetes批量删除evicted状态pod
#!/bin/bash # get namespace namespaces=`kubectl get pod -A | grep -i "evicted" | awk '{pri ...
- kafka 运维
查看kafka topic列表 #集群需要先执行unset JMX_PORT ./kafka-topics.sh --zookeeper gitee-zookeeper:2181 --list 查看t ...
- php预定义变量~$_SERVER[‘QUERY_STRING‘]
php $_SERVER['QUERY_STRING']函数 • 简介$_SERVER函数( 获取当前服务器信息) 预定义变量就是系统自己定义好的变量,直接使用就可以.预定义变量都是以数组的形式存在的 ...
- 防止npm被墙的小技巧
方法一: 全局安装中国服务器的包管理工具 npm i cnpm --global 下载包的时候用cnpm取代npm 方法二: 在小黑板输入:npm config set registry https: ...
- Go channel 介绍
Go 语言(Golang)中的 chan 是通道(channel)的缩写,用于在不同的 goroutine 之间进行通信.通道允许你在 goroutine 之间传递数据,从而实现同步和共享内存.下面是 ...
- C#自定义控件—仪表盘
C#用户控件之仪表盘 如何让温度.湿度.压力等有量程的监控值如仪表盘(DashBoard)一样显示? 思路(GDI绘图): 定义属性:(仪表盘的半径.颜色.间隙:刻度圆的半径.颜色.字体:指针的颜色. ...
- 今日算法随笔:填充每个节点的下一个右侧节点指针 II
题目链接:117. 填充每个节点的下一个右侧节点指针 II 题目描述 给定一个二叉树,填充它的每个 next 指针,让这个指针指向其下一个右侧节点.如果找不到下一个右侧节点,则将 next 指针设置为 ...
- SQL无法解决排序规则 Chinese_PRC_CI_AS 和 Latin1_General_CI_AS 的冲突
最近在执行一些跨库关联查询语句的时候提示了 "Cannot resolve the collatior conflict between "Chinese_PRC_Ci As&qu ...
- InfoTS: 具有信息感知增强的时间序列对比学习《Time Series Contrastive Learning with Information-Aware Augmentations》(对比学习、信息感知增强、高保真、多样性、信息论-信息瓶颈、元学习器)(没看懂,还需要再回顾)
现在是2024年5月23日,14:30,开始看论文. 论文:Time Series Contrastive Learning with Information-Aware Augmentations ...
- Figma 学习笔记 – Variants
参考 Create and use variants 定义与用途 Variants 是 Component 的扩展使用方式. 它就像 HTML 元素的属性一样, 通过修改属性, 元素就会变成相应的样式 ...