MongoDB中聚合(aggregate)主要用于处理数据(诸如统计平均值,求和等),并返回计算后的数据结果。有点类似sql语句中的 count(*)

语法:db.tablename.aggregate(aggregate_operation)

一、聚合表达式类型及举例(来自菜鸟教程)

表达式 描述 实例
$sum 计算总和。 db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : "$likes"}}}])
$avg 计算平均值 db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$avg : "$likes"}}}])
$min 获取集合中所有文档对应值得最小值。 db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$min : "$likes"}}}])
$max 获取集合中所有文档对应值得最大值。 db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$max : "$likes"}}}])
$push 在结果文档中插入值到一个数组中。 db.mycol.aggregate([{$group : {_id : "$by_user", url : {$push: "$url"}}}])
$addToSet 在结果文档中插入值到一个数组中,但不创建副本。 db.mycol.aggregate([{$group : {_id : "$by_user", url : {$addToSet : "$url"}}}])
$first 根据资源文档的排序获取第一个文档数据。 db.mycol.aggregate([{$group : {_id : "$by_user", first_url : {$first : "$url"}}}])
$last 根据资源文档的排序获取最后一个文档数据 db.mycol.aggregate([{$group : {_id : "$by_user", last_url : {$last : "$url"}}}])

如下,大家看我的代码举例

我的示例数据库中有同名的课程,除了name字段的内容相同,其他的内容是不一样的,在这里我使用了$group管道和$sum表达式,

db.basiclesson.aggregate([{$group:{_id:"$name",num_tutorial:{$sum:1}}}]),在这里{$group:{_id:"$name",num_tutorial:{$sum:1}}代表以“name”作为分组的字段,统计每个分组的数据行数

可能有很多小伙伴不理解为什么前面要使用_id,后面又跟上"name",即这处的表达:_id:"$name",在这里,前面_id必须是数据的主键,因为在进行统计计算时,它是需要向程序内部传递一个可以用作累加的字段

> db.basiclesson.find()
{ "_id" : ObjectId("5f1fdb6f122ecd20144058e9"), "name" : "JAVA" }
{ "_id" : ObjectId("5f1feb50122ecd20144058ea"), "name" : "SQL Server", "desc" : "这是一个测试课程" }
{ "_id" : ObjectId("5f1febce122ecd20144058eb"), "name" : "MongoDB", "desc" : "这是一个测试课程" }
{ "_id" : "001", "name" : "Oracle", "level" : 1, "price" : 10000 }
{ "_id" : "002", "name" : "C语言", "level" : 1, "price" : 5000 }
{ "_id" : "003", "name" : "C语言", "level" : 2, "price" : 8000 }
{ "_id" : ObjectId("5f21271e4b787aeb982bc254"), "name" : "计算机网络", "level" : "2", "price" : 1000 }
{ "_id" : ObjectId("5f212fb24b787aeb982bc255"), "name" : "计算机网络", "level" : 2 }
> db.basiclesson.aggregate([{$group:{_id:"$name",num_tutorial:{$sum:1}}}])
{ "_id" : "SQL Server", "num_tutorial" : 1 }
{ "_id" : "Oracle", "num_tutorial" : 1 }
{ "_id" : "JAVA", "num_tutorial" : 1 }
{ "_id" : "C语言", "num_tutorial" : 2 }
{ "_id" : "MongoDB", "num_tutorial" : 1 }
{ "_id" : "计算机网络", "num_tutorial" : 2 }

大家看我下面的截图,我尝试将_id改为name,此时程序就会报错,提示“字段name 必须是一个累加器类型的对象”

二、管道

菜鸟教程中的介绍:

管道在Unix和Linux中一般用于将当前命令的输出结果作为下一个命令的参数。

MongoDB的聚合管道将MongoDB文档在一个管道处理完毕后将结果传递给下一个管道处理。管道操作是可以重复的。

表达式:处理输入文档并输出。表达式是无状态的,只能用于计算当前聚合管道的文档,不能处理其它的文档。

表达式 说明 举例 我的理解

$project

修改输入文档的结构。可以用来重命名、增加或删除域,也可以用于创建计算结果以及嵌套文档

db.article.aggregate({$project:{title:1 ,author:1}})

相当于SQL查询时指定查询的字段,其中_id默认显示,如果将字段值设置为1;则显示,设置为0,则不显示

$match 用于过滤数据,只输出符合条件的文档。$match使用MongoDB的标准查询操作

db.articles.aggregate( [ { $match : { score : { $gt : 70, $lte : 90 } } }, { $group: { _id: null, count: { $sum: 1 } } } ] )

相当于SQL中的条件查询,输出符合条件的数据,效果同直接使用同类的操作符,注意,这里一定不要漏掉中括号,可以直接使用条件查询搞定,例如这里举例中,如果不用统计最后的数据条数,可以改为db.articles.find({score:{$gt : 70, $lte : 90}})
$limit 用来限制MongoDB聚合管道返回的文档数

db.article.aggregate( { $limit : 3 })

相当于SQL中的topN,即显示前N条数据,可以直接用limit()方法,即db.tablename.find().limit(NUMBER)
$skip 在聚合管道中跳过指定数量的文档,并返回余下的文档 db.article.aggregate( { $skip : 5 }) 显示前N条数据之后的数据,与$limit刚好形成互补,可以直接用skip()方法,即db.tablename.find().skip(NUMBER)
$unwind 将文档中的某一个数组类型字段拆分成多条,每条包含数组中的一个值   待测试说明
$group 将集合中的文档分组,可用于统计结果 db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : "$likes"}}}]) 相当于SQL中的group by,将数据按指定字段进行分组统计
$sort 将输入文档排序后输出 db.basiclesson.aggregate({$sort:({"name":1})}) 相当于SQL中的order by,个人觉得直接用操作符中的sort方法即可,效果一样,即db.tablename.find().sort({key:1/-1})
$geoNear 输出接近某一地理位置的有序文档   暂时没有做数据测试,不好描述

总结:我觉得管道有些不是太好理解,有些与其本身的一些函数功能相同,目前还没发现管道的作用是在哪,希望有大神指点一二

MongoDB聚合类操作的更多相关文章

  1. MongoDB 聚合操作

    在MongoDB中,有两种方式计算聚合:Pipeline 和 MapReduce.Pipeline查询速度快于MapReduce,但是MapReduce的强大之处在于能够在多台Server上并行执行复 ...

  2. MongoDB 聚合操作(转)

    在MongoDB中,有两种方式计算聚合:Pipeline 和 MapReduce.Pipeline查询速度快于MapReduce,但是MapReduce的强大之处在于能够在多台Server上并行执行复 ...

  3. MongoDB聚合查询及Python连接MongoDB操作

    今日内容概要 聚合查询 Python操作MongoDB 第三方可视化视图工具 今日内容详细 聚合查询 Python操作MongoDB 数据准备 from pymongo import MongoCli ...

  4. Java对MongoDB进行分组操作并统计各个分组的数量

    最近在检索MongoDB的数据时需要用到分组操作,由于没有现成的说明文档可参考,只能是在代码中不断调试.摸索前进:目前已现实了Java对MongoDB的分组操作,并统计各个分组的数量.现通过示例详细解 ...

  5. 【翻译】MongoDB指南/CRUD操作(二)

    [原文地址]https://docs.mongodb.com/manual/ MongoDB CRUD操作(二) 主要内容: 更新文档,删除文档,批量写操作,SQL与MongoDB映射图,读隔离(读关 ...

  6. MongoDB 聚合管道(Aggregation Pipeline)

    管道概念 POSIX多线程的使用方式中, 有一种很重要的方式-----流水线(亦称为"管道")方式,"数据元素"流串行地被一组线程按顺序执行.它的使用架构可参考 ...

  7. MongoDB的CRUD操作

    1. 前言 在上一篇文章中,我们介绍了MongoDB.现在,我们来看下如何在MongoDB中进行常规的CRUD操作.毕竟,作为一个存储系统,它的基本功能就是对数据进行增删改查操作. MongoDB中的 ...

  8. Mongodb学习笔记四(Mongodb聚合函数)

    第四章 Mongodb聚合函数 插入 测试数据 ;j<;j++){ for(var i=1;i<3;i++){ var person={ Name:"jack"+i, ...

  9. mongodb MongoDB 聚合 group

    MongoDB 聚合 MongoDB中聚合(aggregate)主要用于处理数据(诸如统计平均值,求和等),并返回计算后的数据结果.有点类似sql语句中的 count(*). 基本语法为:db.col ...

  10. MongoDB 聚合

    聚合操作过程中的数据记录和计算结果返回.聚合操作分组值从多个文档,并可以执行各种操作,分组数据返回单个结果.在SQL COUNT(*)和group by 相当于MongoDB的聚集. aggregat ...

随机推荐

  1. 如何快速在 Apache DolphinScheduler 新扩展一个任务插件?

    作者 | 代立冬 编辑 | Debra Chen Apache DolphinScheduler 是现代数据工作流编排平台,具有非常强大的可视化能力,DolphinScheduler 致力于使数据工程 ...

  2. Python按条件删除Excel表格数据的方法

      本文介绍基于Python语言,读取Excel表格文件,基于我们给定的规则,对其中的数据加以筛选,将不在指定数据范围内的数据剔除,保留符合我们需要的数据的方法.   首先,我们来明确一下本文的具体需 ...

  3. 新版的Django Docker部署方案,多阶段构建、自动处理前端依赖

    前言 前几天的文章中,我们已经把使用 pdm 的项目用 docker 搞定了,那么下一步就是把完整的 DjangoStarter v3 版本用 docker 部署. 现在不像之前那么简单直接一把梭了, ...

  4. RabbitMq消息可靠性之确认模式 通俗易懂 超详细 【内含案例】

    RabbitMq保证消息可靠性之确认模式 介绍 消息的确认,是指生产者投递消息后,如果 Broker 收到消息,则会给我们生产者一个应答.生产者进行接收应答,用来确定这条消息是否正常的发送到 Brok ...

  5. zuul集成apollo动态刷新配置

    zuul集成apollo实现路由配置的动态刷新 import com.ctrip.framework.apollo.model.ConfigChangeEvent; import com.ctrip. ...

  6. CF1234D

    CF1234D 链接: https://codeforces.com/problemset/problem/1234/D 题目大意: 给你一个字符串s,你需要完成如下q次询问 把 s 的第 p 位改为 ...

  7. bazel简介(二)——从makefile向bazel转变(使用genrule)

    0x01 背景 上篇中已经介绍了bazel的基本工作原理和相关的概念.这篇将继续介绍下,现有的makefile构建工程如何切换到bazel构建系统. bazel提供了丰富的扩展方式,当然也支持从目前的 ...

  8. idea下spring切换jdk版本

    1.首先打开项目配置设置 2. 修改project中的配置 3. 修改modules中的配置 这个方法不需要修改pom.xml文件 如果有问题请指正   及时修改 2022年9月10日16:42:16

  9. 淘宝api接口,淘宝开放平台api接口

    目前淘宝开放平台是暂停入驻的,正常情况来说,用这个接口的人是为了打单发货,但是由于淘宝暂停入驻,所以大家也无法接入了. 目前本人手头有很早申请好的可以使用的接口,可以用于以下用途: 1.淘宝订单打单发 ...

  10. C语言linux系统fork函数

    References: c语言fork函数 linux中fork()函数详解 一.fork函数简介 作用 在linux下,C语言创建进程用fork函数.fork就是从父进程拷贝一个新的进程出来,子进程 ...