MongoDB: 聚集管道
在MongoDB2.2新出现的。
聚集管道式基于数据处理管道概念建模的数据聚集框架。文档进入一个多阶段能将该文档转化为聚集结果的管道。
聚集管道提供了map-reduce方法了替代物,并在非常多聚集任务中是首选的方案,由于map-reduce的复杂性可能是你不希望看到的。
上图是一个带凝视的聚集管道的操作,有两个阶段:$match和$group
聚集管道在值的类型和结果大小上有非常多限制。
以下简介。
聚集操作在使用aggregate命令时有的限制:
- 类型限制
聚集管道不是在下列类型的值上进行操作:Symbol,Minkey,MaxKey,DBRef,Code和CodeWSrope
(在MongoDB2.4版本号解除了对Binary类型的限制。
在MongoDB2.2,管道不能对Binary类型数据操作)
- 结果限制大小
假设aggregate命令返回的单个文档保护完整的结果集。则该命令在结果集超过BSON Document Size限制时会产生一个错误,眼下的大小是16M。
为了管理超过这一限制的结果集,aggregate命令当命令返回一个游标(cursor)或把结果保存在一个collection里时,可以返回随意大小的结果集。
(在MongoDB2.6,aggregate命令返回一个游标或把结果存在一个collection时。能不受这个限制大小。db.collection.aggregate()返回一个游标,能返回随意大小的结果集。)
- 内存限制
在MongoDB2.6有了变化。
管道阶段在RAM有100M的限制。
假设超过这一限制,MongoDB会出错。为了同意操作大型数据。能够使用allowDiskUse选项来时聚集管道阶段能往暂时文件写数据。
管道
管道。顾名思义就是来自集合的文档通过一个聚集管道的旅行,当通过当中时该管道能转化这些对象。对熟悉Unix shells命令的(如 bash),这个概念和管道(pipe)非常类似。
MongoDB的聚集管道以一个集合的文档開始,流动文档从一个管道操作(pipeline operator)到下一个来处理文档。
在管道的每个操作符在文档经过管道时都会转化文档。管道操作符不须要为每个输入文档产生一个输出文档。
操作符能够产生新文档也能过滤文档。
管道操作能在一个管道里面反复。
管道表达式
每个管道操作符接受一个管道表达式作为操作数。管道表达式指出应用在输入文档的转化过程。
表达式有一个文档(document)结构,并包括字段。值和操作符。
管道表达式仅仅能操作在管道中的当前文档,不能引用在其它文档的数据:表达式提供了内存(in-memory)文档转化。
一般的。表达式是无状态的,仅仅在聚集过程时有一个例外:Accumulation expressions。累加表达式,使用$group管道,维持他们的状态(如,totals,maximums,mininums和相关数据)作为通过管道的文档过程。
聚集管道行为
在MongoDB,aggregate命令操作单个集合。并在逻辑上传递整个文档给聚集管道。为了优化这个操作。在可能的情况下,应该使用以下策略来避免扫描整个集合。
- 管道操作符和索引
$match和$sort管道操作符可以利用索引的优势,假设他们在管道的開始位置出现。
(在Mongo2.4新出现的:$geoNear管道操作符能利用地理索引的优势。
当使用$geoNear。$geoNear必须在聚集管道的第一阶段出现。)
即使管道使用了索引。聚合操作依旧要訪问实际的文档。比方,索引不能全然覆盖聚集管道。
(在Mongo2.6之前的版本号。对规模很小的选择情况,索引可以覆盖管道)
提前过滤
假设你的聚集应用仅须要一个集合的一个数据子集。使用 $match。$limit,$skip阶段在文档进入管道时去限制文档.当被放置在管道的開始,$match操作符使用合适的索引去扫描集合匹配的文档.
在管道的開始紧跟着$sort阶段放置$match在逻辑上等价于一个使用排序的单一查询,并能够使用索引.假设可能的话,把$match放置在管道的开头.
MongoDB: 聚集管道的更多相关文章
- MongoDB 聚合(管道与表达式)
MongoDB中聚合(aggregate)主要用于处理数据(诸如统计平均值,求和等),并返回计算后的数据结果.有点类似sql语句中的 count(*). aggregate() 方法 MongoDB中 ...
- MongoDB.Driver 管道 Aggregate
目前mongodb for C#这个驱动,在进行Aggregate时,只支持BsonDocument类型,也就是说,你的集合collection也必须返回的是BsonDocument,而实体类型是不可 ...
- MongoDB 聚合管道(Aggregation Pipeline)
管道概念 POSIX多线程的使用方式中, 有一种很重要的方式-----流水线(亦称为"管道")方式,"数据元素"流串行地被一组线程按顺序执行.它的使用架构可参考 ...
- MongoDB聚合管道(Aggregation Pipeline)
参考聚合管道简介 聚合管道 聚合管道是基于数据处理管道模型的数据聚合框架.文档进入一个拥有多阶段(multi-stage)的管道,并被管道转换成一个聚合结果.最基本的管道阶段提供了跟查询操作类似的过滤 ...
- MongoDB基础教程系列--第七篇 MongoDB 聚合管道
在讲解聚合管道(Aggregation Pipeline)之前,我们先介绍一下 MongoDB 的聚合功能,聚合操作主要用于对数据的批量处理,往往将记录按条件分组以后,然后再进行一系列操作,例如,求最 ...
- MongoDB聚合管道
通过上一篇文章中,认识了MongoDB中四个聚合操作,提供基本功能的count.distinct和group,还有可以提供强大功能的mapReduce. 在MongoDB的2.2版本以后,聚合框架中多 ...
- MongoDB数据库 : 管道,用户管理,副本集等
聚合(aggregate): db.集合.aggregate([{管道:{表达式}}]) db.集合.aggregate([ {管道1:{表达式1}}, {管道2:{表达式2}}, ... ...]) ...
- mongodb聚合管道用法
基本用法 db.collection.aggregate( [ { <stage> }, ... ] ) stage如下 名称 描述 $addFields 将新的字段添加到文档中,输出的文 ...
- MongoDB 聚合管道
参见:http://www.cnblogs.com/liruihuan/p/6686570.html MongoDB 的聚合功能,聚合操作主要用于对数据的批量处理,往往将记录按条件分组以后,然后再进 ...
随机推荐
- 算法:基于 RingBuffer 的 Queue 实现
背景 如果基于数组实现队列,常见的选择是采用 RingBuffer,否则就需要移动数组元素. RingBuffer 很容易看出 RingBuffer 的思想,这里就不赘述了. 您可以思考一个问题:图中 ...
- linux 监控CPU 内存情况
htop
- Python3.6学习笔记(五)
网络编程 网络程序出现的比互联网要早很多,实现方式主要依靠网络上不同主机间进程的通信,通信协议最重要的是TCP/IP协议.在这两个协议基础上还有很多更高级的协议,包括HTTP.SMTP等.要进行两个主 ...
- Adhoc
没觉得Adhoc还有什么做的,这几年貌似很冷了,从通信的角度讲,实现比较困难,实际意义不大,国内最近又跟风了VANET.以我同学做的为例,他考虑用Adhoc做野外分散点的自组网(一个集体内),但从通信 ...
- bashrc和profile的用途和区别
使用终端登录Linux操作系统的控制台后,会出现一个提示符号(例如:#或~),在这个提示符号之后可以输入命令,Linux根据输入的命令会做回应,这一连串的动作是由一个所谓的Shell来做处理. She ...
- Maven中<dependencies>节点和<dependencyManagement>节点的区别
dependencyManagement只是插件管理,并不是真正的插件依赖,所以里面包含的插件在没有子项目使用的时候,并不会真正下载 1 .使用项目继承 利用项目继承可以将结构信息,部署信息,共同的依 ...
- 解决Ubuntu下的Eclipse打开Windows编写的java代码的中文乱码
其实所有的中文乱码 问题都是编码不同所导致的.这里要想让eclipse能正常显示出汉字,就要修改它的字符编码 步骤如下: 1 ,点击菜单栏中的Window(窗口),选择Preferences(首选项) ...
- HTML5 Canvas,WebGL,CSS Shaders,GLSL的暧昧关系 【转】
HTML5 Canvas,WebGL,CSS Shaders,GLSL的暧昧关系 这篇文章发布于 2011年10月10日,星期一,17:14,归类于 canvas相关. 阅读 58013 次, 今日 ...
- Bootstrap学习js插件篇之滚动监听
1.滚动监听 案例 滚动监听插件可以根据滚动条的位置自动更新所对应的导航标记.Bootstrap中文网左侧就是一个滚动监听的例子. 代码段: <nav id="navbar-examp ...
- 分享七个绚丽夺目的JQuery导航(还有苹果、猪八戒等),有图有真相
今天来一起看看几个个人觉得比较好的导航.有好几个导航是仿的,比如仿苹果.仿猪八戒等等,但仿得还都不错.也有不少是基于jQuery的.特别是像我这样的懒人,就可以在这些基础上修修改改作为自己网站项目的导 ...