数据库-mongodb-聚合与map reduce
分组统计:group()
Group函数:
1.不支持集群、分片,无法分布式计算
2.需要手写聚合函数的业务逻辑
1
2
3
4
5
6
7
8
|
db.goods.group({ key:{cat_id: 1 }, cond:{}, reduce: function (curr,result){ result.cnt += 1 ; }, initial:{cnt: 0 } }); |
查找每个栏目下商品价格大于50的商品数量
1
2
3
4
5
6
7
8
|
db.goods.group({ key:{cat_id: 1 }, cond:{shop_price:{$gt: 50 }}, initial:{cnt: 0 }, reduce: function (curr,result){ result.cnt += 1 ; } }); |
每个栏目下的商品库存量sum操作
1
2
3
4
5
6
7
8
|
db.goods.group({ key:{cat_id: 1 }, cond:{}, initial:{cnt: 0 }, reduce: function (curr,result){ result.num += curr.goods_number; } }); |
计算每个栏目下最贵的商品,实现max()函数
1
2
3
4
5
6
7
8
9
10
|
db.goods.group({ key:{cat_id: 1 }, cond:{}, initial:{max: 0 }, reduce: function (curr,result){ if (curr.shop_price > result.max ){ result.max = curr.shop_price; } } }); |
计算每个栏目下商品 的平均价格cu
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
db.goods.group({ key:{cat_id: 1 }, cond:{}, initial:{cnt: 0 ,sum: 0 }, reduce: function (curr,result){ if (curr.shop_price > result.max ){ result.cnt += 1 ; result.sum += curr.shop_price; } }, finalize: function (result){ result.avg = result.sum / result.avg; } }); |
aggregate()函数
where | $match |
group by | $group |
having | $match |
select | $project |
order by | $sort |
limit | $limit |
sum() | $sum |
count() | $sum |
查询每个栏目下的商品数量
1
2
3
|
db.collection.aggreagte([ {$group:{_id: "$cat_id" ,total:{$sum: 1 }}} ]); |
查询goods下有多少商品
1
2
3
|
db.collection.aggreagte([ {$group:{_id: null ,total:{$sum: 1 }}} ]); |
查询每个栏目下价格大于50的商品,并筛选出“满足条件的商品数量大于等于3”的栏目
match在group前是SQL中match的作用,match在group后是having的作用
1
2
3
4
5
|
db.collection.aggreagte([ {$match:{shop_price:{$gt: 50 }}}, {$group:{_id: null ,total:{$sum: 1 }}}, {$match:{total:{$gte: 3 }}}, ]); |
查询每个栏目下的库存量,并按照库存量排序
1
2
3
4
|
db.collection.aggreagte([ {$group:{_id: "$cat_id" ,total:{$sum: "$goods_number" }}},
]); |
查询每个栏目的商品平均价格,并按照平均价格由高到低排序
--这个group有不少参数,官方文档里面有
1
2
3
4
|
db.collection.aggreagte([ {$group:{_id: "$cat_id" ,avg:{$avg: "$shop_price" }}}, //$符号是转为列的意思 {$sort:{avg: 1 }}} ]); |
MapReduce
mapReduce随着大数据的概念而流行
其实mapReduce的概念非常简单
从功能上来说,相当于RDMS的group操作
它的真正强项在于分布式,当数据非常大时,分布在各个地方时,group就力不能及了,mapReduce用蛮力来计算,mapReduce工作过程
map-->映射,先把同一个组的数据,映射到一个数组上
reduce-->规约,把数组进行运算
简单用法
1
2
3
4
5
|
var map = function (){ emit( this .cat_id, this .shop_price); } var reduce = function (cat_id,all_price){XX各种数据操作}; db.goods.mapReduce(map,reduce,{quer:{},out: 'res' }); //把查询到的结果输出为res表 |
mongodb对js的引擎做了一些修改对array数组增加了一些函数
mapReduce一般写在mongos上
数据库-mongodb-聚合与map reduce的更多相关文章
- 数据库——MongoDB——>Java篇
MongoDB是一个基于分布式文件存储的数据库.由C++语言编写.旨在为WEB应用提供可扩展的高性能数据存储解决方案. MongoDB 是一个介于关系数据库和非关系数据库之间的产 ...
- 非关系型数据库----MongoDB
一.什么是MongoDB? MongoDB 是由C++语言编写的,是一个基于分布式文件存储的开源数据库系统. 在高负载的情况下,添加更多的节点,可以保证服务器性能. MongoDB 旨在为WEB应用提 ...
- python数据库-MongoDB的安装(53)
一.NoSQL介绍 1.什么是NoSQL NoSQL(NoSQL = Not Only SQL ),意即"不仅仅是SQL". NoSQL,指的是非关系型的数据库.NoSQL有时也称 ...
- MongoDB Map Reduce(转载)
MongoDB Map Reduce Map-Reduce是一种计算模型,简单的说就是将大批量的工作(数据)分解(MAP)执行,然后再将结果合并成最终结果(REDUCE). MongoDB提供的Map ...
- 记一次MongoDB Map&Reduce入门操作
需求说明 用Map&Reduce计算几个班级中,每个班级10岁和20岁之间学生的数量: 需求分析 学生表的字段: db.students.insert({classid:1, age:14, ...
- mongodb Map/reduce测试代码
private void AccountInfo() { ls.Clear(); DateTime dt = DateTime.Now.Date; IMongoQuery query = Query& ...
- Mongodb学习笔记四(Mongodb聚合函数)
第四章 Mongodb聚合函数 插入 测试数据 ;j<;j++){ for(var i=1;i<3;i++){ var person={ Name:"jack"+i, ...
- MongoDB 聚合 (转) 仅限于C++开发
MongoDB除了基本的查询功能,还提供了很多强大的聚合工具,其中简单的可计算集合中的文档个数, 复杂的可利用MapReduce做复杂数据分析. 1.count count返回集合中的文档数量 db. ...
- Mongodb聚合函数
插入 测试数据 for(var j=1;j<3;j++){ for(var i=1;i<3;i++){ var person={ Name:"jack"+i, Age: ...
随机推荐
- [SharePoint2010开发入门经典]编译部署SPS WebPart
本章概要: 1.理解web部件,什么时候需要创建一个 2.理解标准和可视web部件的不同 3.使用VS构建部署web部件
- iOS绘图系统UIKit与Core Graphics
概述 iOS主要的绘图系统有UIKit,Core Graphics,Core Animation,Core Image,Open GL等,本片博文主要介绍UIKit与Core Graphics的绘图系 ...
- mycat 连续分片 -> 自己定义数字范围分片
1,自己定义数字范围分片 自己定义数字范围分片,提前规划好分片字段某个范围属于哪个分片,比方说将第一个500W的数据分片在第一个节点上面.第二个500W的数据分片在第二个节点上,依次类推 2,加入配置 ...
- POJ 2407
裸 的求欧拉函数 #include <iostream> #include <cstdio> #include <cstring> #include <alg ...
- 图像算法研究---Adaboost算法具体解释
本篇文章先介绍了提升放法和AdaBoost算法.已经了解的可以直接跳过.后面给出了AdaBoost算法的两个样例.附有详细计算过程. 1.提升方法(来源于统计学习方法) 提升方法是一种经常使用的统计学 ...
- Deming管理系列(1)——开车仅仅看后视镜
问题: 当业务经理被要求为未来的业务做计划时,他会提出一个自觉得不错的数字,而董事会往往希望能获得更大的收益,多次与其谈判.而业务经理在这方面不是新手,他有非常多可用的报告. 为什么不能让业务规划流程 ...
- js面向对象编程:怎样实现方法重载
js中怎样实现方法重载?这涉及到三个问题 1同名函数的调用问题 2函数中特殊的參数arguments 3怎样利用arguments实现方法重载 1同名函数的调用问题 都知道在js中假设存在多个名称同样 ...
- 运行shell命令
首先将shell命令命名为.sh文件 将上面的代码保存为test.sh.并 cd 到对应文件夹: chmod +x ./test.sh #使脚本具有运行权限 ./test.sh #运行脚本 假设报错/ ...
- ES内存持续上升问题定位
https://discuss.elastic.co/t/memory-usage-of-the-machine-with-es-is-continuously-increasing/23537/ ...
- Oracle 位图索引
内容简介: 1.位图索引 1.1位图索引使用注意事项; 1.2 使用位图索引; 1.3 位图索引对DML操作的影响; 2.位图连接索引 2.1 明确需求后使用位图索引; 2.1创建位图连接索引的注意事 ...