reduce 命令

db.runCommand(

               {

                 mapReduce: <collection>,

                 map: <function>,

                 reduce: <function>,

                 finalize: <function>,

                 out: <output>,

                 query: <document>,

                 sort: <document>,

                 limit: <number>,

                 scope: <document>,

                 jsMode: <boolean>,

                 verbose: <boolean>,

                 bypassDocumentValidation: <boolean>

               }

             )

mapReduce 你要做并行处理的集合名字
map：分组依据， emit(key,value) => key => group的key，value => 是你key的数组 key=25, values=【“jack","mary"]
reduce: function(key,values) 里面有两个参数，第一个参数是key：group操作的key，第二个参数是values：我们刚才说到的【数组】，类似group中的finalize函数。
finalize：这个呢，还是和group中的 finalize 一样，会对每组的结构进行一个最后修改。也可以不修改。
out：就是我们进行mapreduce之后，将结果存放的位置，一般是“集合类型“。
query: 这个很简单，和group的query一样
sort：一样的到底，对map操作之前的文档进行排序。
limit：在map之前限制文档的个数
scope：给reduce,query之类的函数提供变量访问。
我们常用到的是： mapReduce， map，reduce， out，query，

二：我们看一下注意事项

我们还是用一个person集合，其中有name和age。

上一节课程我们将group的时候，做了一个对age进行分组的一个例子

｛age:26,count:2｝

｛age:29,count:2｝

｛age:31,count:2｝

第一步：插入数据源

> db.person.find()

{ "_id" : ObjectId("5678a3fc763ea69ae9780c62"), "name" : "mary", "age" : 26 }

{ "_id" : ObjectId("5678a403763ea69ae9780c63"), "name" : "jackson", "age" : 26 }

{ "_id" : ObjectId("5678a40a763ea69ae9780c64"), "name" : "john", "age" : 29 }

{ "_id" : ObjectId("5678a410763ea69ae9780c65"), "name" : "hxc", "age" : 31 }

{ "_id" : ObjectId("5678a416763ea69ae9780c66"), "name" : "mongodb", "age" : 31 }

{ "_id" : ObjectId("5678a41d763ea69ae9780c67"), "name" : "redis", "age" : 29 }

执行命令

 db.runCommand({

  mapreduce:"person",

  map:function(){

      emit(this.age,this.name);		 //相当于group的key

   },

   reduce:function(key,values){	      //{key:26,values:["mary","jackson"]}

      return {"key":key,"values":values};

   },

   finalize:function(key,values){

      return {"age":key,"count":values.length};

   },

   out:"t"    //最终的存放结果

 })

db.runCommand({

  mapreduce:"person",

  map:function(){

      emit(this.age,this.name);

   },

   reduce:function(key,values){

      return {"key":key,"values":values};

   },

  out:"t"

 })

db.runCommand({

     mapreduce:"person",

     map:function(){

        emit(this.age,this.name)

     },

     reduce:function(key,values){

        return values.length;

      },

      out:"t",

     finalize:function(key,values){

       return values;

     },

     query:{"$where":function(){return this.age>28}}

})

db.person.find()

{ "_id" : ObjectId("5678a3fc763ea69ae9780c62"), "name" : "mary", "age" : 26 }

{ "_id" : ObjectId("5678a403763ea69ae9780c63"), "name" : "jackson", "age" : 26 }

{ "_id" : ObjectId("5678a40a763ea69ae9780c64"), "name" : "john", "age" : 29 }

{ "_id" : ObjectId("5678a410763ea69ae9780c65"), "name" : "hxc", "age" : 31 }

{ "_id" : ObjectId("5678a416763ea69ae9780c66"), "name" : "mongodb", "age" : 31 }

{ "_id" : ObjectId("5678a41d763ea69ae9780c67"), "name" : "redis", "age" : 29 }

db.runCommand({

...      mapreduce:"person",

...      map:function(){

...         emit(this.age,this.name)

...      },

...      reduce:function(key,values){

...         return {"key":key,"values":values}

...       },

...       out:"t"

... })

{

	"result" : "t",

	"timeMillis" : 20,

	"counts" : {

		"input" : 6,

		"emit" : 6,

		"reduce" : 3,

		"output" : 3

	},

	"ok" : 1

}

 db.t.find()

{ "_id" : 26, "value" : { "key" : 26, "values" : [  "mary",  "jackson" ] } }

{ "_id" : 29, "value" : { "key" : 29, "values" : [  "john",  "redis" ] } }

{ "_id" : 31, "value" : { "key" : 31, "values" : [  "hxc",  "mongodb" ] } }

把 { "key" : 26, "values" : [ "mary", "jackson" ] } 整体的返回成一个 count就好了。。。

{ "_id" : 26, "value" : 2 }

{ "_id" : 29, "value" : 2 }

{ "_id" : 31, "value" : 2 }

——————————————————————————————

 db.t.find()

{ "_id" : 26, "value" : { "key" : 26, "values" : [  "mary",  "jackson" ] } }

{ "_id" : 29, "value" : { "key" : 29, "values" : [  "john",  "redis" ] } }

{ "_id" : 31, "value" : { "key" : 31, "values" : [  "hxc",  "mongodb" ] } }

 db.runCommand({

...      mapreduce:"person",

...      map:function(){

...         emit(this.age,this.name)

...      },

...      reduce:function(key,values){

...         return values.length;

...       },

...       out:"t"

... })

{

	"result" : "t",

	"timeMillis" : 14,

	"counts" : {

		"input" : 6,

		"emit" : 6,

		"reduce" : 3,

		"output" : 3

	},

	"ok" : 1

}

 db.t.find()

{ "_id" : 26, "value" : 2 }    //这个结果就是我们需要的。。。

{ "_id" : 29, "value" : 2 }

{ "_id" : 31, "value" : 2 }

我想把"_id" 替换成 "age", "value" 替换成 “count"

query条件的使用：

> db.t.find()

{ "_id" : 26, "value" : 2 }

{ "_id" : 29, "value" : 2 }

{ "_id" : 31, "value" : 2 }

> db.runCommand({

...      mapreduce:"person",

...      map:function(){

...         emit(this.age,this.name)

...      },

...      reduce:function(key,values){

...         return values.length;

...       },

...       out:"t",

...      finalize:function(key,values){

...        return values;

...      },

...      query:{"$where":function(){return this.age>28}}

... })

{

	"result" : "t",

	"timeMillis" : 69,

	"counts" : {

		"input" : 4,

		"emit" : 4,

		"reduce" : 2,

		"output" : 2

	},

	"ok" : 1

}

> db.t.find()

{ "_id" : 29, "value" : 2 }

{ "_id" : 31, "value" : 2 }

mongodb--reduce并行处理框架的更多相关文章

Hive数据分析——Spark是一种基于rdd（弹性数据集）的内存分布式并行处理框架，比于Hadoop将大量的中间结果写入HDFS，Spark避免了中间结果的持久化
转自:http://blog.csdn.net/wh_springer/article/details/51842496 近十年来,随着Hadoop生态系统的不断完善,Hadoop早已成为大数据事实上 ...
Morphia - mongodb之ORM框架
一.简介二.注解 1.@Entity 2.@Id3.@Indexed4.@Embedded5.@Transient和@Property6.@Reference 三.示例四.参考资料 Morphia ...
day96_11_28 mongoDB与scrapy框架
一.mongodb mongodb是一个面向文档的数据库,而不是关系型数据库.不采用关系型是为了获得更好的扩展性. 它与mysql的区别在于它没有表连接,但是可以通过其他办法实现. 安装数据库. 上官 ...
mongoose-面向对象操作mongodb的Nodejs框架
介绍无论是mysql还是mongodb,传统的与数据库交互的方式都是按照他们提供的API来写代码.它们提供的API往往不是很容易理解,而且难以记忆,如果传错了参数,写错一个符号都要查文档. ORM( ...
MongoDB的ORM框架——Morphia
1.引入pom <dependency> <groupId>org.mongodb.morphia</groupId> <artifactId>morp ...
Mongodb 的ORM框架 Morphia之注解
@Entity("bands") public class Band { @Id ObjectId id; String name; String genre; @Referenc ...
Mongodb 的ORM框架 Morphia 注解之 @Reference
public class BlogEntry { private String title; private Date publishDate; private String body; privat ...
[转]HIVE UDF/UDAF/UDTF的Map Reduce代码框架模板
FROM : http://hugh-wangp.iteye.com/blog/1472371 自己写代码时候的利用到的模板 UDF步骤: 1.必须继承org.apache.hadoop.hive ...
mean(bootstrap,angular,express,node,mongodb)通用后台框架
学习node,我这个毫无美感的程序员在bootstrap与node的感染下,向着“全栈工程师”迈进,呵呵! 最终选择如题的技术方案,这些东东都算比较新的,网上的资料比较少,参考了不少github程序及 ...

随机推荐

简述RTMPDump与编译移植
RTMPDump主页 ,RTMPDump库主要包含三部分: 1.一个基本的客户端程序 2.两个服务器程序(rtmpsrv.rtmpsuck) 3.一个支持rtmp协议的库—librtmp 下载RTMP ...
[Apple开发者帐户帮助]三、创建证书（7）创建证书签名请求
Mac上的Keychain Access允许您创建证书签名请求(CSR). 启动位于的Keychain Access /Applications/Utilities. 选择Keychain Acces ...
netty之ByteBuf详解
[ChannelPromise作用:可以设置success或failure 是为了通知ChannelFutureListener]Netty的数据处理API通过两个组件暴露——abstract cla ...
POJ 3468 线段树+状压
题意:给你n个数,有对区间的加减操作,问某个区间的和是多少. 思路:状压+线段树(要用lazy标记,否则会TLE) //By SiriusRen #include <cstdio> #in ...
POJ 3230 DP
f[i][j]=max(f[i][j],f[i-1][k]-a[k][j]+b[i][j]) i->第i天 j-–>到第j个城市 #include <cstdio> #incl ...
Laravel5.1学习笔记5 请求
HTTP 请求 #取得请求实例 #基本的请求信息 #PSR-7 请求 #取出输入数据 #旧的输入 #Cookies #文件 #取得请求实例(此部分文档5.1完全重写,注意) 要通过依赖注入获取当前HT ...
对学Oracle数据库初学者的开场篇
前言:因为项目原因,近期开始学习Oracle数据库.Oracle是目前最流行的数据库之一,功能强大,性能卓越,相对的学习的难度还是不小.我打算将自己的学习过程记录下来,做个积累,方便自己和其他的学习者 ...
读书笔记「Python编程：从入门到实践」_10.文件和异常
10.1 从文件中读取数据 10.1.1 读取整个文件 with open(~) as object: contents=object.read() with open('C:/Users/jou/ ...
monad - the Category hierachy
reading the "The Typeclassopedia" by Brent Yorgey in Monad.Reader#13 ,and found that " ...
taglib遍历foreach循环list集合
第一部导入jstl.jar 第二步进行list传输: package com.aaa.servlet; import com.aaa.dao.IUserDAO; import com.aaa.dao. ...

mongodb--reduce并行处理框架

reduce 命令

二：我们看一下注意事项

mongodb--reduce并行处理框架的更多相关文章

随机推荐

热门专题