reduce 命令

db.runCommand(

               {

                 mapReduce: <collection>,

                 map: <function>,

                 reduce: <function>,

                 finalize: <function>,

                 out: <output>,

                 query: <document>,

                 sort: <document>,

                 limit: <number>,

                 scope: <document>,

                 jsMode: <boolean>,

                 verbose: <boolean>,

                 bypassDocumentValidation: <boolean>

               }

             )

mapReduce 你要做并行处理的集合名字
map：分组依据， emit(key,value) => key => group的key，value => 是你key的数组 key=25, values=【“jack","mary"]
reduce: function(key,values) 里面有两个参数，第一个参数是key：group操作的key，第二个参数是values：我们刚才说到的【数组】，类似group中的finalize函数。
finalize：这个呢，还是和group中的 finalize 一样，会对每组的结构进行一个最后修改。也可以不修改。
out：就是我们进行mapreduce之后，将结果存放的位置，一般是“集合类型“。
query: 这个很简单，和group的query一样
sort：一样的到底，对map操作之前的文档进行排序。
limit：在map之前限制文档的个数
scope：给reduce,query之类的函数提供变量访问。
我们常用到的是： mapReduce， map，reduce， out，query，

二：我们看一下注意事项

我们还是用一个person集合，其中有name和age。

上一节课程我们将group的时候，做了一个对age进行分组的一个例子

｛age:26,count:2｝

｛age:29,count:2｝

｛age:31,count:2｝

第一步：插入数据源

> db.person.find()

{ "_id" : ObjectId("5678a3fc763ea69ae9780c62"), "name" : "mary", "age" : 26 }

{ "_id" : ObjectId("5678a403763ea69ae9780c63"), "name" : "jackson", "age" : 26 }

{ "_id" : ObjectId("5678a40a763ea69ae9780c64"), "name" : "john", "age" : 29 }

{ "_id" : ObjectId("5678a410763ea69ae9780c65"), "name" : "hxc", "age" : 31 }

{ "_id" : ObjectId("5678a416763ea69ae9780c66"), "name" : "mongodb", "age" : 31 }

{ "_id" : ObjectId("5678a41d763ea69ae9780c67"), "name" : "redis", "age" : 29 }

执行命令

 db.runCommand({

  mapreduce:"person",

  map:function(){

      emit(this.age,this.name);		 //相当于group的key

   },

   reduce:function(key,values){	      //{key:26,values:["mary","jackson"]}

      return {"key":key,"values":values};

   },

   finalize:function(key,values){

      return {"age":key,"count":values.length};

   },

   out:"t"    //最终的存放结果

 })

db.runCommand({

  mapreduce:"person",

  map:function(){

      emit(this.age,this.name);

   },

   reduce:function(key,values){

      return {"key":key,"values":values};

   },

  out:"t"

 })

db.runCommand({

     mapreduce:"person",

     map:function(){

        emit(this.age,this.name)

     },

     reduce:function(key,values){

        return values.length;

      },

      out:"t",

     finalize:function(key,values){

       return values;

     },

     query:{"$where":function(){return this.age>28}}

})

db.person.find()

{ "_id" : ObjectId("5678a3fc763ea69ae9780c62"), "name" : "mary", "age" : 26 }

{ "_id" : ObjectId("5678a403763ea69ae9780c63"), "name" : "jackson", "age" : 26 }

{ "_id" : ObjectId("5678a40a763ea69ae9780c64"), "name" : "john", "age" : 29 }

{ "_id" : ObjectId("5678a410763ea69ae9780c65"), "name" : "hxc", "age" : 31 }

{ "_id" : ObjectId("5678a416763ea69ae9780c66"), "name" : "mongodb", "age" : 31 }

{ "_id" : ObjectId("5678a41d763ea69ae9780c67"), "name" : "redis", "age" : 29 }

db.runCommand({

...      mapreduce:"person",

...      map:function(){

...         emit(this.age,this.name)

...      },

...      reduce:function(key,values){

...         return {"key":key,"values":values}

...       },

...       out:"t"

... })

{

	"result" : "t",

	"timeMillis" : 20,

	"counts" : {

		"input" : 6,

		"emit" : 6,

		"reduce" : 3,

		"output" : 3

	},

	"ok" : 1

}

 db.t.find()

{ "_id" : 26, "value" : { "key" : 26, "values" : [  "mary",  "jackson" ] } }

{ "_id" : 29, "value" : { "key" : 29, "values" : [  "john",  "redis" ] } }

{ "_id" : 31, "value" : { "key" : 31, "values" : [  "hxc",  "mongodb" ] } }

把 { "key" : 26, "values" : [ "mary", "jackson" ] } 整体的返回成一个 count就好了。。。

{ "_id" : 26, "value" : 2 }

{ "_id" : 29, "value" : 2 }

{ "_id" : 31, "value" : 2 }

——————————————————————————————

 db.t.find()

{ "_id" : 26, "value" : { "key" : 26, "values" : [  "mary",  "jackson" ] } }

{ "_id" : 29, "value" : { "key" : 29, "values" : [  "john",  "redis" ] } }

{ "_id" : 31, "value" : { "key" : 31, "values" : [  "hxc",  "mongodb" ] } }

 db.runCommand({

...      mapreduce:"person",

...      map:function(){

...         emit(this.age,this.name)

...      },

...      reduce:function(key,values){

...         return values.length;

...       },

...       out:"t"

... })

{

	"result" : "t",

	"timeMillis" : 14,

	"counts" : {

		"input" : 6,

		"emit" : 6,

		"reduce" : 3,

		"output" : 3

	},

	"ok" : 1

}

 db.t.find()

{ "_id" : 26, "value" : 2 }    //这个结果就是我们需要的。。。

{ "_id" : 29, "value" : 2 }

{ "_id" : 31, "value" : 2 }

我想把"_id" 替换成 "age", "value" 替换成 “count"

query条件的使用：

> db.t.find()

{ "_id" : 26, "value" : 2 }

{ "_id" : 29, "value" : 2 }

{ "_id" : 31, "value" : 2 }

> db.runCommand({

...      mapreduce:"person",

...      map:function(){

...         emit(this.age,this.name)

...      },

...      reduce:function(key,values){

...         return values.length;

...       },

...       out:"t",

...      finalize:function(key,values){

...        return values;

...      },

...      query:{"$where":function(){return this.age>28}}

... })

{

	"result" : "t",

	"timeMillis" : 69,

	"counts" : {

		"input" : 4,

		"emit" : 4,

		"reduce" : 2,

		"output" : 2

	},

	"ok" : 1

}

> db.t.find()

{ "_id" : 29, "value" : 2 }

{ "_id" : 31, "value" : 2 }

mongodb--reduce并行处理框架的更多相关文章

Hive数据分析——Spark是一种基于rdd（弹性数据集）的内存分布式并行处理框架，比于Hadoop将大量的中间结果写入HDFS，Spark避免了中间结果的持久化
转自:http://blog.csdn.net/wh_springer/article/details/51842496 近十年来,随着Hadoop生态系统的不断完善,Hadoop早已成为大数据事实上 ...
Morphia - mongodb之ORM框架
一.简介二.注解 1.@Entity 2.@Id3.@Indexed4.@Embedded5.@Transient和@Property6.@Reference 三.示例四.参考资料 Morphia ...
day96_11_28 mongoDB与scrapy框架
一.mongodb mongodb是一个面向文档的数据库,而不是关系型数据库.不采用关系型是为了获得更好的扩展性. 它与mysql的区别在于它没有表连接,但是可以通过其他办法实现. 安装数据库. 上官 ...
mongoose-面向对象操作mongodb的Nodejs框架
介绍无论是mysql还是mongodb,传统的与数据库交互的方式都是按照他们提供的API来写代码.它们提供的API往往不是很容易理解,而且难以记忆,如果传错了参数,写错一个符号都要查文档. ORM( ...
MongoDB的ORM框架——Morphia
1.引入pom <dependency> <groupId>org.mongodb.morphia</groupId> <artifactId>morp ...
Mongodb 的ORM框架 Morphia之注解
@Entity("bands") public class Band { @Id ObjectId id; String name; String genre; @Referenc ...
Mongodb 的ORM框架 Morphia 注解之 @Reference
public class BlogEntry { private String title; private Date publishDate; private String body; privat ...
[转]HIVE UDF/UDAF/UDTF的Map Reduce代码框架模板
FROM : http://hugh-wangp.iteye.com/blog/1472371 自己写代码时候的利用到的模板 UDF步骤: 1.必须继承org.apache.hadoop.hive ...
mean(bootstrap,angular,express,node,mongodb)通用后台框架
学习node,我这个毫无美感的程序员在bootstrap与node的感染下,向着“全栈工程师”迈进,呵呵! 最终选择如题的技术方案,这些东东都算比较新的,网上的资料比较少,参考了不少github程序及 ...

随机推荐

mysql数据库操作（2）
上一篇文章我们接触了一些常用的 mysql 语句,当我们需要产生复杂的逻辑的时候,我们需要组合mysql语句,这时候的 mysql 语句又臭又长,那么我们就有必要知道 mysql 语句执行的顺序了. ...
B1270 [BeijingWc2008]雷涛的小猫 dp
这个题的原始方法谁都会,但是n^3会T.之后直接优化,特别简单,就是每次处理出来每层的最大值,而不用枚举.之前没这么做是因为觉得在同一棵树的时候没有下落,所以不能用这个方法.后来想明白了,在同一棵树上 ...
maven变量
一.pom文件,maven内置变量 ${basedir} 项目根目录 ${project.build.directory} 构建目录,缺省为target ${project.build.outputD ...
Coursera Algorithms week3 快速排序练习测验: Nuts and bolts
题目原文: Nuts and bolts. A disorganized carpenter has a mixed pile of n nuts and n bolts. The goal is t ...
(Go)07.Go语言中strings和strconv包示例代码详解02
1.strings使用统计字符串出现次数 strings.Count(s string, substr string) int Count 用于计算字符串 substr 在字符串 s 中出现的非重叠 ...
Django day15 (二) csrf的跨站请求伪造与局部禁用 , 局部使用
一: csrf 的跨站请求伪造二: csrf 的局部禁用 , 局部使用
tpshop编辑框中上传图片过大变模糊
tpshop编辑框中上传图片过大变模糊图片超过2500的高就会变模糊设置最大的高度修改一下
# 深入理解Redis（二）——内存管理的建议与技巧
引语随着使用Redis的深入,我们不可避免的需要深入了解优化Redis的内存,本章将重点讲解Redis的内存优化之道,同时推荐大家阅读memory-optimization一文. 想要高效的使用Re ...
wap 5.23 网测几道题目
1. n个犯人,m个省份, 如果相邻的2个犯人来自同一省份,则是不安全的,求不安全的个数. 正难则反,用全部的个数减去非法的个数,就是最后的答案. m^n - m * (m - 1) ^ (n - 1 ...
【Leetcode】376. Wiggle Subsequence
Description: A sequence of numbers is called a wiggle sequence if the differences between successive ...

mongodb--reduce并行处理框架

reduce 命令

二：我们看一下注意事项

mongodb--reduce并行处理框架的更多相关文章

随机推荐

热门专题