from:https://my.oschina.net/chiyong/blog/289138

Mongodb 没有传统数据库的group函数,如果分组需要走MapReduce。这种MR与HadoopMR类似。下面看看Mongodb 的分组实现

现在又一张 表它的数据格式如下: 

 "_id" : ObjectId("53b224e0a1ae72328a57702c"), 
 "title" : "SECJ0118E", 
 "criteria" : "未找到对应的错误码", 
 "actual" : "1", 
 "effect" : "可能引起重大问题", 
 "suggestion" : "请专家提供意见", 
 "severity" : "Normal", 
 "status" : "NotOK", 
 "rtype" : "FormLoginExte", 
 "comment" : "[8/2/12 17:28:21:231 GMT+08:00] 0000001e FormLoginExte E SECJ0118E: Authentication error during authentication for user rpt", 
 "category" : "logs", 
 "time" : "0008-02-12 17:28:21" 


 "_id" : ObjectId("53b224e0a1ae72328a577052"), 
 "title" : "", 
 "criteria" : "未找到对应的错误码", 
 "actual" : "1", 
 "effect" : "可能引起重大问题", 
 "suggestion" : "请专家提供意见", 
 "severity" : "Normal", 
 "status" : "NotOK", 
 "rtype" : "servlet", 
 "comment" : "[8/2/12 19:04:41:891 CST] 0000000b servlet E com.ibm.ws.webcontainer.servlet.ServletWrapper init Uncaught.init.exception.thrown.by.servlet", 
 "category" : "logs", 
 "time" : "0008-02-12 19:04:41" 


 "_id" : ObjectId("53b224e0a1ae72328a576fdc"), 
 "title" : "系统资源设置[processes]", 
 "criteria" : "unlimited", 
 "actual" : "unlimited", 
 "effect" : "如果对用户资源做了limits限制,有可能造成应用运行失败或系统性能下降。", 
 "suggestion" : "建议修改/etc/security/limits,编辑root相关参数部分都为-1。", 
 "severity" : "None", 
 "status" : "OK", 
 "rtype" : "系统参数设置检查", 
 "comment" : "", 
 "category" : "params" 

1:单个条件分组

(1) 现在我们根据title进行分组 并且统计每个组的数量

db.runCommand({ mapreduce: "check_result", 
map : function Map() { 
//emit 函数中的key是唯一的,是分组条件 这里把title传递过来。
emit( 
 this.title, 
 {count: 1} 
); 
}, 
reduce : function Reduce(key, values) { 
   total=0;//定义一个变量total , values是一个数组 
for( var i in values){ 
 total +=values[i].count 
}

return {"count":total}; 
}, 
finalize : function Finalize(key, reduced) { 
return reduced; 
}, 
out : { inline : 1 } 
});

结果如下(结果中的_id键就是要分组的title 。value是分组后的值): 
 { "_id" : "" , "value" : { "count" : 113.0}} 
{ "_id" : "/tmp是否设置了t标志位" , "value" : { "count" : 21.0}} 
{ "_id" : "ASYN0080W" , "value" : { "count" : 120.0}} 
{ "_id" : "AppServer的JVM堆最大值" , "value" : { "count" : 6.0}} 
{ "_id" : "AppServer的JVM堆最小值" , "value" : { "count" : 6.0}} 
{ "_id" : "AppServer的JVM标准输出日志切换周期" , "value" : { "count" : 6.0}} 
{ "_id" : "AppServer的JVM标准输出日志回滚类型" , "value" : { "count" : 6.0}} 
{ "_id" : "AppServer的JVM标准错误日志切换周期" , "value" : { "count" : 6.0}} 
{ "_id" : "AppServer的JVM标准错误日志回滚类型" , "value" : { "count" : 6.0}} 
{ "_id" : "AppServer的WebContainer线程池最大值" , "value" : { "count" : 6.0}} 
{ "_id" : "AppServer的WebContainer线程池最小值" , "value" : { "count" : 6.0}} 
{ "_id" : "AppServer的通用JVM参数" , "value" : { "count" : 6.0}} 
{ "_id" : "AppServer的通用JVM参数-SystemGC" , "value" : { "count" : 6.0}} 
{ "_id" : "Audit是否打开" , "value" : { "count" : 21.0}} 
{ "_id" : "CWPKI0041W" , "value" : { "count" : 65.0}} 
{ "_id" : "CWPMC0017W" , "value" : { "count" : 7.0}} 
{ "_id" : "CWSAA0037W" , "value" : { "count" : 13.0}} 
{ "_id" : "Could not invoke an operation on object" , "value" : { "count" : 21.0}} 
{ "_id" : "DCSV0000W" , "value" : { "count" : 4.0}} 
{ "_id" : "DCSV1115W" , "value" : { "count" : 137.0}}

2:多个条件分组

(1) 现在我们根据title,status,severity进行分组 并且统计每个组的数量 
db.runCommand({ mapreduce: "check_result", 
map : function Map() { 
//emit 函数中的key是唯一的,是分组条件 
emit( 
{"title":this.title,"status":this.status,"serverity":this.severity} 

 {count: 1} 
); 
}, 
reduce : function Reduce(key, values) { 
   total=0;//定义一个变量total , values是一个数组 
for( var i in values){ 
 total +=values[i].count 
}

return {"count":total}; 
}, 
finalize : function Finalize(key, reduced) { 
return reduced; 
}, 
out : { inline : 1 } 
});

输出结果如下格式化:

{ "_id" : { "title" : "" , "status" : "NotOK"} , "value" : { "count" : 113.0}} 
{ "_id" : { "title" : "/tmp是否设置了t标志位" , "status" : "NotOK"} , "value" : { "count" : 21.0}} 
{ "_id" : { "title" : "ASYN0080W" , "status" : "NotOK"} , "value" : { "count" : 120.0}} 
{ "_id" : { "title" : "AppServer的JVM堆最大值" , "status" : "NotOK"} , "value" : { "count" : 6.0}} 
{ "_id" : { "title" : "AppServer的JVM堆最小值" , "status" : "NotOK"} , "value" : { "count" : 6.0}} 
{ "_id" : { "title" : "AppServer的JVM标准输出日志切换周期" , "status" : "NotOK"} , "value" : { "count" : 6.0}} 
{ "_id" : { "title" : "AppServer的JVM标准输出日志回滚类型" , "status" : "NotOK"} , "value" : { "count" : 6.0}} 
{ "_id" : { "title" : "AppServer的JVM标准错误日志切换周期" , "status" : "NotOK"} , "value" : { "count" : 6.0}} 
{ "_id" : { "title" : "AppServer的JVM标准错误日志回滚类型" , "status" : "NotOK"} , "value" : { "count" : 6.0}} 
{ "_id" : { "title" : "AppServer的WebContainer线程池最大值" , "status" : "NotOK"} , "value" : { "count" : 6.0}} 
{ "_id" : { "title" : "AppServer的WebContainer线程池最小值" , "status" : "NotOK"} , "value" : { "count" : 6.0}} 
{ "_id" : { "title" : "AppServer的通用JVM参数" , "status" : "NotOK"} , "value" : { "count" : 6.0}} 
{ "_id" : { "title" : "AppServer的通用JVM参数-SystemGC" , "status" : "NotOK"} , "value" : { "count" : 6.0}} 
{ "_id" : { "title" : "Audit是否打开" , "status" : "NotOK"} , "value" : { "count" : 21.0}} 
{ "_id" : { "title" : "CWPKI0041W" , "status" : "NotOK"} , "value" : { "count" : 65.0}} 
{ "_id" : { "title" : "CWPMC0017W" , "status" : "NotOK"} , "value" : { "count" : 7.0}} 
{ "_id" : { "title" : "CWSAA0037W" , "status" : "NotOK"} , "value" : { "count" : 13.0}} 
{ "_id" : { "title" : "Could not invoke an operation on object" , "status" : "NotOK"} , "value" : { "count" : 21.0}} 
{ "_id" : { "title" : "DCSV0000W" , "status" : "NotOK"} , "value" : { "count" : 4.0}} 
{ "_id" : { "title" : "DCSV1115W" , "status" : "NotOK"} , "value" : { "count" : 137.0}}

mongodb mapredReduce 多个条件分组(group by)的更多相关文章

  1. Oracle 表分组 group by和模糊查询like

    分组group by写法 select 字段名 from 表名 group by 字段名 查询这个字段名里的种类分组后可以加聚合函数select 字段名,聚合函数 from 表名 group by 字 ...

  2. mysql分组GROUP BY常用sql

    数据分组 GROUP BY GROUP BY可以根据一个或多个字段进行分组. 比如,根据prod_id分组: SELECT prod_id ,user_id FROM products GROUP B ...

  3. 第17课-数据库开发及ado.net 聚合函数,模糊查询like,通配符.空值处理.order by排序.分组group by-having.类型转换-cast,Convert.union all; Select 列 into 新表;字符串函数;日期函数

    第17课-数据库开发及ado.net 聚合函数,模糊查询like,通配符.空值处理.order by排序.分组group by-having.类型转换-cast,Convert.union all;  ...

  4. spring data jpa条件分组查询及分页

    原book对象 package com.shaying.domain; import javax.persistence.Column; import javax.persistence.Entity ...

  5. sql-多表查询JOIN与分组GROUP BY

    一.内部连接:两个表的关系是平等的,可以从两个表中获取数据.用ON表示连接条件 SELECT A.a,B.b FROM At AS A  INNER JOINT Bt AS B ON  A.m=B.n ...

  6. js将数组根据条件分组

    //将数组根据条件分组 function getTreeDateByParam(list, param, fun){ var data = {}; if(list && list.le ...

  7. MySQL数据分组Group By 和 Having

    现有以下的学生信息表: 若果现在想计算每个班的平均年龄,使用where的操作如下: SELECT Cno AS 班级, AVG(Sage) AS 平均年龄 FROM stu ; 这样的话,有多少个班就 ...

  8. TFS二次开发10——分组(Group)和成员(Member)

    TFS SDK 10 ——分组(Group)和成员(Member) 这篇来介绍怎样读取TFS服务器上的用户信息 首先TFS默认有如下分组(Group): SharePoint Web Applicat ...

  9. 【SQL】分组数据,过滤分组-group by , having

    学习笔记,原文来自http://blog.csdn.net/robinjwong/article/details/24845125 创建分组 - GROUP BY 分组是在SELECT语句的GROUP ...

随机推荐

  1. Xcode工程编译错误:“Cannot assign to 'self' outside of a method in the init family”

    #import <Foundation/Foundation.h> @interface EOCRectangle : NSObject<NSCoding> @property ...

  2. cocos2dx 常用的构建工具

    理编辑工具Physics Editing ToolsMekanimo 网址:http://www.mekanimo.net/PhysicsBench 网址:http://www.cocos2d-iph ...

  3. sqlserver binary varbinary image 的区别

    sqlserver binary varbinary image 的区别   binary   固定长度的二进制数据,其最大长度为 8,000 个字节.   varbinary   可变长度的二进制数 ...

  4. 抽屉之Tornado实战(6)--session工厂(工厂方法模式)

    我之前写的session一般保存在服务器的内存里,那可以保存在缓存,或是数据库,那问题来了,不同地方,保存方式是不同的,所以需要定义不同的类,cache/redis/memcached类 sessio ...

  5. Transparent HugePages(透明大页)

    Transparent HugePages(透明大页) 1. 介绍 从RedHat6, RedHat7, OL6, OL7 SLES11 and UEK2 kernels开始,透明大页默认是被开启的以 ...

  6. Web Deploy远程部署配置图解

    原文链接:https://jingyan.baidu.com/album/642c9d34e614de644a46f783.html

  7. Python 标准输出 sys.stdout 重定向(转)

    add by zhj: 其实很少使用sys.stdout,之前django的manage.py命令的源码中使用了sys.stdout和sys.stderr,所以专门查了一下 这两个命令与print的区 ...

  8. Redis分布式锁服务(转)

    原文:http://www.cnblogs.com/mushroom/p/4752499.html 概述 在多线程环境下,通常会使用锁来保证有且只有一个线程来操作共享资源.比如: object obj ...

  9. swift 相机、相册、定位的权限判断

    //是否开启相机权限 func IsOpenCamera() -> Bool{ let authStatus = AVCaptureDevice.authorizationStatus(for: ...

  10. Java基础知识(JAVA之泛型)

    什么是泛型?为什么要使用泛型? 泛型,即“参数化类型”.一提到参数,最熟悉的就是定义方法时有形参,然后调用此方法时传递实参.那么参数化类型怎么理解呢?顾名思义,就是将类型由原来的具体的类型参数化,类似 ...