Python中的分组函数（groupby、itertools）

from operator import itemgetter #itemgetter用来去dict中的key，省去了使用lambda函数

from itertools import groupby #itertool还包含有其他很多函数，比如将多个list联合起来。。

d1={'name':'zhangsan','age':20,'country':'China'}

d2={'name':'wangwu','age':19,'country':'USA'}

d3={'name':'lisi','age':22,'country':'JP'}

d4={'name':'zhaoliu','age':22,'country':'USA'}

d5={'name':'pengqi','age':22,'country':'USA'}

d6={'name':'lijiu','age':22,'country':'China'}

lst=[d1,d2,d3,d4,d5,d6]

#通过country进行分组：

lst.sort(key=itemgetter('country')) #需要先排序，然后才能groupby。lst排序后自身被改变

lstg = groupby(lst,itemgetter('country'))

#lstg = groupby(lst,key=lambda x:x['country']) 等同于使用itemgetter()

for key,group in lstg:

    for g in group: #group是一个迭代器，包含了所有的分组列表

        print key,g

返回：

China {'country': 'China', 'age': 20, 'name': 'zhangsan'}

China {'country': 'China', 'age': 22, 'name': 'lijiu'}

JP {'country': 'JP', 'age': 22, 'name': 'lisi'}

USA {'country': 'USA', 'age': 19, 'name': 'wangwu'}

USA {'country': 'USA', 'age': 22, 'name': 'zhaoliu'}

USA {'country': 'USA', 'age': 22, 'name': 'pengqi'}

print [key for key,group in lstg] #返回：['China', 'JP', 'USA']

print [(key,list(group)) for key,group in lstg]

#返回的list中包含着三个元组：

[('China', [{'country': 'China', 'age': 20, 'name': 'zhangsan'}, {'country': 'China', 'age': 22, 'name': 'lijiu'}]), ('JP', [{'country': 'JP', 'age': 22, 'name': 'lisi'}]), ('USA', [{'country': 'USA', 'age': 19, 'name': 'wangwu'}, {'country': 'USA', 'age': 22, 'name': 'zhaoliu'}, {'country': 'USA', 'age': 22, 'name': 'pengqi'}])]

print dict([(key,list(group)) for key,group in lstg])

#返回的是一个字典：

{'JP': [{'country': 'JP', 'age': 22, 'name': 'lisi'}], 'China': [{'country': 'China', 'age': 20, 'name': 'zhangsan'}, {'country': 'China', 'age': 22, 'name': 'lijiu'}], 'USA': [{'country': 'USA', 'age': 19, 'name': 'wangwu'}, {'country': 'USA', 'age': 22, 'name': 'zhaoliu'}, {'country': 'USA', 'age': 22, 'name': 'pengqi'}]}

print dict([(key,len(list(group))) for key,group in lstg])

#返回每个分组的个数：

{'JP': 1, 'China': 2, 'USA': 3}

#返回包含有2个以上元素的分组

print [key for key,group in groupby(sorted(lst,key=itemgetter('country')),itemgetter('country')) if len(list(group))>=2]

#返回：['China', 'USA']

lstg = groupby(sorted(lst,key=itemgetter('country')),key=itemgetter('country'))

lstgall=[(key,list(group)) for key,group in lstg ]

print dict(filter(lambda x:len(x[1])>2,lstgall))

#过滤出分组后的元素个数大于2个的分组，返回：

{'USA': [{'country': 'USA', 'age': 19, 'name': 'wangwu'}, {'country': 'USA', 'age': 22, 'name': 'zhaoliu'}, {'country': 'USA', 'age': 22, 'name': 'pengqi'}]}

自定义分组：

from itertools import groupby

lst=[2,8,11,25,43,6,9,29,51,66]

def gb(num):

    if num <= 10:

        return 'less'

    elif num >=30:

        return 'great'

    else:

        return 'middle'

print [(k,list(g))for k,g in groupby(sorted(lst),key=gb)]

返回：

[('less', [2, 6, 8, 9]), ('middle', [11, 25, 29]), ('great', [43, 51, 66])]

Python中的分组函数（groupby、itertools）的更多相关文章

python --- Python中的callable 函数
python --- Python中的callable 函数转自: http://archive.cnblogs.com/a/1798319/ Python中的callable 函数 callabl ...
python中使用zip函数出现<zip object at 0x02A9E418>
在Python中使用zip函数,出现<zip object at 0x02A9E418>错误的原因是,你是用的是python2点多的版本,python3.0对python做了改动 zip方 ...
[转载]python中multiprocessing.pool函数介绍
原文地址:http://blog.sina.com.cn/s/blog_5fa432b40101kwpi.html 作者:龙峰摘自:http://hi.baidu.com/xjtukanif/blo ...
Python 中的isinstance函数
解释: Python 中的isinstance函数,isinstance是Python中的一个内建函数语法: isinstance(object, classinfo) 如果参数object是cla ...
Python中的map()函数和reduce()函数的用法
Python中的map()函数和reduce()函数的用法这篇文章主要介绍了Python中的map()函数和reduce()函数的用法,代码基于Python2.x版本,需要的朋友可以参考下 Py ...
python中multiprocessing.pool函数介绍_正在拉磨_新浪博客
python中multiprocessing.pool函数介绍_正在拉磨_新浪博客 python中multiprocessing.pool函数介绍 (2010-06-10 03:46:5 ...
举例详解Python中的split()函数的使用方法
这篇文章主要介绍了举例详解Python中的split()函数的使用方法,split()函数的使用是Python学习当中的基础知识,通常用于将字符串切片并转换为列表,需要的朋友可以参考下函数:sp ...
python中的生成器函数是如何工作的？
以下内容基于python3.4 1. python中的普通函数是怎么运行的? 当一个python函数在执行时,它会在相应的python栈帧上运行,栈帧表示程序运行时函数调用栈中的某一帧.想要获得某个函 ...
python中的map()函数
MapReduce的设计灵感来自于函数式编程,这里不打算提MapReduce,就拿python中的map()函数来学习一下. 文档中的介绍在这里: map(function, iterable, .. ...

随机推荐

nova scheduler 介绍
在 openstack 中,scheduler 负责从宿主机(运行 nova-compute 的节点)中根据一系列的算法和参数(CPU 核数,可用 RAM,镜像类型等 )选择出来一个,来部署虚拟机(i ...
面试题----C语言中exit和return的区别
C语言中return和exit的区别 exit用于结束进程,返回的状态码是给操作系统使用或父进程使用的.return是堆栈返回,返回的值是给主调函数用的.主线程结束前会默认调用exit结束进程. ex ...
google 被墙的解决办法
昨晚无意中发现的东西,分享给各位使用,google搜索技术方面的东西还是很准确的,可惜被墙了,但是上有政策下有对策…… 谷歌地址: http://74.125.224.18/ http://91.21 ...
Spring Actuator源码分析（转）
转自:http://blog.csdn.net/wsscy2004/article/details/50166333 Actuator Endpoint Actuator模块通过Endpoint暴露一 ...
Java NIO系列教程（七） FileChannel
Java NIO中的FileChannel是一个连接到文件的通道.可以通过文件通道读写文件. FileChannel无法设置为非阻塞模式,它总是运行在阻塞模式下. 打开FileChannel 在使用F ...
CentOS7 apache
1.准备环境 centos7最小化安装 yum安装wget.vim.gcc.gcc-c++.cmake 2.安装apache2.4.10 官网:http://httpd.apache.org/ 下载源 ...
在使用Git提交代码的时候犯了个低级错误
今天在使用git提交代码的时候,犯了个很低级的错误,按照一切流程当我add并commit提交代码,最后使用push到远程仓库, 接下来奇怪的事情发生了,push之后,查看远程仓库代码并没有发现提交记录 ...
读jQuery源码释疑笔记
本释疑笔记是针对自己在看源码的过程中遇到的一些问题的解答,对大众可能不具有参考性,不过可以看看有没有你也不懂得地方,相互学习,相互进步. 1.each的用法之前对each的用法一直迷迷糊糊,这次终 ...
Spring学习之路-从入门到放弃
后台框架是真难入门啊!!!IDE的使用,环境的搭建,框架下载,上手,每一步都恶心人. 花了整整两天,才学会用idea,并且初步了解了maven(TM就是一个npm),然后跟着下载了对应的jar包,搭建 ...
(第一篇) 一步一步带你了解linq to Object
要想学好linq to object 我们必须要先学习lambda 表达式,学习lambda 表达式呢我们必须了解匿名函数和匿名类及扩展方法,学习匿名函数,我们必须学会委托,这是本文的宗旨.下面开始第 ...

Python中的分组函数（groupby、itertools）

Python中的分组函数（groupby、itertools）的更多相关文章

随机推荐

热门专题