Python数据结构常用模块：collections、heapq、operator、itertools

collections

　　collections是日常工作中的重点、高频模块，常用类型有：

　　计数器（Counter）

　　双向队列（deque）

　　默认字典（defaultdict）

　　有序字典（OrderedDict）

　　可命名元组（namedtuple）　

1. Counter

　　Counter作为字典dicit（）的一个子类用来进行hashtable计数，将元素进行数量统计，计数后返回一个字典，键值为元素，值为元素个数

　　常用方法：

most_common(int)	按照元素出现的次数进行从高到低的排序，返回前int个元素的字典
elements	返回经过计算器Counter后的元素，返回的是一个迭代器
update	和set集合的update一样，对集合进行并集更新
substract	和update类似，只是update是做加法，substract做减法,从另一个集合中减去本集合的元素
iteritems	返回由Counter生成的字典的所有item
iterkeys	返回由Counter生成的字典的所有key
itervalues	返回由Counter生成的字典的所有value

　　示例：

#coding=utf-8

from collections import Counter

str = "abcbcaccbbad"

li = ["a","b","c","a","b","b"]

d = {"":3, "":2, "":2}

#Counter获取各元素的个数，返回字典

print ("Counter(s):", Counter(str))

print ("Counter(li):", Counter(li))

print ("Counter(d):", Counter(d))

#most_common(int)按照元素出现的次数进行从高到低的排序，返回前int个元素的字典

d1 = Counter(str)

print ("d1.most_common(2):",d1.most_common(2))

#elements返回经过计算器Counter后的元素，返回的是一个迭代器

print ("sorted(d1.elements()):", sorted(d1.elements()))

print ('''("".join(d1.elements())):''',"".join(d1.elements()))

#若是字典的话返回value个key

d2 = Counter(d)

print("若是字典的话返回value个key:", sorted(d2.elements()))

#update和set集合的update一样，对集合进行并集更新

print ("d1.update("sas1"):",d1.update("sas1"))

>>>> Counter(s): Counter({'b': 4, 'c': 4, 'a': 3, 'd': 1})
>>>> Counter(li): Counter({'b': 3, 'a': 2, 'c': 1})
>>>> Counter(d): Counter({'1': 3, '3': 2, '17': 2})
>>>> d1.most_common(2): [('b', 4), ('c', 4)]
>>>> sorted(d1.elements()): ['a', 'a', 'a', 'b', 'b', 'b', 'b', 'c', 'c', 'c', 'c', 'd']
>>>> ("".join(d1.elements())): aaabbbbccccd
>>>> ['1', '1', '1', '17', '17', '3', '3']

2. deque

　　deque属于高性能的数据结构之一，常用方法如下：

append	队列右边添加元素
appendleft	队列左边添加元素
clear	清空队列中的所有元素
count	返回队列中包含value的个数
extend	队列右边扩展，可以是列表、元组或字典，如果是字典则将字典的key加入到deque
extendleft	同extend，在左边扩展
pop	移除并返回队列右边的元素
popleft	移除并返回队列左边的元素
remove（value）	移除队列第一个出现的元素
reverse	队列的所有元素进行反转
rotate（n）	对队列数进行移动

3. defaultdict

　　默认字典，字典的一个子类，继承所有字典的方法，默认字典在进行定义初始化的时候得指定字典值有默认类型

dic = defaultdict(dict)

　　dic["k1"].update({"asdsa":""}) 

　　print (dic)

>>> defaultdict(<class 'dict'>, {'k1': {'asdsa': ''}})

　　注：字典dic在定义的时候就定义好了值为字典类型,虽然现在字典中还没有键值 k1，但仍然可以执行字典的update方法. 这种操作方式在传统的字典类型中是无法实现的,必须赋值以后才能进行值得更新操作，否则会报错。

4. OrderedDict

　　有序字典也是字典的一个子类

　　传统方法进行字典排序

#定义传统字典

dic1 = dict()

# 按顺序添加字典内容

dic1['a'] = ''

dic1['b'] = 'jjj'

dic1['c'] = ''

dic1['d'] = ''

print(dic1)    # 结果： {'a': '123', 'c': '394', 'b': 'jjj', 'd': '999'}

# 排序

dic1_key_list = []

for k in dic1.keys():

    dic1_key_list.append(k)

dic1_key_list.sort()

for key in dic1_key_list:

    print('dic1字典排序结果 %s:%s' %(key,dic1[key]))

　　使用OrderedDict对字典进行排序

#定义有序字典

dic2 = OrderedDict()

dic2['a'] = ''

dic2['b'] = 'jjj'

dic2['c'] = 'abc'

dic2['d'] = ''

for k, v in dic2.iteritems():

    print('有序字典：%s:%s' %(k,v))

5. namedtuple

　　namedtuple由自己的类工厂namedtuple()进行创建，而不是由表中的元组进行初始化，通过namedtuple创建类的参数包括类名称和一个包含元素名称的字符串

　　常用方法示例：

#coding=utf-8

from collections import namedtuple

p = namedtuple("person", "name,age,sex")

print (type(p))

zhanglin = p("zhanglin",30,"male")

print(zhanglin)

print(zhanglin.name,zhanglin.age)

　>>> <class 'type'>
　>>> person(name='zhanglin', age=30, sex='male')
　>>> zhanglin 30

　　rename参数使用

　　使用namedtuple()来创建类的时候，传递的成员属性参数名称不能非法(不能重复，不能为系统标识符)，否则会报错

try:

    pp = namedtuple("person","name,age,class,sex")

    print(pp._fields)

    lili = pp("lili",20,"aa","male")

except Exception as e:

    print("error",e)

　>>> error Type names and field names cannot be a keyword: 'class'

　　输入错误非我们可以控制，namedtuple提供rename=True参数会使系统自动的将错误的参数通过“下划线+参数索引”的方式将参数名称替换

try:

    pp = namedtuple("person","name,age,class,sex",rename=True)

    print(pp._fields)

    lili = pp("lili",20,"aa","male")

except Exception as e:

    print("error",e)

　>>> ('name', 'age', '_2', 'sex')

Python常用数据结构之collections模块的更多相关文章

Python常用数据结构之heapq模块
Python数据结构常用模块:collections.heapq.operator.itertools heapq 堆是一种特殊的树形结构,通常我们所说的堆的数据结构指的是完全二叉树,并且根节点的值小 ...
Python常用内置模块之xml模块
xml即可扩展标记语言,它可以用来标记数据.定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言.从结构上,很像HTML超文本标记语言.但他们被设计的目的是不同的,超文本标记语言被设计用来显示 ...
Python 入门之内置模块 -- collections模块
Python 入门之内置模块 -- collections模块 1.collections -- 基于Python自带的数据类型之上额外增加的几个数据类型 from collections 在内 ...
Python常用的内建模块
PS:Python之所以自称“batteries included”,就是因为内置了许多非常有用的模块,无需额外安装和配置,即可直接使用.下面就来看看一些常用的内建模块. 参考原文廖雪峰常用的内建模 ...
python常用数据结构讲解
一:序列在数学上,序列是被排成一排的对象,而在python中,序列是最基本的数据结构.它的主要特征为拥有索引,每个索引的元素是可迭代对象.都可以进行索引,切片,加,乘,检查成员等操作.在py ...
python基础学习笔记——collections模块
在内置数据类型(dict.list.set.tuple)的基础上,collections模块还提供了几个额外的数据类型:Counter.deque.defaultdict.namedtuple和Ord ...
python常用数据结构(1)
python中有四种最常用的数据结构,分别是列表(list),字典(dict),集合(set)和元组(tuple) 下面简单描述下它们的区别和联系 1.初始化不得不说,python数据结构的初始化比 ...
Python常用数据结构（列表）
Python中常用的数据结构有序列(如列表,元组,字符串),映射(如字典)以及集合(set),是主要的三类容器内容序列的基本概念列表的概念和用法元组的概念和用法字典的概念和用法各类型之间的 ...
python常用数据结构(2)
1.有名字的元组——namedtuple >>> from collections import namedtuple >>> Point = namedtuple ...

随机推荐

P2045 方格取数加强版
P2045 方格取数加强版题目描述给出一个n*n的矩阵,每一格有一个非负整数Aij,(Aij <= 1000)现在从(1,1)出发,可以往右或者往下走,最后到达(n,n),每达到一格,把该格 ...
2017-06-24(chgrp umask alias unalias)
chgrp chgrp 组名文件名 chgrp root newfile 将newfile的所属组修改为root umask umask 查看默认权限 0 022 文件的特殊权限文件的默认 ...
Python 字符串大小写操作
#coding=utf-8 #python中字符串的操作 # 字符串的大小写 s='hello_wOrld_oF_you' upper_str = s.upper() print('全部大写: ',u ...
alwaysOn中关于维护计划的应用方案
由于alwaysOn环境下主副本所在的实际服务器不固定, 所以我目前采取的方案是创建维护计划的时候, 在各个服务器上创建一份维护计划. (假设有2个服务器需要故障转移, 那么就在这两个服务器上分别创建 ...
java IO(四)：键盘录入
*/ .hljs { display: block; overflow-x: auto; padding: 0.5em; color: #333; background: #f8f8f8; } .hl ...
CURL post/get提交
public function curlss($url){ $curl = curl_init(); // 设置你需要抓取的URL curl_setopt($curl, CURLOPT_URL, $u ...
html的标签
<a>:anchor 定义锚 <abbr>:abbreviation 定义缩写 <acronym>: 定义只取消首字母的缩写 <address>:定义地 ...
GO开发[六]：golang反射（reflect）
反射反射:可以在运行时动态获取变量的相关信息 Import ("reflect") reflect.TypeOf,获取变量的类型,返回reflect.Type类型 refle ...
使用localhost可以访问，但使用本地ip+端口号无法访问
今天想使用ip访问本机的iview-admin项目,结果怎么配置都无法访问,根据iview工程执行的命令npm run dev了解到是webpack配置的问题,打开工程里的node_modules文件 ...
Object Detection · RCNN论文解读
转载请注明作者:梦里茶 Object Detection,顾名思义就是从图像中检测出目标对象,具体而言是找到对象的位置,常见的数据集是PASCAL VOC系列.2010年-2012年,Object D ...

Python常用数据结构之collections模块

collections

1. Counter

常用方法：

示例：

2. deque

3. defaultdict

4. OrderedDict

传统方法进行字典排序

使用OrderedDict对字典进行排序

5. namedtuple

rename参数使用

使用namedtuple()来创建类的时候，传递的成员属性参数名称不能非法(不能重复，不能为系统标识符)，否则会报错

输入错误非我们可以控制，namedtuple提供rename=True参数会使系统自动的将错误的参数通过“下划线+参数索引”的方式将参数名称替换

Python常用数据结构之collections模块的更多相关文章

随机推荐

热门专题

　　常用方法：

　　示例：

　　传统方法进行字典排序

　　使用OrderedDict对字典进行排序

　　rename参数使用

　　使用namedtuple()来创建类的时候，传递的成员属性参数名称不能非法(不能重复，不能为系统标识符)，否则会报错

　　输入错误非我们可以控制，namedtuple提供rename=True参数会使系统自动的将错误的参数通过“下划线+参数索引”的方式将参数名称替换