python模块之collections

我们都知道，Python拥有一些内置的数据类型，比如str, int, list, tuple, dict等， collections模块在这些内置数据类型的基础上，提供了几个额外的数据类型：

（1）namedtuple(): 生成可以使用名字来访问元素内容的tuple子类
（2）deque: 双端队列，可以快速的从另外一侧追加和推出对象
（3）Counter: 计数器，主要用来计数
（4）OrderedDict: 有序字典
（5）defaultdict: 带有默认值的字典

=>namedtuple(typename, field_names, verbose=False, rename=False)

比如我们用户拥有一个这样的数据结构，每一个对象是拥有三个元素的tuple。
使用namedtuple方法就可以方便的通过tuple来生成可读性更高也更好用的数据结构

wdebsites = [

('Sohu', 'http://www.google.com/', '张朝阳'),

('Sina', 'http://www.sina.com.cn/', '王志东'),

('163', 'http://www.163.com/', '丁磊')

]

Website = namedtuple('Website', ['name', 'url', 'founder'])

for website in websites:

website = Website._make(website)

print (website)

Result:

Website(name='Sohu', url='http://www.google.com/', founder='张朝阳')

Website(name='Sina', url='http://www.sina.com.cn/', founder='王志东')

Website(name='163', url='http://www.163.com/', founder='丁磊')

=>deque(iterable,maxlen)

deque其实是double-ended queue的缩写，翻译过来就是双端队列，它最大的好处就是实现了从队列头部快速增加和取出对象: .popleft(), .appendleft()。原生的List也能从头部添加和去除对象，l.insert(0, v)、l.pop(0)。但是值得注意的是，list对象的这两种用法的时间复杂度是O(n)，也就是说随着元素数量的增加耗时呈线性上升。而使用deque对象则是O(1) 的复杂度，所以当你的代码有这样的需求的时候，一定要记得使用deque。

作为一个双端队列，deque还提供了一些其他的好用方法，比如 rotate等。

append(x):从队列末尾添加x

appendleft(x):从队列头部添加x

clear():清空队列

count(x):返回队列中x的数量

extend(iterable):在队列的尾部添加多个元素

extendleft(iterable):在队列的头部添加多个元素，反序插入（字母表相反顺序）

pop():将尾部一个元素移除

popleft():将头部一个元素移除

remove(x):将队列中第一次出现的x元素移除

reverse():将队列元素逆置

rotate(n):将队列尾部的n个元素添加到头部 rotate(1)等价于:d.appendleft(d.pop())

D.maxlen:返回队列的长度，如果是无界则返回None（定义的时候可以指定maxlen，否则默认是无界队列）

Example:

>>>d=collections.deque("gsgwqeasas")

>>> d

deque(['g', 's', 'g', 'w', 'q', 'e', 'a', 's', 'a', 's'])

>>> s=list(d)

>>> s

['w', 'g', 'g', 's', 'a', 's', 'a', 'e', 'q']

=>Counter(iterable or mapping) #可迭代或者映射的对象

计数器是一个非常常用的功能需求。

elements():返回一个重复元素的迭代器，重复次数和计数的次数一样多。元素以任意顺序返回。如果一个元素的计数小于1，elements()会忽略它。

most_common([n]):返回n个计数器元素，若未指定n，则返回计数器的所有元素

update(iterable or mapping):增加计数器元素，元素可以来源于迭代对象或者一个Counter对象

Example:

>>> s

['w', 'g', 'g', 's', 'a', 's', 'a', 'e', 'q']

>>> c=collections.Counter(s)

>>> c

Counter({'g': 2, 'a': 2, 's': 2, 'e': 1, 'q': 1, 'w': 1})

>>> list(c)

['e', 'q', 'g', 'w', 'a', 's']

>>> dict(c)

{'a': 2, 'q': 1, 'g': 2, 'w': 1, 'e': 1, 's': 2}

>>> list(c.elements())

['e', 'q', 'g', 'g', 'w', 'a', 'a', 's', 's']

>>> c.most_common(4)

[('g', 2), ('a', 2), ('s', 2), ('e', 1)]

>>> c.update('fds')

>>> c

Counter({'s': 3, 'g': 2, 'a': 2, 'e': 1, 'q': 1, 'w': 1, 'f': 1, 'd': 1})

>>> c.update(c)

>>> c

Counter({'s': 6, 'g': 4, 'a': 4, 'e': 2, 'q': 2, 'w': 2, 'f': 2, 'd': 2})

>>>

=>OrderedDict(items)

在Python中，dict这个数据结构由于hash的特性，是无序的，这在有的时候会给我们带来一些麻烦，幸运的是，collections模块为我们提供了OrderedDict，当你要获得一个有序的字典对象时，用它就对了。

popitem(last=True):移除字典对象元素，last=True时“后进先出”，last=False时“先进先出”

move_to_end(key,last=True):将字典中一个已经存在的键移动到头部或者尾部。last=True时，移动到尾部，last=False时，移动到头部。

Example:

>>> d

{'w': 2, 'a': 4, 'f': 2, 'q': 2, 'g': 4, 'd': 2, 'e': 2, 's': 6}

>>> n=collections.OrderedDict(d)

>>> n

OrderedDict([('w', 2), ('a', 4), ('f', 2), ('q', 2), ('g', 4), ('d', 2), ('e', 2), ('s', 6)])

>>> n.popitem()

('s', 6)

>>> n

OrderedDict([('a', 4), ('f', 2), ('q', 2), ('g', 4), ('d', 2), ('e', 2)])

>>> n.move_to_end('f')

>>> n

OrderedDict([('a', 4), ('q', 2), ('g', 4), ('d', 2), ('e', 2), ('f', 2)])

=>defaultdict

我们都知道，在使用Python原生的数据结构dict的时候，如果用 d[key] 这样的方式访问，当指定的key不存在时，是会抛出KeyError异常的。

但是，如果使用defaultdict，只要你传入一个默认的工厂方法，那么请求一个不存在的key时，便会调用这个工厂方法使用其结果来作为这个key的默认值。

Example:

>>> s = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)]

>>> d = defaultdict(list)

>>> for k, v in s:

d[k].append(v)

>>> list(d.items())

[('blue', [2, 4]), ('red', [1]), ('yellow', [1, 3])]

>>> m =dict()

>>> m["a"]

Traceback (most recent call last):

File"<stdin>", line1,in<module>

KeyError: "a"

>>>

>>> m =collections.defaultdict(int)

>>> m["a"]

>>> m["b"]

>>> m =collections.defaultdict(str)

>>> m["a"]

>>> m["b"]+="a"

>>> m["b"]

"a"

>>> m =collections.defaultdict(lambda:"[default value]")

>>> m["a"]

"[default value]"

>>> m["b"]

"[default value]"

python模块之collections的更多相关文章

python模块介绍- collections(5)-OrderedDict 有序字典
1.3.5 OrderedDict 有序字典 OrderedDict是dict的子类,它记住了内容添加的顺序. import collections print 'Regular dictionary ...
Python模块：collections
collections模块常用的数据类型: (1)namedtuple(): #创建一个自定义的tuple对象,并且规定了tuple元素的个数,并可以用属性而不是索引来引用tuple的某个元素. fr ...
python模块之collections random
collections 在内置数据类型(list, dict, tuple, set)的基础上,collections提供了几个额外的数据类型: Counter, deque, Orderdict, ...
python模块之collections模块
计数器 Counter 计数元素迭代器 elements() 计数对象拷贝 copy() 计数对象清空 clear() from collections import Counter #import ...
【转】python模块分析之collections（六）
[转]python模块分析之collections(六) collections是Python内建的一个集合模块,提供了许多有用的集合类. 系列文章 python模块分析之random(一) pyth ...
python的常用模块之collections模块
python的常用模块之collections模块 python全栈开发,模块,collections 认识模块什么是模块? 常见的场景:一个模块就是一个包含了python定义和声明的文件,文 ...
Python自建collections模块
本篇将学习python的另一个内建模块collections,更多内容请参考:Python学习指南 collections是Python内建的一个集合模块,提供了许多有用的集合类. namedtupl ...
python拓展2 collections模块与string模块
知识内容 1.collections模块介绍 2.collections模块使用 3.string模块介绍及使用一.collections模块介绍 collections模块中提供了很多python ...
Python标准库——collections模块的Counter类
1.collections模块 collections模块自Python 2.4版本开始被引入,包含了dict.set.list.tuple以外的一些特殊的容器类型,分别是: OrderedDict类 ...

随机推荐

linux 循环处理文件夹下所有文件脚本
#!/bin/bashfunction ergodic(){ for file in ` ls $1 ` do if [ -d $1"/"$file ] then ergodic ...
2016年12月23日星期五 --出埃及记 Exodus 21:18
2016年12月23日星期五 --出埃及记 Exodus 21:18 "If men quarrel and one hits the other with a stone or with ...
Less 使用指南
简而言之 Less是为了简化css http://less.bootcss.com/features/ 以上链接是Less中文网站,里面有对Less的详细介绍. 一下写在使用中遇到的问题: 1.下载L ...
Beaglebone Black – 连接 GY-91 MPU9250+BMP280 九轴传感器（1）
本篇内容为,通过 I2C 配置 GY-91 MPU9250+BMP280 里面的 MPU9250 连接 AK8963 磁感应.两个办法,1)MPU9250 设置 Master Mode 通过 AUX ...
SpringMVC控制器与视图的数据交换
1,先创建spring的主配置文件(applicationContaxt.xml如果写在WEB-INF下,就不用配置context了,就是不用告诉它路径了,WEB-INF会自动加载的),由监听器负责加 ...
linux ls -l命令结果含义解析
ls -l 中显示的内容如下: -rw-r--r--. 1 root root 192 Jan 30 09:55 text.txt - 10个字符确定不同用户能对文件干什么 - 第一个字符代表文件 ...
nodejs搭建http-server
很多时候我们都需要搭建一个简单的服务器,部署在IIS,阿帕奇,或者用nodejs,网上很多关于nodejs搭建server的文章,但都是要创建server.js,很麻烦, 在这里我分享一个创建ht ...
java易错基础知识点
一. Switch 1.其能接受的数据类型有四个,char , byte, short, int2.Default 可放在switch中的任何一个地方,但只有给定的条件匹配不到时,才会执行3.Case ...
Delphi 使用之dll文件生成与调用
DLL是Dynamic-Link Libraries(动态链接库)的缩写,库里面是一些可执行的模块以及资源(如位图.图标等).可以认为DLL和EXE基本上是一回事,只是DLL不能直接执行,而必须由应用 ...
C语言语法之运算符及优先级
注:该内容整理自以下链接. http://blog.csdn.net/huangblog/article/details/8271791 表:C语言运算符及优先级优先级运算符名称或含义使用形式 ...

python模块之collections

我们都知道，Python拥有一些内置的数据类型，比如str, int, list, tuple, dict等， collections模块在这些内置数据类型的基础上，提供了几个额外的数据类型：

python模块之collections的更多相关文章

随机推荐

热门专题