写在之前

我们都知道 Python 中内置了许多标准的数据结构，比如列表，元组，字典等。与此同时标准库还提供了一些额外的数据结构，我们可以基于它们创建所需的新数据结构。

Python 附带了一个「容器」模块 collections，它包含了很多的容器数据类型，今天我们来讨论其中几个常用的容器数据类型，掌握了这几个可以减少我们重复造轮子所带来的烦扰。

namedtuple

相信你已经熟悉了元组，一个元组相当于一个不可变的列表，你可以存储一个数据的序列。这里要说的 namedtuple（命名元组）和元组非常像，它们都不能修改自己的数据。说完了像，那么它们有哪些地方不像呢？

作为元组，为了获取其中的数据，我们需要使用整数作为索引：

>>> people = ('Rocky', 'python')
>>> print(people[0])
Rocky

而 namedtuple 把元组变成了一个针对简单任务的容器，我们不必使用整数索引来访问 namedtuple 的数据，反而可以像用字典一样访问 namedtuple。

>>> from collections import namedtuple
>>> people = namedtuple('people', 'name age like')
>>> Rocky = people(name = 'rocky', age = 23, like = 'python')
>>> print(Rocky)
people(name='rocky', age=23, like='python')
>>> print(Rocky.name)
rocky

一个 namedtuple 有两个必须的参数：元组名称和字段名称。在上面的代码中，我们的元组名称是 people，字段名称是 name，age，like。nametuple 让元组变的更加易读，很容易理解代码是做什么的，同样我们也不用使用整数索引来访问一个命名元组（上面代码我们用 name 访问了 namedtuple 中的数据），这让我们的代码更加容易维护。

但是你一定要记住的是，虽然它的用法很爽，但它还是一个元组！所以属性值在 namedtuple 中是不可变的。

我们在上面说过可以像用字典一样访问 namedtuple，那么当然也可以把它转为字典，具体操作如下所示:

>>> from collections import namedtuple
>>> people = namedtuple('people', 'name age like')
>>> Rocky = people(name = 'rocky', age = 23, like = 'python')
>>> print(Rocky._asdict())
OrderedDict([('name', 'rocky'), ('age', 23), ('like', 'python')])

defaultdict

我之前在使用字典的时候相当随意，只是随便 dict 一下就好了，然而这样使用存在一个问题：当使用的 key 不存在的时候会报 KeyError，而 defaultdict 就比较厉害了，我们完全不需要检查 key 是否存在，所以我们能像下面这样做的随心所欲：

from collections import defaultdict
languages = (
 ('rocky', 'python'),
 ('snow', 'c'),
 ('leey', 'java'),
 ('rocky', 'c++'),
 ('leey', 'c#')
)
favourite = defaultdict(list)
for name, language in languages:
 favourite[name].append(language)
print(favourite)

输出如下所示：

defaultdict(<type 'list'>, {'leey': ['java', 'c#'], 'rocky': ['python', 'c++'], 'snow': ['c']})

然后我们再回到“键不存在，会触发 KeyError 异常”这个问题上来，我们先来看 dict 触发 KeyError 的例子：

my_dict = {}
my_dict['name']['like'] = 'python'

输出如下：

KeyError: 'name'

defaultdict 则用了一个非常巧妙的方式绕过了这个问题，请看下面的操作：

import collections
language = lambda : collections.defaultdict(language)
my_dict = language()
my_dict['name']['like'] = 'python'

运行一下显示正常，我们可以用 json.dumps 打印出 my_dict 的内容：

import json
print(json.dumps(my_dict))

运行结果如下：

{"name": {"like": "python"}}

Counter

Counter 是一个计数器，它可以帮助我们针对某项数据进行计数，比如可以用它来统计每个人擅长的编程语言：

from collections import Counter
languages = (
 ('rocky', 'python'),
 ('snow', 'c'),
 ('leey', 'java'),
 ('rocky', 'c++'),
 ('leey', 'c#')
)
cnt = Counter(name for name, language in languages)
print(cnt)

运行结果如下所示：

Counter({'leey': 2, 'rocky': 2, 'snow': 1})

当然我们也可以用它来统计一个文件，比如：

from collections import Counter
with open('test.txt', 'rb') as f:
 line_cnt = Counter(f)
print(line_cnt)

deque

deque 提供了一个双端队列，我们可以在首尾两端添加或者删除元素，在前面的文章中（Python 标准库之双端队列）写过，没看过的可以看看。

想要使用 deque，首先我们要从 collections 中导入 deque 模块，然后创建一个 deque 对象，它的用法就像我们前面学过的 list 一样，并且提供了类似的方法，具体如下所示：

from collections import deque
deq = deque()
deq.append(1)
deq.append(2)
deq.append(3)
print(deq)
print(len(deq))
print(deq[0])
print(deq[-1])

输出结果如下：

deque([1, 2, 3])
3
1
3

我们可以从两端取出数据：

from collections import deque
deq = deque(range(5))
print('len(deq) == {}'.format(len(deq)))
deq.popleft()
deq.pop()
print(deq)

输出的结果如下所示：

len(deq) == 5
deq == deque([1, 2, 3])

我们也可以对这个列表的大小进行限制，当超出我们的限制的时候，数据会从另一端被 pop 出去，具体我们来看下面的操作：

from collections import deque
deq = deque(maxlen=3)
deq.append(1)
deq.append(2)
deq.append(3)
print(deq)
deq.append(4)
print (deq)

输出的结果如下：

deque([1, 2, 3], maxlen=3)
deque([2, 3, 4], maxlen=3)

当超出 maxlen 的值时，最左边的数据将从队列中删除。

当然我们还可以从任意一端扩展这个双端队列中的数据：

from collections import deque
deq = deque([1,2,3])
deq.extendleft([0])
deq.extend([4,5,6])
print(deq)

输出的结果如下所示：

deque([0, 1, 2, 3, 4, 5, 6])

如果有那些不足的地方，欢迎大家补充！

Python 中的容器 collections的更多相关文章

Python中模块之collections系列
collection系列功能介绍 1. 常用的集中类 1. Counter(计数器) 计数器的常用方法如下: 创建一个字典计数器格式:collections.Counter(obj) 例如:prin ...
Python字符串与容器
[]运算符是Python中访问容器元素和切片的运算符 []有正向和反向两种下标,正向下标从0开始,向后递增: 反向下标以-1表示最后一个元素,-2表示倒数第二个字符,向前递减. []不仅可以访问单个元 ...
Python中的高性能容器--collections
集合模块相对于 Python 中内置的称为链表.集合.字典和元组的默认容器类型来说,集合模块( collection module )提供了高性能的备选方案( alternative ). 简单地看 ...
Python中collections模块
目录 Python中collections模块 Counter defaultdict OrderedDict namedtuple deque ChainMap Python中collections ...
Python中collections模块的使用
本文将详细讲解collections模块中的所有类,和每个类中的方法,从源码和性能的角度剖析. 一个模块主要用来干嘛,有哪些类可以使用,看__init__.py就知道 '''This module i ...
Python面试题之容器(Collections)
容器(Collections) Python附带一个模块,它包含许多容器数据类型,名字叫作collections.我们将讨论它的作用和用法. 我们将讨论的是: defaultdict coun ...
Python中Collections模块的Counter容器类使用教程
1.collections模块 collections模块自Python 2.4版本开始被引入,包含了dict.set.list.tuple以外的一些特殊的容器类型,分别是: OrderedDict类 ...
转载：Python中collections模块
转载自:Python中collections模块目录 Python中collections模块 Counter defaultdict OrderedDict namedtuple deque Ch ...
python中的list, dict, tuple以及collections模块的基本用法
1.关于list的一些基本用法 # 创建没有初值的列表 list1=[] # 创建有初值的列表 list2=['this','is','a','list'] # 创建给定长度但初值不确定的列表 lis ...

随机推荐

AngularJS 五过滤器及验证
AngularJS过滤: AngularJS过滤器允许我们格式化数据以在UI上显示而不改变原始格式. 格式: 一些比较重要的过滤器: Number Filter ...
Docker官方文档翻译2
转载请标明出处: https://blog.csdn.net/forezp/article/details/80158062 本文出自方志朋的博客容器准备工作安装Docker,版本为1.13或者 ...
菜鸟笔记 -- Chapter 6.4.3 多态
6.4.3 多态多态就是指程序中定义的引用变量所指向的具体类型和通过该引用变量发出的方法调用在编程时并不确定,而是在程序运行期间才确定,即一个引用变量倒底会指向哪个类的实例对象,该引用变量发出的方 ...
初学oracle遇到些小麻烦
前段时间学习了Oracle数据库,在超级用户sys下运行一些基本语句的时候都没有发现有什么问题,但是却发现不能执行删除字段的的命令,老师检查说可能是权限不够,但是在授权之后依旧不能完成该语句,所以就另 ...
Object C学习笔记23-继承,重写,重载(转)
前面的学习都一直在使用Object C对象,但是没有具体总结过Object C中的对象使用特性,这里简单总结一下. 一. 继承在面向对象编程中,子类可以通过继承得到父类的可以继承的的属性和方法,在 ...
export default 和 export的使用方式
注意:1.export default 向外暴露的成员,可以使用任意的变量来接收 2.在一个模块中 ; export default 只允许向外暴露一次 3.在一个模块中 ; 可以同时使用 expor ...
hdu 3966 Aragorn's Story : 树链剖分 O(nlogn)建树 O((logn)²)修改与查询
/** problem: http://acm.hdu.edu.cn/showproblem.php?pid=3966 裸板 **/ #include<stdio.h> #include& ...
CentOS7 64位下 MySQL5.7的安装与配置（YUM）
趁着11.11的时候在阿里云上弄了一云服务ECS(作为自己的节日礼物 > _ <) ,系统为CentOS的,打算弄一个人博客之类的,这些天正在备案当中(不知得多久). 忙里偷闲,在中午休息 ...
ubuntu系统下的docker
官网:https://www.docker.com/ 相关资料:1.Docker入门教程 http://dockone.io/article/1112.Docker_百度百科 http://baike ...
虚拟内存设置（解决linux内存不够情况）
一. 虚拟内存介绍背景介绍 Memory指机器物理内存,读写速度低于CPU一个量级,但是高于磁盘不止一个量级.所以,程序和数据如果在内存的话,会有非常快的读写速度.但是,内存的造价是要高于 ...

Python 中的容器 collections