Python 容器用法整理

本文整理几种基本容器：列表、元组、字典和集合的用法和collections中几种已经预先实现的容器数据结构：namedtuple(),双向链表deque，ChainMap，Counter，OrderedDict，defaultdict。其中，deque是一个双向链表的结构，namedtuple是tuple的拓展，ChainMap，Counter,OrderedDict,defaultdict都可以视作是字典的拓展。

基本顺序存储结构——列表与元组

Python中的基本顺序存储结构是列表与元组，在操作的复杂度上和数组完全相同，其中列表是可变数据类型，元组是不可变数据类型。这里先介绍一下两种数据结构共有的方法：

x in s	返回布尔值，x在s中
x not in s	返回布尔值，x不在s中为True
s + t	s和t的拼接，可以+=
s * n or n * s	n为int类型，返回s重复n次的结果。可以*=，同上
s[i]	返回索引为i的元素
s[i:j(:k)]	切片，返回子数组，从s[i]~s[i-1],k为步长，默认为1.
len(s)	现有元素个数
min(s)	最小元素
max(s)	最大元素
s.index(x[,i[,j]])	在s[i] ~ s[j-1]中，第一个大小为x的元素的索引，i，j默认0，-1
s.count(x)	统计x的数目

这些都不涉及对数组内元素的更改，因此是列表和元组都可以使用的。注意元组只能使用以上的方法。

接下来介绍可变有序容器的方法，注意各种方法都有利用切片赋值的实现！

s[i] = x	赋值操作
s[i:j(:k)] = t	按照切片规则选择元素进行赋值，注意如果t为[]可以用作删除,如果i==j可以用作插入
del s[i:j(:k)]	按照切片规则进行删除
s.append(x)	在尾部插入，等价于s.insert(I,len(s)),复杂度O(1).
s.clear()	清空所有元素 (等价于del s[:])
s.copy()	创建一份s的浅拷贝 (等价于 s[:])
s.extend(t) or s += t	在后面插入一组，相当于+=；
s.insert(i, x)	在i处插入x (等价于s[i:i] = [x])
s.pop([i])	默认删除尾部元素，否则删除i处的元素
s.remove(x)	删除第一个等于x的元素
s.reverse()	列表反向

此外，列表还独有s.sort(key=None, reverse=None)，其中key是一个函数名，也就是比较函数，reverse为布尔值，True的话则会列表反向。

Sort单独列出来是因为如果自己从可变有序容器里面派生的话并没有这个方法。

基本哈希存储结构——字典

字典是基于哈希表的一种映射结构，注意本文中介绍的Python的数据结构并没有任何一种使用了红黑树的搜索结构。

len(d)	返回字典元素个数
d[key]	返回key对应的value
d[key] = value	为字典元素赋值，如果没有则增加元素
del d[key]	删除字典元素
key in d/ key not in d	查看key是否在d中
iter(d)	返回一个迭代器，具有__next__()方法
clear()	清空
copy()	浅复制
fromkeys(seq[, value])	以seq作为键，value作为值建立字典，默认value为None
get(key[, default])	安全的get方法，如果不存在返回default，如果不指定default则报错
items()	列出一个键值对的view
keys()	列出key的view,通常用于遍历
values()	Return a new view of the dictionary's values.
pop(key[, default])	Key在d中则删除，和del[key]一样，default如果被指定，那么当不存在key的时候会返回default而不会报错
popitem()	弹出一个键值对，为key的哈希序列中的第一个
setdefault(key[, default])	安全的添加操作，如果存在就返回value不更改值，如果不存在添加一个key:default的表项，default默认为0
update([other])	更改操作，other可以是键值对的列表或元组（二级的），也可以是字典，用other中的键值对添加到或替换原有键值对

键值相等的字典——集合set与frozenset

Python中由set和frozenset两种集合结构。由于set中的元素既是键又是值，所以他的内容必须是不可修改的，frozenset就是被声明为常量的set，，用于建立集合的集合

首先介绍两种集合共有的方法：

注意用的都是逻辑运算符进行衍生而不是+

len(s)	集合元素个数
x in/not in s	是否在集合中
isdisjoint(other)	和other的交集为空
set <= other	包含于
set < other	真包含于
set >= other	包含
set > other	真包含
set \| other \| ...	并
set & other & ...	交
set - other - ...	差
set ^ other	对称差（并-交）
copy()	浅拷贝

而set独有的方法是，一个是诸如&=之类的运算符，还有：

add(elem)	增加元素
remove(elem)	删除元素，不存在则报错
discard(elem)	删除元素，不存在不报错
pop()	删除哈希表第一个元素，空集报错
clear()	清空

Tuple的拓展的生成器collections.namedtuple(typename, field_names, verbose=False, rename=False)

这是一个生成器，本身并不是类。它生成的就是有名字的元组类型，很适合于存储表条目，例如下面的代码：

Point = namedtuple('Point', ['x', 'y'])

这样做，Point会定义一个具有x和y成员的类，想要调用相应对象的x属性，既可以使用p[0],也可以使用p.x。注意虽然叫namedtuple，但是其本身是可以更改的，可以视作是一种简单的结构体的定义方式。可以使用p=Point(1,2)进行定义

如果verbose为真，那么会将定义过程显示的输出到控制台；如果rename为真，属性中不符合命名规则的属性会被自动更名为'_index'，如一些保留字或者数字开头。

利用这种有名字的生成器，可以使程序更加简洁，并且更加易读，用它作为value再来建字典就非常的方便了。

有几个内建方法，比如：

_make(iterable):使用一个可迭代的对象建立namedtuple，例如列表。

_asdict():转化为一个字典（Py3.1后为OrderedDict）

利用字符串格式的属性名找出值getattr(p,'x');

dict转化为Tuple要利用Unpacking语法 **args，即Point(**somedict),**语法会把dict切分开，注意此语法只发生在参数传递过程中才是有效的。

一个*是把容器中的元素一个一个传递，两个*是专门用于解包字典，键值对应使用。

还有内置属性可以以字符串的形式输出参数的名字 ._fields

字典组ChainMap

定义时候，后边按元组的形式接受参数ChainMap(*map)，每一个参数都应该是一个字典名，最后返回一个字典组。

建立之后，其中有maps属性，是所有的字典组成的列表；parents属性，是除了第一个字典之外的所有字典的列表。

内建的new_child(m=None)方法，是添加一个新的字典到列表中作为第一个字典，等价于ChainMap(m,*d.maps).

字典组拥有字典的各种操作，它的特点是所有涉及到更新的操作如插入删除等都是只针对第一个字典，而查找的操作则是按照顺序对全部字典进行查找。如果希望更新操作也是对全部字典，则可以使用它进行派生，并且对maps使用for循环。

计数器Counter（本质是C++multiset、sql bag）

可以认为他是一个key-int字典，不过他实际上是一个multiset！，int默认为0，有几个创建方法：

从一般可迭代对象c = Counter('gallahad')，从字典c = Counter({'red': 4, 'blue': 2})，直接指明（字典也可以这样初始化，是底层方法）c = Counter(cats=4, dogs=8) 。

它具有字典的全部操作，同时又添加了一下计数器的很自然的操作。

.elements():列表形式一个一个列出元素。

.most_common([n]):列出出现次数最多的前n个元素的列表，如果n没有，则按顺序列出所有的。

.subtrackc(other):两个计数器相减，可以出现0或负数。可以用+c 这一语句清除0和负数

四种运算：+,-,&,|，按key的加减，按multiset取交和并，注意出现的负数和0会被清楚

特殊字典OrderedDict和defaultdict

这两个都具有普通字典的全部功能，不过有一些不同：

defaultdict(class)

指定了值的类型，会用这种类型自动构造，相当于可以提前使用这种类的方法，一个有趣的例子是：

>>> s = [('red', 1), ('blue', 2), ('red', 3), ('blue', 4), ('red', 1), ('blue', 4)]

>>> d = defaultdict(set)

>>> for k, v in s:

...     d[k].add(v)

...

>>> sorted(d.items())

[('blue', {2, 4}), ('red', {1, 3})]

class collections.OrderedDict([items])

这种容器不光存储了键值对，还维护了被加入字典的顺序，使它能够像栈一样弹出，增加了两个方法：

.popitem(last = True): 移除最后一个加入的键值对，如果last=false则移除第一个加入的键值对。

.move_to_end(key,last = True): 将某一个键的条目作为最后一个加入的（false->作为最先加入的）

这个数据类型可以简单地实现LRU的算法，可以通过一个key:(value,forekey,nextkey)的字典结构实现此类。

双向链表deque

class collections.deque([iterable[, maxlen]])

就是简单意义上的双向链表（双向队列），注意这里不再支持切片操作了，随机访问的操作保留，可以通过随机访问通过del实现删除，但是没有切片无法用于替换，截取等操作，无法sort：

append(x)¶	右侧插入
appendleft(x)	左侧插入
clear()	清空
copy()	浅复制
count(x)	计数
extend(iterable)	按组右侧连接
extendleft(iterable)	按组左侧连接
index(x[, start[, stop]])	搜索等于x的第一个位置
insert(i, x)	在i处插入x
pop()	右侧删除
popleft()	左侧删除
remove(value)	搜索第一个元素并删除
reverse()	队列反向
rotate(n)	前n个队列的尾部元素移动到首部
maxlen	有界情况下返回最大长度

注意其没有截取，切片等操作，只能通过copy，pop的方式实现截取操作。

Python 容器用法整理的更多相关文章

Python高级用法总结
Python很棒,它有很多高级用法值得细细思索,学习使用.本文将根据日常使用,总结介绍Python的一组高级特性,包括:列表推导式.迭代器和生成器.装饰器. 列表推导(list comprehensi ...
Python面试题整理-更新中
几个链接: 编程零基础应当如何开始学习 Python ? - 路人甲的回答网易云课堂上有哪些值得推荐的 Python 教程? - 路人甲的回答怎么用最短时间高效而踏实地学习 Python? - 路 ...
转 Python常见数据结构整理
http://www.cnblogs.com/jeffwongishandsome/archive/2012/08/05/2623660.html Python常见数据结构整理 Python中常见的数 ...
python学习笔记整理——字典
python学习笔记整理数据结构--字典无序的 {键:值} 对集合用于查询的方法 len(d) Return the number of items in the dictionary d. 返 ...
!!对python列表学习整理列表及数组详细介绍
1.Python的数组分三种类型:(详细见 http://blog.sina.com.cn/s/blog_6b783cbd0100q2ba.html) (1) list 普通的链表,初始化后可以通过特 ...
Spring JdbcTemplate用法整理
Spring JdbcTemplate用法整理: xml: <?xml version="1.0" encoding="UTF-8"?> <b ...
python 常用库整理
python 常用库整理 GUI 图形界面 Tkinter: Tkinter wxPython:wxPython pyGTK:PyGTK pyQt:pyQt WEB框架 django:django w ...
python argparse用法总结
转:python argparse用法总结 1. argparse介绍 argparse是python的一个命令行解析包,非常适合用来编写可读性非常好的程序. 2. 基本用法 prog.py是我在li ...
linq用法整理
linq用法整理普通查询 var highScores = from student in students where student.ExamScores[exam] > score se ...

随机推荐

【CSP模拟赛】凤凰院凶真（最长公共上升子序列）
题目描述 α世界线.凤凰院凶真创立了反抗SERN统治的组织“瓦尔基里”.为了脱离α线,他需要制作一个世界线变动率测量仪. 测量一个世界线相对于另一个世界线的变动率,实质上就是要求出这两个世界线的最长公 ...
[转] 修改sqlserver的数据库名、物理名称和逻辑文件名
转载: https://blog.csdn.net/dym0080/article/details/81017777
BS4库详解
from bs4 import BeautifulSoup html = """ <html><head><title>This is ...
SQL学习笔记（二）
连接查询数据准备例1:查询学生信息及学生的成绩等值连接此方法会产生笛卡尔积,生成的记录总数=表1的总数*表2的总数,会产生临时表内连接 select * from 表1 inner join ...
arcgis python 拓扑规则
面 Must Not Have Gaps (Area) | Must Not Overlap (Area) 面面 | Must Be Covered By Feature Class Of (Area ...
C# ffmpeg 视频处理格式转换具体案例
C# ffmpeg 视频处理格式转换 C# ffmpeg 视频处理格式转换avi到MP4格式 1.代码如下: using System;using System.Diagnostics; namesp ...
elasticsearch 的入门
参考文档 1.全文搜索引擎 Elasticsearch 入门教程(http://www.ruanyifeng.com/blog/2017/08/elasticsearch.html) 2.elasti ...
【maven】在pom.xml中引入对json-lib的依赖dependency
<dependency> <groupId>net.sf.json-lib</groupId> <artifactId>json-lib</art ...
关于postman与shiro权限验证问题
作为一个java的开发小白 , 写完一个web方法测试是必不可少的 , 只有测试号没问题的方法给别人时 ,别人才不知道你是小白 , 要不然很尴尬的 .新手入坑的测试工具是postman .这个工具用起 ...
Oracle 获取表的主键、外键以及唯一约束条件
Oracle 获取表的主键.外键以及唯一约束条件 Select a.Owner 主键拥有者, a.table_name 主键表, b.Column_Name 主键列, b.Constraint_Nam ...

Python 容器用法整理

基本顺序存储结构——列表与元组

基本哈希存储结构——字典

键值相等的字典——集合set与frozenset

Tuple的拓展的生成器collections.namedtuple(typename, field_names, verbose=False, rename=False)

字典组ChainMap

计数器Counter（本质是C++multiset、sql bag）

特殊字典OrderedDict和defaultdict

defaultdict(class)

class collections.OrderedDict([items])

双向链表deque

Python 容器用法整理的更多相关文章

随机推荐

热门专题