你不知道的Python容器

昨天阅读了《Python Tricks: The Book》的第五章“Common Data Structures in Python”,该章节介绍了字典、数组、集合、栈、队列以及堆等数据结构的用法和注意事项,其中ChainMap、MappingProxyType等不常使用的容器类引起了我的注意。本文主要对几种不常使用的容器类进行介绍,通过示例说明这些容器的特点。

散列表

ChainMap

“collections.ChainMap”能有效整合多个字典的信息,提供一个可进行查询和更新的视图。它使用列表管理字典的引用,而非创建一个新的字典,因此时空开销比较小。当查询字典内容时,ChainMap按序遍历字典列表,直至找到给定的键;当更新(包括新增、删除)字典内容时,ChainMap只在字典列表的首项上进行操作。

由于ChainMap是从前到后依次查找字典列表,如果有多个字典包含了相同的键,那么靠近列表起始位置的字典就会被优先匹配,而靠近列表末端的字典会被忽略。ChainMap能够为键查找操作设置优先级的特性使得它能够用于管理应用程序的配置项。具体来说,当应用程序具有多种来源(命令行、配置文件、环境变量等)的配置时,可以把优先级高的配置当作ChainMap的第一个位置参数:

from collections import ChainMap

cli_config = {  # 命令行参数
'batch_size': 128, # 批次大小为128
'learning_rate': 1e-3,
'dropout': 0.2,
}
default_config = { # 默认配置
'batch_size': 64, # 这里也配置了批次大小
'num_layers': 2,
} lookup = ChainMap(cli_config, default_config)
lookup['batch_size'] # 128,命令行参数优于匹配
lookup['num_layers'] # 2,默认配置也能查询 lookup.maps # ChainMap({'batch_size': 128, 'learning_rate': 0.001, 'dropout': 0.2}, {'batch_size': 64, 'num_layers': 2}) lookup['beam_size'] = 4 # 新增键值对
del lookup['batch_size'] # 删除键值对
cli_config # {'learning_rate': 0.001, 'dropout': 0.2, 'beam_size': 4},cli_config是字典列表的首项,更新操作会作用到它身上

MappingProxyType

“types.MappingProxyType”通过代理模式控制了对字典内容的访问,它接收一个字典作为参数,返回该字典的只读(Read Only)视图,任何尝试更新该视图的操作都会触发“TypeError”异常。

from types import MappingProxyType

meetings = {
'ACL': 'Annual Meeting of the Association for Computational Linguistics',
'CVPR': 'IEEE Conference on Computer Vision and Pattern Recognition',
}
mapping = MappingProxyType(meetings)
mapping['ACL'] # 'Annual Meeting of...'
del mapping['ACL'] # TypeError: 'mappingproxy' object does not support item deletion
mapping['ACL'] = '' # TypeError: 'mappingproxy' object does not support item assignment

线性表

Python的内置类型“list”支持按位置插入、删除列表元素,基于它可以实现栈和队列等操作受限的线性表,但考虑到“list”本身是基于动态数组的,频繁增删列表元素会使得“list”需要时常调整占用的存储空间(扩容、缩容),最终导致程序性能的下降。

“collections.deque”是实现栈和队列的更好选择,它基于双向链表,支持快速地从序列两端添加或删除元素。

  1. 使用deque模拟栈“后进先出”的特性

    from collections import deque
    
    stack = deque()
    stack.append('F')
    stack.append('E') stack.pop() # 'E',首先弹出'E'
    stack.pop() # 'F',出栈顺序与入栈顺序相反
    stack.pop() # IndexError: pop from an empty deque
  2. 使用deque模拟队列“先进先出”的特性

    from collections import deque
    
    queue = deque()
    queue.append('F')
    queue.append('E') queue.popleft() # 'F','F'首先出队
    queue.popleft() # 'E',出队顺序与入队顺序相同
    queue.popleft() # IndexError: pop from an empty deque

二叉堆是一棵完全二叉树,有最小堆和最大堆两种类型,其中最小堆的每个节点都小于等于它的子节点。Python的“heapq”模块提供了关于构造最小堆、插入删除元素并保持最小堆特性的接口。

import random
import heapq digits = [random.randrange(100) for i in range(5)] # [75, 28, 93, 79, 57]
heapq.nsmallest(2, digits) # [28, 57],获取列表中最小的2个元素 heapq.heapify(digits) # 堆化,[28, 57, 93, 79, 75]
heapq.heappush(digits, 10) # 插入一个元素,[10, 57, 28, 79, 75, 93]
heapq.heappop(digits) # 10,弹出最小的元素

“queue.Priority”给出了优先队列的一种实现,它基于最小堆:

from queue import PriorityQueue

q.put((3, 'Sing'))
q.put((1, 'Jump'))
q.put((2, 'Rap')) while not q.empty():
next_item = q.get()
print(next_item) # (1, 'Jump'), (2, 'Rap'), (3, 'Sing')

参考资料

  1. Python Tricks: The Book
  2. Python's ChainMap: Manage Multiple Contexts Effectively
  3. 《流畅的Python》,2.9.4节“双向队列和其他形式的队列”

你不知道的Python容器的更多相关文章

  1. python容器数据类型的特色

    python容器数据类型的特色 list:           可变数据类型(不可哈希), 有序, 可索引获取, 可修改 Dict:         可变数据类型(不可哈希), 3.6版本有序, 可通 ...

  2. Python 学习笔记(1)Python容器:列表、元组、字典与集合

    Python容器:列表.元组.字典与集合 列表: 1.列表 的创建 使用[ ] 或者 list()创建列表:empty_list = [ ] 或者 empty_list= list() 使用list( ...

  3. python容器类型:列表,字典,集合等

    容器的概念我是从C++的STL中学到的 什么是容器? 容器是用来存储和组织其他对象的对象. 也就是说容器里面可以放很多东西,这些东西可以是字符串,可以是整数,可以是自定义类型,然后把这些东西有组织的存 ...

  4. 第三章 Python容器:列表、元组、字典与集合

      数据结构的分类依据?基本的"数组"在python中是列表, 数据结构的作用?容器,盛放数据,是由原子组成的分子.可以将一群数据进行整合.拆分.重排. 3.2 列表 列表是啥?顺 ...

  5. Docker运行python容器

    容器是镜像运行的实例,而镜像保存在仓库里,测试或者发布生产环境只需要pull下来即可,相对传统的应用部署,能很好的保持环境的一致,节省运维时间.最近公司内部的java和.net服务也已经全部容器化,实 ...

  6. python容器类型的协议

    1.协议(Protocols)与其他编程语言中的接口恒相似,它规定你哪些地方必须要定义,然而在python中的协议就显得不那么正式,事实上,在python中,协议更像是一种指南. 2.序列类型和映射类 ...

  7. python 容器 生成器 迭代器 总结

    一.容器 容器是一种把多个元素组织在一起的数据结构,容器中的元素可以逐个地迭代获取,可以用in, not in关键字判断元素是否包含在容器中.通常这类数据结构把所有的元素存储在内存中. >> ...

  8. Python 容器使用的 5 个技巧和 2 个误区

    "容器"这两个字很少被 Python 技术文章提起.一看到"容器",大家想到的多是那头蓝色小鲸鱼:Docker,但这篇文章和它没有任何关系.本文里的容器,是 P ...

  9. Python 容器用法整理

    本文整理几种基本容器:列表.元组.字典和集合的用法和collections中几种已经预先实现的容器数据结构:namedtuple(),双向链表deque,ChainMap,Counter,Ordere ...

随机推荐

  1. RabbitMQ 的集群?

    镜像集群模式 你创建的 queue,无论元数据还是 queue 里的消息都会存在于多个实例上,然后每次你写消息到 queue 的时候,都会自动把消息到多个实例的 queue 里进行消息同步. 好处在于 ...

  2. 名词解析-RPC

    什么是RPC RPC 的全称是 Remote Procedure Call 是一种进程间通信方式.它允许程序调用另一个地址空间(通常是共享网络的另一台机器上)的过程或函数,而不用程序员显式编码这个远程 ...

  3. Javascript 占位符替换

    String.prototype.format=function(){ if(arguments.length===0){ return String(this); } let reg=/(\{\d\ ...

  4. django基础环境配置

    Django环境搭建 1.下载安装 命令行 pip install django==1.11.21 pip install django==1.11.21 -i 源 pycharm setting - ...

  5. 全网最硬核 Java 新内存模型解析与实验单篇版(不断更新QA中)

    个人创作公约:本人声明创作的所有文章皆为自己原创,如果有参考任何文章的地方,会标注出来,如果有疏漏,欢迎大家批判.如果大家发现网上有抄袭本文章的,欢迎举报,并且积极向这个 github 仓库 提交 i ...

  6. C语言之数据类型(知识点8)

    一.数据类型 1.数据基本类型 (1)整数 ①有符号整形 有符号短整型 short 有符号基本整形  int 有符号长整形  long ②无符号整形 无符号基本整形 无符号短整型 无符号长整型 (2) ...

  7. CSRF浅析

    概念 CSRF,Cross Site Request Forgery,跨站请求伪造. 为什么跨站的请求需要伪造? 因为浏览器实现了同源策略,这里可以将站和源视为同一个概念. 同源策略 The same ...

  8. C#编写程序,用 while 循环语句实现下列功能

    编写程序,用 while 循环语句实现下列功能:有一篮鸡蛋,不止一个,有人两个两个数,多余一个,三个三个数,多余一个,再四个四个地数,也多余一个,请问这篮鸡蛋至少有多少个. 代码: using Sys ...

  9. Python窗口学习之给按钮美化

    tkinter的按钮很丑也很难改 怎么办呢? 最好的方法就是不用按钮! 给Label添加点击事件,和按钮的作用是一样的! 代码: #!/usr/bin/env python # -*- coding: ...

  10. CentOS 7.9 网络配置

    vi /etc/sysconfig/network-scripts/ifcfg-ens33 (45条消息) CentOS 7.9 网络配置_$青的博客-CSDN博客_centos7.9网卡配置