《Python高性能编程》——列表、元组、集合、字典特性及创建过程

　　这里的内容仅仅是本人阅读《Python高性能编程》后总结的一些知识，用于自己更好的了解Python机制。本人现在并不从事计算密集型工作：人工智能、数据分析等。仅仅只是出于好奇而去阅读这本书。很多人因为Python不能同时使用多颗CPU（全局解释器锁GIL），而觉得它不能实现高性能。书中有很多介绍避开GIL或者Python虚拟机的方式，例如Cython，PyPy等。

首先我们要说一下时间复杂度，可以帮助我们理解CPython编译器怎么干活：

时间复杂度

　　在描述算法复杂度时,经常用到o(1), o(n), o(logn), o(nlogn)来表示对应算法的时间复杂度, 这里进行归纳一下它们代表的含义:

　　这是算法的时空复杂度的表示。不仅仅用于表示时间复杂度，也用于表示空间复杂度。O后面的括号中有一个函数，指明某个算法的耗时/耗空间与数据增长量之间的关系。其中的n代表输入数据的量。比如时间复杂度为O(n)，就代表数据量增大几倍，耗时也增大几倍。比如常见的遍历算法。再比如时间复杂度O(n^2)，就代表数据量增大n倍时，耗时增大n的平方倍，这是比线性更高的时间复杂度。比如冒泡排序，就是典型的O(n^2)的算法，对n个数排序，需要扫描n×n次。再比如O(logn)，当数据增大n倍时，耗时增大logn倍（这里的log是以2为底的，比如，当数据增大256倍时，耗时只增大8倍，是比线性还要低的时间复杂度）。二分查找就是O(logn)的算法，每找一次排除一半的可能，256个数据中查找只要找8次就可以找到目标。O(nlogn)同理，就是n乘以logn，当数据增大256倍时，耗时增大256*8=2048倍。这个复杂度高于线性低于平方。归并排序就是O(nlogn)的时间复杂度。

O(1)就是最低的时空复杂度了，也就是耗时/耗空间与输入数据大小无关，无论输入数据增大多少倍，耗时/耗空间都不变。哈希算法就是典型的O(1)时间复杂度，无论数据规模多大，都可以在一次计算后找到目标（不考虑冲突的话）

列表和元组

1、列表是动态数组，它们可变且可以重设长度（改变其内部元素个数）。

2、元组是静态的数组，它们不可变，且其内部数据一旦创建便无法改变。

3、元组缓存与Python 运行时环境，这以为着我们每次使用元组都无需访问内核去分配内存。

当创建的数据量及，达到百万千万级以上，合并多个元组，会比一个列表占用更少的空间。

列表在进行append()操作时，会Copy原列表，创建一个更大的列表，然后销毁原列表。在append时，编译器会预创建一部分数据空间，用于以后的添加。

元组在进行合并操作（+）时，会创建一个新的元组，然后销毁旧的元组，元组数据集前后不会发生改变

字典和集合

字典和集合适合于存储能够被索引的数据。当你在使用字典和集合处理可以索引的数据时它的时间复杂度是O(1)，但是对于那些不能被索引的数据是徒劳无功的。

　　字典与集合在CPython创建时，会像系统申请定量内存块默认最小长度是8，每次改变大小增加到原来的4倍。每次插入数据时会生成索引(二进制数)，会在申请的内存存储块中随机插入，如果目标存储块已有数据，那就换个位置，这叫做散列碰撞。

由于字典与集合在插入数据不是每一次都会扩增集合体积，所以会比列表效率高效、省内存空间。虽然会有散列碰撞，但是每次散列碰撞都是二进制数的比较。

集合：在对一批数据进行去重时，不如把这批数据放入集合中。因为在你使用列表存储这批数据时，你需要手动判断是否重复，而且列表会预创建空桶用于存接下来的数据。而集合是一个纯Key的数组，里面的数据时唯一的。

字典：是key:value的形式存储

散列函数：在散列函数中会对字典和列表生成二进制数作为掩码(可以理解为索引，因为在插入、查询时是依靠这个值)。

　　应该有一种——而且最好只有唯一的一种——明显的方式去完成它。虽然这种方式可能一开始并不明显，除非你是荷兰人。

——Tim Peters

Python之禅

使用Python的目的是快速实现功能，且代码能够稳定运行。至于优化，所花费的时间可能是产品初创到诞生的数倍时间。

《Python高性能编程》——列表、元组、集合、字典特性及创建过程的更多相关文章

python基础(五)列表,元组,集合
列表在python中是由数个有序的元素组成的数据结构,每一个元素对应一个index索引来隐式标注元素在列表中的位置.是python中最常用的一种数据类型.需要注意的是列表中可以有重复相同的数据. 列 ...
python 序列结构-列表,元组，字典，字符串，集合
列表 """ name_list.__add__( name_list.__getslice__( name_list.__new__( name_list.append ...
【python基础】之元组集合字典
元组元组:元组和列表类似.但是元组中的元素是固定的(不能给一个元组添加,删除和替换元素以及重新排序) 1.创建元组 t1 = () #创建一个空元组 t2 = (1, 2, 3) t3 = tupl ...
python学习之列表元组，字典
list:元素性质可以不一致,元素还可以是list,可类似数组方法进行索引(也可以用负数索引,-1表示最后一个),可用.append('')进行动态增加,可用pop()删除最后一个或者pop(i)删除 ...
Python—列表元组和字典
Python-列表元组和字典列表元组字典列表: 列表是Python中的一种数据结构,他可以存储不同类型的数据.尽量存储同一种类型列表索引是从0开始的,我们可以通过索引来访问列表的值. 列表的 ...
python基础语法3 元组，字典，集合
元组: ========================元组基本方法===========================用途:存储多个不同类型的值定义方式:用过小括号存储数据,数据与数据之间通过逗号 ...
Python猫荐书系列之五：Python高性能编程
稍微关心编程语言的使用趋势的人都知道,最近几年,国内最火的两种语言非 Python 与 Go 莫属,于是,隔三差五就会有人问:这两种语言谁更厉害/好找工作/高工资…… 对于编程语言的争论,就是猿界的生 ...
进阶《Python高性能编程》中文PDF+英文PDF+源代码
入门使用高性能 Python,建议参考<Python高性能编程>,例子给的很多,讲到高性能就会提到性能监控,里面有cpu mem 方法的度量,网络讲了一点异步,net profiler 没 ...
python高性能编程方法一
python高性能编程方法一阅读 Zen of Python,在Python解析器中输入 import this. 一个犀利的Python新手可能会注意到"解析"一词, 认为 ...

随机推荐

Java设计模式—解释器模式&迭代器模式简介
解释器模式在实际的系统开发中使用得非常少,因为它会引起效率.性能以及维护等问题,一般在大中型的框架型项目能够找到它的身影,如一些数据分析工具.报表设计工具.科学计算工具等,若你确实遇到" ...
Google Map API V3调用arcgis发布的瓦片地图服务
由于最近项目需要用到CAD制作的地图,但之前一直使用的是用谷歌离线瓦片地图的方式,怎么样把CAD图像地图一样有缩放,移动的功能放到网页显示成了难题, 原先的谷歌地图的代码难道就不能用了?重新写一套代码 ...
解决nexus3报Cannot open local storage 'component' with mode=rw的异常问题
起因:正常使用的公司Maven.Docker私有仓库,突然镜像不能推送,返回getsockopt: connection refused,用docker客户端登录也是返回同样的错误,查看nexus3日 ...
[转]Linux芯片级移植与底层驱动（基于3.7.4内核）
1. SoC Linux底层驱动的组成和现状为了让Linux在一个全新的ARM SoC上运行,需要提供大量的底层支撑,如定时器节拍.中断控制器.SMP启动.CPU hotplug以及底层的G ...
String对象内存分析
Java中内存分析: 栈(Stack) :存放基本类型的变量数据和对象的引用,但对象本身不存放在栈中,而是存放在堆(new 出来的对象)或者常量池中(字符串常量对象存放在常量池中). 堆(heap): ...
python 网络 socket
---恢复内容开始--- 1.socket Socket是应用层与TCP/IP协议族通信的中间软件抽象层,它是一组接口.在设计模式中,Socket其实就是一个门面模式,它把复杂的TCP/IP协议族隐藏 ...
fiddler抓取APP请求
必备环境: 1.电脑上已经安装fiddler 2.手机和电脑在同一局域网设置:Fiddler>Tools>Fiddler Options>Connections 勾选Allow r ...
[翻译] VBPieChart
VBPieChart https://github.com/sakrist/VBPieChart Pie Chart iOS control with different animations to ...
如何在CentOS 6.7上将PHP 5.3升级到PHP 5.6
如何在CentOS 6.7上将PHP 5.3升级到PHP 5.6 andyz 博客 45评论 Facebook的TwitterGoogle+Reddit 在本文中,我将介绍如何在CentOS ...
cygwin64-安装包管理工具
1.dos command, install pkg $ setup-x86_64.exe -q -P curl $ setup-x86_64.exe -q -P lynx 2. cygwin64 c ...

《Python高性能编程》——列表、元组、集合、字典特性及创建过程

《Python高性能编程》——列表、元组、集合、字典特性及创建过程的更多相关文章

随机推荐

热门专题