流畅的python--2 序列构成的数组
我们把文本、列表和表格叫做数据火车。。。FOR命令通常能作用于数据火车上。 ---ABC Programmer's Handbook
不管是哪种数据结构,字符串、列表、字节序列、数组、XML元素,或是数据库查询结果,他们都共用一套丰富的操作:迭代、切片、排序、还有拼接。
1、内置序列类型概览
容器序列:list、tuple和collections.duque这些序列能存放不同类型的数据。
扁平序列:str、bytes、bytearray、memoryview和array.array这些序列只能容纳一种类型。
可变序列:list、bytearray、array.array、collections.duque和memoryview
不可变序列:tuple、str、bytes
可变序列从不可变序列那里继承了一些方法。
2、列表推导和可读性
列表推导只有一作用:生成列表。列表推导读起来更方便:
>>> symbols = "python"
>>> codes = [ord(symbol) for symbol in symbols] # 使用列表推导读起来更方便
>>> codes
[112, 121, 116, 104, 111, 110]
其他的写法如下(不太建议):
>>> codes = []
>>> for symbol in symbols:
... codes.append(ord(symbol))
...
>>> codes
[112, 121, 116, 104, 111, 110]
只用列表推导来创建新的列表,并且尽量保持简单,如果列表推导的代码超过了两行,那么就要考虑是不是要用for循环了。
python会忽略代码里的[],{}和()的换行。
列表推导不会再有变量泄露的问题:
>>> x = "my precious"
>>> dummy = [ord(x) for x in 'ABC']
>>> dummy
[65, 66, 67]
>>> x # 在python2中x的取值会是'C'
'my precious'
列表推导可以帮助我们过滤或者加工序列中的元素,其运行速度不一定会比map/filter组合慢。
>>> symbols = "python"
>>> beyond_ascii = [ord(s) for s in symbols if ord(s) > 110] # 这种方法不一定慢
>>> beyond_ascii
[112, 121, 116, 111]
>>>
>>> beyond_ascii = list(filter(lambda c:c > 110, map(ord, symbols)))
>>> beyond_ascii
[112, 121, 116, 111]
生成笛卡尔积,循环的顺序调整,颜色和尺寸显示的顺序也会跟着调整。
>>> colors = ['black', 'white']
>>> sizes = ['S', 'M', 'L']
>>> tshirts = [(color, size) for color in colors for size in sizes]
>>> tshirts
[('black', 'S'), ('black', 'M'), ('black', 'L'), ('white', 'S'), ('white', 'M'), ('white', 'L')]
>>> tshirts = [(color, size) for size in sizes
... for color in colors]
>>> tshirts
[('black', 'S'), ('white', 'S'), ('black', 'M'), ('white', 'M'), ('black', 'L'), ('white', 'L')]
3、生成器
生成器表达式的语法跟列表推导的差不多,只不过把方括号变成了圆括号。生成器是逐个产出元素,而不是先建立一个完整的列表。
>>> colors = ['black', 'white']
>>> sizes = ['S', 'M', 'L']
>>> for tshirt in ('%s %s' % (c, s) for c in colors for s in sizes):
... print(tshirt)
...
black S
black M
black L
white S
white M
white L
4、元组
元组其实是对数据的记录,其每个元素都存放了记录中一个字段的数据和响应的位置。
>>> lax_coordinates = (33.9425, -118.408056) # 洛杉矶国际机场的经纬度
>>> city, year, pop, chg, area = ('Tokyo', 2003, 32450, 0.66, 8014) # 东京市的一些信息
>>> traveler_ids = [('USA', ''), ('BRA', 'CE342567'), # 一个元组列表(country_code,passport_number)
... ('ESP', 'XDA205856')]
>>> for passport in sorted(traveler_ids): # passport变量被绑定在每个元组上
... print('%s/%s' % passport) # %运算符能被匹配到对应的元组元素上
...
BRA/CE342567
ESP/XDA205856
USA/31195855
>>> for country, _ in traveler_ids: # for分别提取元组里的元素,也叫做拆包。因为元组中的第二个元素没有用,就赋值给'_'占位符
... print(country)
...
USA
BRA
ESP
4.1 元组拆包
下面都是属于元组拆包的应用:
1、所有赋值只用一行声明就写完了:city, year, pop, chg, area = ('Tokyo', 2003, 32450, 0.66, 8014)
2、用%把passport元组里的元素对应到print函数的格式化字符串的空档中:('%s/%s' % passport)
元组拆包的要求是被可迭代对象中的元素数量必须要跟接受这些元素的元素的空档数一致。另外可以用'*'来处理多余的元素。
>>> latitude, longitude = (33.9425, -118.408056) # 元组拆包,平行赋值
>>> latitude
33.9425
>>> longitude
-118.408056
>>> a = 1
>>> b = 2
>>> b, a = a, b # 交换两个变量的值
>>> a
2
>>> b
1
>>> divmod(20, 8)
(2, 4)
>>> t = (20, 8)
>>> divmod(*t) # 用*运算符把一个可迭代对象拆开作为函数的参数
(2, 4)
如同之前的例子所示,'_'是一个很好的占位符,另外还可以用'*'来处理剩下的元素。在python中,函数用*args来获取不确定数量的参数,这种概念被扩展到了平行赋值中。在平行赋值中,*前缀只能用在一个变量名前面,这个变量可以出现在赋值表达式的任何位置。
>>> a, b, *rest = range(5)
>>> a, b, rest
(0, 1, [2, 3, 4])
>>> a, b, *rest = range(3)
>>> a, b, rest
(0, 1, [2])
>>> a, b, *rest = range(2)
>>> a, b, rest
(0, 1, [])
>>> a, *body, c, d = range(5)
>>> a, body, c, d
(0, [1, 2], 3, 4)
>>> *head, b, c, d = range(5)
>>> head, b, c, d
([0, 1], 2, 3, 4)
接受表达式的元组是可以嵌套的,例如(a, b, (c, d))。
4.2 具名元组
collections.namedtuple是一个工厂函数,可以用来构建一个带字段名的元组和一个有名字的类--这个对调试程序有很大帮助。
>>> from collections import namedtuple
>>> #具名元组需要两个参数,一个是类名,一个是类的各字段的名字,由空格分隔开
>>> City = namedtuple('City', 'name country population coordinates')
>>> tokyo = City('Tokyo', 'JP', 36.933, (35.689722, 139.691667)) # 存放的数据要以一串参数的形式传入到构造函数中
>>> tokyo
City(name='Tokyo', country='JP', population=36.933, coordinates=(35.689722, 139.691667))
>>> tokyo.population # 通过字段名或者位置来获取字段的信息
36.933
>>> tokyo.coordinates
(35.689722, 139.691667)
>>> tokyo[1]
'JP'
5、切片
在列表list、元组tuple、字符串str这类序列都支持切片操作。
那为什么切片和区间会忽略最后一个元素?
- 当只有最后一个位置信息时,可以快速看出有几个元素:range(3)和my_list[:3]都返回3个元素
- 当起止位置都可见时,可以快速计算出长度,用stop-start即可
- 便于利用任意一个下表把序列分割成不重叠的两部分,只要写my_list[: x]和my_list[x: ]即可。
可以用s[a: b: c]的形式对s在a和b之间以c为间隔取值。c的值为负数意味着反向取值。
>>> s = 'bicycle'
>>> s[::3]
'bye'
>>> s[::-1]
'elcycib'
>>> s[::-2]
'eccb'
6、对序列使用+和*
+:+号两侧的序列由相同类型的数据所构成,在拼接的过程,两个被操作的序列都不会被修改。
*:把一个序列复制几份然后再拼接起来,把这个序列乘以一个整数。
+和*不会修改原来的操作对象,而是构建一个全新的序列。
>>> l = [1, 2, 3]
>>> l * 3
[1, 2, 3, 1, 2, 3, 1, 2, 3]
>>> m = ['a', 'b']
>>> l + m
[1, 2, 3, 'a', 'b']
流畅的python--2 序列构成的数组的更多相关文章
- 流畅的python之序列
python对开发者友好的根源在于:1.序列的泛型操作2.内置的元组和映身类型3.用缩进来架构的源码4.无需变量声明的强类型 序列数据共用的一套丰富的操作:迭代.切片.排序和拼接.内置序列类型:1.容 ...
- 《流畅的Python》第二部分 数据结构 【序列构成的数组】【字典和集合】【文本和字节序列】
第二部分 数据结构 第2章 序列构成的数组 内置序列类型 序列类型 序列 特点 容器序列 list.tuple.collections.deque - 能存放不同类型的数据:- 存放的是任意类型的对象 ...
- 《流畅的python》读书笔记
流畅的python 第1章 python数据模型 ---1.1 一摞Python风格的纸牌 特殊方法,即__method__,又被称为魔术方法(magic method)或者双下方法(dunder-m ...
- 流畅的python(笔记)
流畅的python中有很多奇技淫巧,整本书都在强调如何最大限度地利用Python 标准库.介绍了很多python的不常用的数据类型.操作.库等,对于入门python后想要提升对python的认识应该有 ...
- python经典书籍必看:流畅的Python
作者:熊猫烧香 链接:www.pythonheidong.com/blog/article/26/ 来源:python黑洞网 目标读者 本书的目标读者是那些正在使用 Python,又想熟悉 Pytho ...
- 流畅的python笔记
鸭子类型协议不完全总结序列:len,getitem切片:getitemv[0]分量的取值和写值:getitem和setitemv.x属性的取值和写值:getattr和setattr迭代:1)iter, ...
- 点读系列《流畅的python》
第1章 python数据模型 python的写法是由背后的魔法方法实现的,比如obj[key],解释器实际调用的是obj.__getitem__(key) 作者把魔法方法叫做双下方法,因为有两个下划线 ...
- 《流畅的Python》 第一部分 序章 【数据模型】
流畅的Python 致Marta,用我全心全意的爱 第一部分 序幕 第一章 Python数据模型 特殊方法 定义: Python解释器碰到特殊句法时,使用特殊方法激活对象的基本操作,例如python语 ...
- Redis入门 – Jedis存储Java对象 - (Java序列化为byte数组方式)
Redis入门 – Jedis存储Java对象 - (Java序列化为byte数组方式) 原文地址:http://alanland.iteye.com/admin/blogs/1600685(欢迎转载 ...
- 在python 中有时候我们用数组
在python 中有时候我们用数组操作数据可以极大的提升数据的处理效率, 类似于R的向量化操作,是的数据的操作趋于简单化,在python 中是使用numpy模块可以进行数组和矢量计算. 下面来看下简单 ...
随机推荐
- 51nod1016
1016 水仙花数 V2 1 秒 131,072 KB 160 分 6 级题 水仙花数是指一个 n 位数 ( n≥3 ),它的每个位上的数字的 n 次幂之和等于它本身.(例如:1^3 + 5^3 ...
- 【算法】串的模式匹配算法(KMP)
串的模式匹配算法 问题: 求子串位置的定位函数如何写? int index(SString S,SString T,int pos); 给定串S,子串T,问T在 ...
- HTML5-Input
HTML5拥有多个新的表单输入类型,这些新特性提供了更好的输入控制和验证(有的浏览器不支持) color.date.datetime.datetime-local.email.month.number ...
- Going Home POJ - 2195(费用流)
就是一个简单题 四个月前a的一道题,今天又看到了,再a一遍吧. 好吧 我想多了 用了bfs求最短路 其实不用的 因为没有障碍物 #include <iostream> #include ...
- 华为TaiShan 2280 ARM 服务器
华为TaiShan 2280 ARM 服务器 华为TaiShan 2280 ARM 服务器 https://e.huawei.com/cn/products/cloud-computing-dc/s ...
- restfull api交互常用状态码
2xx (成功类别) 200 Ok:标准的 HTTP 响应,表示 GET.PUT 或 POST 的处理成功. 201 Created:在创建新实例时,应返回此状态代码.例如,使用 POST 方法创建一 ...
- 【UVALive - 6534 】Join two kingdoms (树的直径的期望)
bupt spring training for 2015 #2nd J 题意 给两棵树,分别有 n,m 个节点(1 ≤ N, Q ≤ 4 × 10^4),等概率连接属于不同树的两个节点,求新树的直径 ...
- 洛谷P4155 [SCOI2015]国旗计划(贪心,树形结构,基数排序)
洛谷题目传送门 \(O(n)\)算法来啦! 复杂度优化的思路是建立在倍增思路的基础上的,看看楼上几位巨佬的描述吧. 首先数组倍长是一样的.倍增法对于快速找到\(j\)满足\(l_j+m\le r_i\ ...
- BSGS及扩展BSGS总结(BSGS,map)
蒟蒻哪里有什么总结,只能点击%YL% 还有这位ZigZagK大佬的blog \(\mbox{BSGS}\) 模板题:洛谷P3846 [TJOI2007]可爱的质数 给定\(a,b\)和模数\(\mbo ...
- [luogu2476][bzoj1079][SCOI2008]着色方案【动态规划】
题目描述 有n个木块排成一行,从左到右依次编号为1~n.你有k种颜色的油漆,其中第i种颜色的油漆足够涂ci个木块.所有油漆刚好足够涂满所有木块,即c1+c2+-+ck=n.相邻两个木块涂相同色显得很难 ...