2.2 容器

本节讨论列表（list），字典（dict）和集合（set）。

概述

通常，程序必须处理许多对象。

股票的投资组合
股票价格表

这里有三种主要的选择（译注：数据结构）可以使用：

列表。有序的数据。
字典。无序的数据。
集合。互异且无序的数据。

把列表当作容器

当数据顺序很重要时，请使用列表。记住，列表可以存储任何类型的对象。例如，包含元组的列表：

portfolio = [

    ('GOOG', 100, 490.1),

    ('IBM', 50, 91.3),

    ('CAT', 150, 83.44)

]

portfolio[0]            # ('GOOG', 100, 490.1)

portfolio[2]            # ('CAT', 150, 83.44)

列表构建

从零开始构建列表。

records = []  # Initial empty list

# Use .append() to add more items

records.append(('GOOG', 100, 490.10))

records.append(('IBM', 50, 91.3))

...

从文件读取记录的示例：

records = []  # Initial empty list

with open('Data/portfolio.csv', 'rt') as f:

    next(f) # Skip header

    for line in f:

        row = line.split(',')

        records.append((row[0], int(row[1]), float(row[2])))

把字典当作容器

如果要快速随机查找（通过键名），那么字典很有用。例如，股票价格字典：

prices = {

   'GOOG': 513.25,

   'CAT': 87.22,

   'IBM': 93.37,

   'MSFT': 44.12

}

以下是一些简单的查找：

>>> prices['IBM']

93.37

>>> prices['GOOG']

513.25

>>>

字典构建

从零开始构建字典的示例：

prices = {} # Initial empty dict

# Insert new items

prices['GOOG'] = 513.25

prices['CAT'] = 87.22

prices['IBM'] = 93.37

从文件内容填充字典的示例：

prices = {} # Initial empty dict

with open('Data/prices.csv', 'rt') as f:

    for line in f:

        row = line.split(',')

        prices[row[0]] = float(row[1])

注意：如果是在 Data/prices.csv 文件上尝试此操作，会发现几乎可以正常工作——但是，在末尾有一个空行导致程序崩溃了。需要找出一些方法来修改代码以解决此问题（参见练习 2.6）。

字典查找

测试键是否存在：

if key in d:

    # YES

else:

    # NO

可以查找可能不存在的值，并在值不存在的情况下提供默认值。

name = d.get(key, default)

示例：

>>> prices.get('IBM', 0.0)

93.37

>>> prices.get('SCOX', 0.0)

0.0

>>>

组合键

在Ｐython 中，几乎任何类型的值都可以用作字典的键。字典的键必须是不可变类型。例如，元组：

holidays = {

  (1, 1) : 'New Years',

  (3, 14) : 'Pi day',

  (9, 13) : "Programmer's day",

}

然后访问：

>>> holidays[3, 14]

'Pi day'

>>>

列表，集合或者其它字典都不能用作字典的键，因为列表和字典（译注：集合也是使用哈希技术实现的）是可变的。

集合

集合是互异且无序的数据。

tech_stocks = { 'IBM','AAPL','MSFT' }

# Alternative syntax

tech_stocks = set(['IBM', 'AAPL', 'MSFT'])

集合对于成员关系测试很有用。

>>> tech_stocks

set(['AAPL', 'IBM', 'MSFT'])

>>> 'IBM' in tech_stocks

True

>>> 'FB' in tech_stocks

False

>>>

集合对于消除重复也很有用。

names = ['IBM', 'AAPL', 'GOOG', 'IBM', 'GOOG', 'YHOO']

unique = set(names)

# unique = set(['IBM', 'AAPL','GOOG','YHOO'])

其它集合操作：

names.add('CAT')        # Add an item

names.remove('YHOO')    # Remove an item

s1 | s2                 # Set union

s1 & s2                 # Set intersection

s1 - s2                 # Set difference

练习

在这些练习中，你开始构建的程序是本课程剩余部分使用的主要程序之一。请在 Work/report.py 文件中工作。

练习 2.4：包含元组的列表

Data/portfolio.csv 文件包含投资组合中的股票列表。在练习 1.30 中，你编写了一个读取该文件并执行简单计算的 portfolio_cost(filename) 函数。

代码看起来应该像下面这样：

# pcost.py

import csv

def portfolio_cost(filename):

    '''Computes the total cost (shares*price) of a portfolio file'''

    total_cost = 0.0

    with open(filename, 'rt') as f:

        rows = csv.reader(f)

        headers = next(rows)

        for row in rows:

            nshares = int(row[1])

            price = float(row[2])

            total_cost += nshares * price

    return total_cost

请使用这些代码作为指导，创建一个新文件 report.py 。在 report.py 文件中，定义 read_portfolio(filename) 函数，该函数打开 Data/portfolio.csv 文件并将其读入到包含元组的列表中。为此，你需要对上面的代码做一些小修改。

首先，创建一个最初设为空列表的变量，而不是定义 total_cost = 0。例如：

portfolio = []

接着，把每一行准确地存储到元组中（就像在上次的练习中做的那样），然后把元组追加到列表中，而不是合计总的费用。

for row in rows:

    holding = (row[0], int(row[1]), float(row[2]))

    portfolio.append(holding)

最后，返回得到的portfolio 列表。

请交互式地试验函数（提醒，要执行此操作，首先需要在解释器运行 report.py 程序）。

提示：当在终端执行文件的时候，请使用 -i 参数。

>>> portfolio = read_portfolio('Data/portfolio.csv')

>>> portfolio

[('AA', 100, 32.2), ('IBM', 50, 91.1), ('CAT', 150, 83.44), ('MSFT', 200, 51.23),

    ('GE', 95, 40.37), ('MSFT', 50, 65.1), ('IBM', 100, 70.44)]

>>>

>>> portfolio[0]

('AA', 100, 32.2)

>>> portfolio[1]

('IBM', 50, 91.1)

>>> portfolio[1][1]

50

>>> total = 0.0

>>> for s in portfolio:

        total += s[1] * s[2]

>>> print(total)

44671.15

>>>

创建的包含元组的列表非常类似于二维（2-Ｄ）数组。例如，使用诸如 portfolio[row][column] （ row 和column 是整数）的查找来访问特定的列和行。

也就是说，可以使用像下面这样的语句重写最后的 for 循环：

>>> total = 0.0

>>> for name, shares, price in portfolio:

            total += shares*price

>>> print(total)

44671.15

>>>

练习 2.5：包含字典的列表

使用字典（而不是元组）修改在练习 2.4 中编写的函数来表示投资组合中的股票。在字典中，使用字段名 "name", "shares" 和 "price" 来表示输入文件中的不同列。

以与练习 2.4 中相同的方式试验这个新的函数。

>>> portfolio = read_portfolio('Data/portfolio.csv')

>>> portfolio

[{'name': 'AA', 'shares': 100, 'price': 32.2}, {'name': 'IBM', 'shares': 50, 'price': 91.1},

    {'name': 'CAT', 'shares': 150, 'price': 83.44}, {'name': 'MSFT', 'shares': 200, 'price': 51.23},

    {'name': 'GE', 'shares': 95, 'price': 40.37}, {'name': 'MSFT', 'shares': 50, 'price': 65.1},

    {'name': 'IBM', 'shares': 100, 'price': 70.44}]

>>> portfolio[0]

{'name': 'AA', 'shares': 100, 'price': 32.2}

>>> portfolio[1]

{'name': 'IBM', 'shares': 50, 'price': 91.1}

>>> portfolio[1]['shares']

50

>>> total = 0.0

>>> for s in portfolio:

        total += s['shares']*s['price']

>>> print(total)

44671.15

>>>

在这里可以看到，每个条目的不同字段是通过键名来访问的，而不是数字类型的列号。这通常是首选方式，因为这样得到的代码在以后易于阅读。

查看大型的字典或者列表可能会很混乱。要使调试的输出变得整洁，可以考虑使用 pprint() 函数。

>>> from pprint import pprint

>>> pprint(portfolio)

[{'name': 'AA', 'price': 32.2, 'shares': 100},

    {'name': 'IBM', 'price': 91.1, 'shares': 50},

    {'name': 'CAT', 'price': 83.44, 'shares': 150},

    {'name': 'MSFT', 'price': 51.23, 'shares': 200},

    {'name': 'GE', 'price': 40.37, 'shares': 95},

    {'name': 'MSFT', 'price': 65.1, 'shares': 50},

    {'name': 'IBM', 'price': 70.44, 'shares': 100}]

>>>

练习 2.6：把字典当作容器

在使用索引而不是数字查找某元素的地方，字典是一种用来跟踪元素的很有用的方式。在 Python shell 中，尝试使用字典：

>>> prices = { }

>>> prices['IBM'] = 92.45

>>> prices['MSFT'] = 45.12

>>> prices

... look at the result ...

>>> prices['IBM']

92.45

>>> prices['AAPL']

... look at the result ...

>>> 'AAPL' in prices

False

>>>

该 Data/prices.csv 文件包含一系列带有股票价格的行，看起来像下面这样：

"AA",9.22

"AXP",24.85

"BA",44.85

"BAC",11.27

"C",3.72

...

编写 read_prices(filename)函数将诸如此类的价格集合读取到字典中，字典的键代表股票的名字，字典的值代表股票的价格。

为此，从空字典开始，并且像上面做的那样开始插入值。但是，现在正在从从文件中读取值。

我们将使用该数据结构快速查找给定名称的股票的价格。

这部分需要一些小技巧。首先，确保像之前做的那样使用 csv 模块——无需在这里重复发明轮子。

>>> import csv

>>> f = open('Data/prices.csv', 'r')

>>> rows = csv.reader(f)

>>> for row in rows:

        print(row)

['AA', '9.22']

['AXP', '24.85']

...

[]

>>>

另外一个小麻烦是 Data/prices.csv 文件可能有一些空行在里面。注意上面数据的最后一行是一个空列表——意味在那一行没有数据。

这有可能导致你的程序因为异常而终止。酌情使用 try 和 except 语句捕获这些异常。思考：使用 if 语句来防范错误的数据是否会更好？

编写完 read_prices() 函数，请交互式地测试它并确保其正常工作：

>>> prices = read_prices('Data/prices.csv')

>>> prices['IBM']

106.28

>>> prices['MSFT']

20.89

>>>

练习 2.7：看看你是否可以退休

通过添加一些计算盈亏的语句到 report.py 程序，将所有的工作联系到一起。这些语句应该采用在练习 2.5 中存储股票名称的列表，以及在练习 2.6 中存储股票价格的字典，并计算投资组合的当前值以及盈亏。

目录 | 上一节 (2.1 数据类型) | 下一节 (2.3 格式化)

注：完整翻译见 https://github.com/codists/practical-python-zh

翻译：《实用的Python编程》02_02_Containers的更多相关文章

翻译：《实用的Python编程》InstructorNotes
实用的 Python 编程--讲师说明作者:戴维·比兹利(David Beazley) 概述对于如何使用我的课程"实用的 Python 编程"进行教学的问题,本文档提供一些通用 ...
翻译：《实用的Python编程》README
欢迎光临大约 25 年前,当我第一次学习 Python 时,发现 Python 竟然可以被高效地应用到各种混乱的工作项目上,我立即被震惊了.15 年前,我自己也将这种乐趣教授给别人.教学的结果就是本 ...
翻译：《实用的Python编程》05_02_Classes_encapsulation
目录 | 上一节 (5.1 再谈字典) | 下一节 (6 生成器) 5.2 类和封装创建类时,通常会尝试将类的内部细节进行封装.本节介绍 Python 编程中有关封装的习惯用法(包括私有变量和私有属 ...
翻译：《实用的Python编程》04_02_Inheritance
目录 | 上一节 (4.1 类) | 下一节 (4.3 特殊方法) 4.2 继承继承(inheritance)是编写可扩展程序程序的常用手段.本节对继承的思想(idea)进行探讨. 简介继承用于特 ...
翻译：《实用的Python编程》01_02_Hello_world
目录 | 上一节 (1.1 Python) | 下一节 (1.3 数字) 1.2 第一个程序本节讨论有关如何创建一个程序.运行解释器和调试的基础知识. 运行 Python Python 程序始终在解 ...
翻译：《实用的Python编程》03_03_Error_checking
目录 | 上一节 (3.2 深入函数) | 下一节 (3.4 模块) 3.3 错误检查虽然前面已经介绍了异常,但本节补充一些有关错误检查和异常处理的其它细节. 程序是如何运行失败的 Python 不 ...
翻译：《实用的Python编程》03_04_Modules
目录 | 上一节 (3.3 错误检查) | 下一节 (3.5 主模块) 3.4 模块本节介绍模块的概念以及如何使用跨多个文件的函数. 模块和导入任何一个 Python 源文件都是一个模块. # f ...
翻译：《实用的Python编程》03_05_Main_module
目录 | 上一节 (3.4 模块) | 下一节 (3.6 设计讨论) 3.5 主模块本节介绍主程序(主模块)的概念主函数在许多编程语言中,存在一个主函数或者主方法的概念. // c / c++ ...
翻译：《实用的Python编程》04_01_Class
目录 | 上一节 (3.6 设计讨论) | 下一节 (4.2 继承) 4.1 类本节介绍 class 语句以及创建新对象的方式. 面向对象编程(OOP) 面向对象编程是一种将代码组织成对象集合的编程 ...

随机推荐

ubuntu下scala下载+集成IDEA开发环境
环境须知: ubuntu 16.04 scala 2.11.0 jdk 1.8.0 Idea 2016.3 JDK环境安装 (1)安装jdk, 注意scala很好的支持jdk 1.8 的jvm 编译环 ...
cassandra权威指南读书笔记--客户端
DataStax驱动最成熟.默认,驱动程序会使用第一个连接的节点作为支持的版本协议.如果集群存在高低版本的节点(比如升级场景),如果驱动先连接不同不同版本的节点,可能会出现不兼容.驱动支持压缩客户端和 ...
workflow定时任务部分失败
workflow遇到一个问题,每天定时任务导致部分失败,截图如下目前这个问题现场出现过是重启wf解决的 ,但是也给研发排查了,根本原因不清楚,不确保现场还会再遇到.
Codeforces Round #628 (Div. 2) D. Ehab the Xorcist（异或，思维题）
题意: 寻找异或后值为 u,相加后和为 v 的最短数组. 思路: 异或得 u ,则 v 至少应大于等于 u ,且多出来的部分可以等分为两份相消. 即初始数组为 u , (v-u)/2 , (v-u)/ ...
SPOJ1812 LCS2 - Longest Common Substring II【SAM LCS】
LCS2 - Longest Common Substring II 多个字符串找最长公共子串以其中一个串建\(SAM\),然后用其他串一个个去匹配,每次的匹配方式和两个串找\(LCS\)一样,就是 ...
poj 1113 wall(凸包裸题)（记住求线段距离的时候是点积，点积是cos）
Wall Time Limit: 1000MS Memory Limit: 10000K Total Submissions: 43274 Accepted: 14716 Descriptio ...
Alice's mooncake shop HDU - 4122 单调队列
题意: 有n个订单和可以在m小时内制作月饼,制作月饼不考虑时间(即,你可以在一个时刻在所有需要的月饼都做完) 接下来是n个订单的信息:需要在mon月,d日,year年,h小时交付订单r个月饼接下来一 ...
zoj3905 Cake
Time Limit: 4 Seconds Memory Limit: 65536 KB Alice and Bob like eating cake very much. One day, ...
- Visible Trees HDU - 2841 容斥原理
题意: 给你一个n*m的矩形,在1到m行,和1到n列上都有一棵树,问你站在(0,0)位置能看到多少棵树题解: 用(x,y)表示某棵树的位置,那么只要x与y互质,那么这棵树就能被看到.不互质的话说明前 ...
WSL2 使用Docker运行.NET Core
Docker的安装在前面说过了,此处就不说了,我们检查一下版本: 步入正题. 首先,我们为项目创建Dockerfile(无扩展名) 确保Docker是启动状态: 构建镜像,注意名称必须是全部小写(此处 ...

翻译：《实用的Python编程》02_02_Containers