【循序渐进学Python】11.常用标准库
安装完Python之后,我们也同时获得了强大的Python标准库,通过使用这些标准库可以为我们节省大量的时间。这里是一些常用标准库的简单说明。更多的标准库的说明,可以参考Python文档
sys 模块
sys模块能够访问与Python解释器紧密联系的变量和函数,下面是 sys
模块中一些常用的函数和变量:
argv 命令行参数,包括脚本名称
exit([arg]) 退出当前程序,可选参数给定的返回值或错误信息
modules 隐射模块名字到载入模块的字典
path 查看模块所在目录的目录名列表
platform 类似sunos5或win32平台标识符
stdin 标准输入流——一个类文件(file-like)对象
stdout 标准输出流——一个类文件对象
stderr 标准错误流——一个类文件对象
下面的示例通过 argv
获取命令行参数,然后将其反转:
import sys args = sys.argv[1:] # 跳过第一个元素(脚本名称)
args.reverse()
print ' '.join(args)
更多使用方法,可以查看Python 文档:http://docs.python.org/2/library/sys.html
os模块
os模块提供了很多访问操作系统服务的功能。下面是一些常用的函数和变量:
environ 会环境变量进行隐射
system(command) 在子shell中执行操作系统命令
sep 路径中的分隔符
pathsep 分隔路径的分隔符
linesep 行分隔符('\n','\r','\r\n')
urandom(n) 返回n自己的加密强随机数
下面示例通过 environ
变量来查询环境变量中的 path
变量值:
import os # C:\Perl64\site\bin;C:\Perl64\...
print os.environ['path']
根据不同的操作系统返回对于的路径分隔符:
# -- coding: utf-8 --
import os # 返回操作系统中的路径分隔符
# windows:'\'
# UNIX/LINUX:'/'
# Mac OS:':'
print os.sep
更多使用方法,可以查看Python 文档:http://docs.python.org/2/library/os.html
fileinput 模块
fileinput
模块可以轻松的遍历文本文件的所有行。下面是 fileinput
模块中重要的函数:
input([files[, inplace[. backup]]) 便于遍历多个输入流中的行
filename() 返回当前文件的名称
filelineno() 返回当前处理文件当前(累计)行数
isfirstline() 检查当前行是否是文件的第一行
isstdin() 检查最后一行是否来自sys.stdin
nextfile() 关闭当前文件,移动到下一个文件
close() 关闭序列
更多使用方法,可以查看Python 文档:http://docs.python.org/2/library/fileinput.html
集合
集合(set)在Python 2.3 引入。Set类位于 sets
模块中。使用集合不需要导入,直接使用即可:
print set(range(10))
# set([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
集合是由序列(或者其他可迭代对象)构建的,它们主要用于检查成员资格,因此副本是被忽略的:
print set([0, 1, 2, 3, 1, 2, 3])
# set([0, 1, 2, 3])
除了检查成员资格,还可以使用标准的集合操作,如:并集和交集,既可以使用方法,也可以直接使用运算操作符:
a = set([1,2,3])
b = set([2,3,4,5])
print a.union(b) # set([1, 2, 3, 4, 5])
print a | b # set([1, 2, 3, 4, 5]) c = a & b
print c.issubset(a) # True print c <= a # True
print c.intersection(b) # set([2, 3]) print a & b # set([2, 3])
print a.difference(b) # set([1]) print a - b # set([1])
print a.symmetric_difference(b) # set([1, 4, 5]) print a ^ b # set([1, 4, 5])
print a.copy() # set([1, 2, 3])
print a.copy() is a # False
更多使用运算符和方法,可以查看Python 文档:http://docs.python.org/2/library/sets.html
集合是可变的,且本身只能包含不可变值,但是一个包含集合的集合是常见的,这时,我们只需使用 frozenset
类型对集合进行包装即可,frozenset
构造函数可以创建给定集合的一个副本:
a = set([1,2,3])
b = set([2,3,4,5])
a.add(frozenset(b))
print a # set([1, 2, 3, frozenset([2, 3, 4, 5])])
堆
堆(heap)是优先队列的一种。使用优先队列能够以任意顺序增加对象,并且能在任何时间(可能在增加对象的同时)找到(也可能是移除)最小的元素(比列表的min方法更有效率)。在Python中没有独立的堆类型——只有一个包含一些堆操作的模块,该模块是 heapq
,包含了六个函数:
heappush(heap,x) 将x入堆
heappop(heap) 将堆中最小的元素弹出
heapify(heap) 将heap属性强制应用到任意一个列表
heapreplace(heap,x) 将堆中最小的元素弹出,同时将x入堆
nlargest(n,iter) 返回iter中第n大的元素
nsmallest(n,iter) 返回iter中第n小的元素
heappush
函数用于增加堆的项,如下:
from heapq import *
from random import shuffle data = range(10)
shuffle(data)
heap = []
for n in data:
heappush(heap,n) print heap # [0, 2, 1, 4, 3, 7, 5, 9, 6, 8] heappush(heap,0.5)
print heap # [0, 0.5, 5, 3, 1, 6, 7, 9, 8, 4, 2]
更详细的使用方法和文档,请参考Python文档:http://docs.python.org/2/library/heapq.html
堆属性(heap property)
堆元素的排序是有规则的:位于i位置上的元素总比i//2位置处的元素大(或者说位置i处的元素总比2i以及21+1位置处的元素小)
双端队列
双端队列(Double-ended queue)在需要按照元素增加的顺序来移除元素时非常有用。双端队列通过可迭代对象(比如集合)创建:
from collections import deque q = deque(range(5))
q.append(5)
q.appendleft(6) print q # deque([6, 0, 1, 2, 3, 4, 5])
print q.pop() # q.rotate(3)
print q # deque([2, 3, 4, 6, 0, 1]) q.rotate(-1)
print q # deque([3, 4, 6, 0, 1, 2])
更详细的使用方法和文档,请参考Python文档:http://docs.python.org/2/library/collections.html#collections.deque
time 模块
time 模块所包含的函数能够实现以下功能:获取当前时间、操作时间和日期、从字符串读取时间以及格式化时间字符串。日期可以使用实数(从“新纪元”的1月1日0 点开始计算到现在的秒数,新纪元是一个与平台相关的年份,对于UNIX来说是1970年),或者是包含9个整数的元组,它们分别表示下面的含义:
(2008,1,21,12,2,56,0,21,0) # 年、月、日、时、分、秒、周、儒日历、夏令时
下面是 time 模块最常用的函数:
asctime([tuple]) 将时间元组转换为字符串
localtime([secs]) 将秒数转换为日期元组,以本地时间为准
mktime(tuple) 将时间元组转换为本地时间
sleep(secs) 休眠 secs秒
strptime(string[, format]) 将字符串解析为时间元组
time() 当前时间(新纪元开始后的秒数,以UTC为准)
更详细的使用方法和文档,请参考Python文档:http://docs.python.org/2.7/library/time.html
此外,除了 time 模块,Python还提供了两个和时间密切相关的模块:
random 模块
random 模块包含返回随机数(伪随机数)的函数,下面是 random
模块的重要函数:
random() 返回 0 ≤ n < 1 之间的随机实数n,其中 0 < n ≤ 1
getrandbits(n) 以长整型形式返回n个随机数
uniform(a,b) 返回随机实数n,其中 a ≤ n < b
randrange([start],stop,[step]) 返回range(start,stop,step)中的随机数
choice(seq) 从序列seq中返回随意元素
shuffle(seq[, random]) 原地指定序列seq
sample(seq,n) 从序列seq中选择n个随机且独立的元素
下面的示例可以随机产生2008 ~ 2009 之间的随机一天:
from random import *
from time import * date1 = (2008,1,1,0,0,0,-1,-1,-1)
time1 = mktime(date1) date2 = (2009,1,1,0,0,0,-1,-1,-1)
time2 = mktime(date2) random_time = uniform(time1,time2)
print asctime(localtime(random_time))
更详细的使用方法,请参考Python文档:http://docs.python.org/2/library/random.html
shelve 模块
使用 shelve
模块提供了一个简单的文件存储方案。我们可以将一个对象持久化到文件中,如下:
import sys, shelve def main():
data = shelve.open("D:\\data.dat")
employee = {}
employee['name'] = 'sunshine'
employee['email'] = 'sunshine@gmail.com'
pid = ''
try:
data[pid] = employee
finally:
data.close() if __name__ == '__main__': main()
持久化之后,可以再次读取文件中的内容:
import sys, shelve def main():
pid = ''
data = shelve.open("D:\\data.dat")
print data[pid] # {'name': 'sunshine', 'email': 'sunshine@gmail.com'} if __name__ == '__main__': main()
更详细的使用方法,请参考Python文档:http://docs.python.org/2/library/shelve.html
参考资料&进一步阅读
【循序渐进学Python】11.常用标准库的更多相关文章
- 第二章 函数编程&常用标准库
函数编程&常用标准库 ...
- py常用标准库
functools python3中增加了更多工具函数,做业务开发时大多情况下用不到,记录一个比较常用的,给函数或者对象初始化参数 partial函数(偏函数) 把一个函数的某些参数设置默认值,返回一 ...
- Python OS模块标准库的系统接口及操作方法
Python OS模块标准库的系统接口及操作方法 os.name 返回当前操作系统名,定义了'posix','nt','mac','os2','ce','java'(我使用win7/python3.1 ...
- Python内置模块与标准库
Python内置模块就是标准库(模块)吗?或者说Python的自带string模块是内置模块吗? 答案是:string不是内置模块,它是标准库.也就是说Python内置模块和标准库并不是同一种东西. ...
- python常用标准库(时间模块 time和datetime)
常用的标准库 time时间模块 import time time -- 获取本地时间戳 时间戳又被称之为是Unix时间戳,原本是在Unix系统中的计时工具. 它的含义是从1970年1月1日(UTC/G ...
- python常用标准库(os系统模块、shutil文件操作模块)
常用的标准库 系统模块 import os 系统模块用于对系统进行操作. 常用方法 os模块的常用方法有数十种之多,本文中只选出最常用的几种,其余的还有权限操作.文件的删除创建等详细资料可以参考官方文 ...
- Python常用标准库(pickle序列化和JSON序列化)
常用的标准库 序列化模块 import pickle 序列化和反序列化 把不能直接存储的数据变得可存储,这个过程叫做序列化.把文件中的数据拿出来,回复称原来的数据类型,这个过程叫做反序列化. 在文件中 ...
- python常用标准库(压缩包模块zipfile和tarfile)
常用的标准库 在我们常用的系统windows和Linux系统中有很多支持的压缩包格式,包括但不限于以下种类:rar.zip.tar,以下的标准库的作用就是用于压缩解压缩其中一些格式的压缩包. zip格 ...
- python 常用标准库
标准库和第三方库第一手资料: 在线: 官方文档(https://docs.python.org/) 离线:交互式解释器(dir().help()函数),IPython(tab键提示.?.??) 一. ...
随机推荐
- IT部门能力评估...
IT运行成本和变化成本越来越高,IT部门是否上了一些对企业无价值的系统,是否充分利用了已有系统的价值? 随 着IT应用不断深入,庞大的企业IT系统日积月累,各种隐患渐渐显露.IT系统变得越来越复杂,运 ...
- 读写文本(.txt)文件 .NET
http://www.cnblogs.com/jx270/archive/2013/04/14/3020456.html (一) 读取文件 如果你要读取的文件内容不是很多,可以使用 File.Read ...
- js-2
var myarray= new Array(); var myarray= new Array(8); var myarray= new Array(66,80,60,59,70); var mya ...
- Windows下Git安装指南
参考<Git权威指南>安装整理,图书配套网址参见[1] 1. Cygwin下安装配置Git 1. 在Windows下安装配置Git有2种不同的方案 (1)msysGit, (2)Cygwi ...
- is running beyond physical memory limits. Current usage: 2.0 GB of 2 GB physical memory used; 2.6 GB of 40 GB virtual memory used
昨天使用hadoop跑五一的数据,发现报错: Container [pid=,containerID=container_1453101066555_4130018_01_000067] GB phy ...
- [转帖]HOWTO rename column name in Sqlite3 database
原文在此 Say you have a table and need to rename "colb" to "col_b": First you rename ...
- windows 获取以及更改CMD控制台编码[转]
本文转自 http://blog.sina.com.cn/s/blog_794b1d96010136yy.html 命令 chcp 功能:显示或设置活动代码页编号 CHCP [nnn] nnn ...
- offsetof的使用
#include <stddef.h> #define offsetof ( TYPE, m) (size_t )&reinterpret_cast< const vol ...
- 更改linux文件夹的默认颜色
我不知道正常人看Linux下面文件夹的颜色(默认为深蓝)是不是有点晕晕的,看不清楚,反正对我这样的色弱的人来说,我看着很不爽,所以我到网上去找了一下,如果修改文件夹颜色的方法,网上真实众说纷纭,很多都 ...
- 超实用的JavaScript技巧及最佳实践(下)
1.使用逻辑符号&&或者||进行条件判断 1 2 3 var foo = 10; foo == 10 && doSomething(); // is the same ...