python基础课程_学习笔记15:标准库:有些收藏夹——fileinput
标准库:有些收藏夹
fileinput
重要功能
性能 |
叙述性说明 |
input([files[,inplace[,backup]]) |
便于遍历多个输入流中的行 |
filename() |
返回当前文件的名称 |
lineno() |
返回当前(累计)的名称 |
filelineno() |
返回当前文件的行数 |
isfirstline() |
检查当前行是否是文件的第一行 |
isstdin() |
检查最后一行是否来自sys.stdin |
nextfile() |
关闭当前文件,移动到下一个文件 |
close() |
关闭序列 |
fileinput.input是当中最重要的函数。它会返回可以用于for循环遍历的对象。假设不想使用默认行为(fileinput查找须要循环变量的文件)。那么可以给函数提供(序列形式的)一个或多个文件名称。还能将inplace參数设置为真值(inplace=True)以进行原地处理。对于要訪问的每一行,须要打印出替代的内容,以返回到当前的输入文件里。
在进行原地处理的时候。可选的backup參数将文件名称扩展备份到通过原始文件创建的备份文件里。
fileinput.filename函数返回当前正在处理的文件名称。
fileinput.lineno返回当前行的行数。
这个数值是累计的,所以在完毕一个文件的处理而且開始处理下一个文件的时候,行数并不会重置。而是将上一个文件的最后行数加1作为计数的起始。
fileinput.filelineno返回当前处理文件的当前行数。每次处理完一个文件而且開始处理下一个文件时,行数都会重置为1。然后又一次開始计数。
fileinput.isfirstline函数在当前行是当前文件的第一行时返回真值,反之返回假值。
fileinput.isstdin函数在当前文件为sys.stdin时返回真值, 否则返回假值。
fileinput.nextfile函数会关闭当前文件,跳到下一个文件,跳过的行并不计。
在你知道当前文件已经处理完的情况下,就比較实用了。
fileinput.close函数关闭整个文件链,结束迭代。
$ cat numberlines.py
# File : numberlines.py
import fileinput
for line in fileinput.input(inplace=1):
line=line.rstrip()
num=fileinput.lineno()
print '%-40s # %2i' %(line,num)
$ python numberlines.py numberlines.py
结果
$ cat numberlines.py
# File : numberlines.py # 1
# 2
import fileinput # 3
# 4
for line in fileinput.input(inplace=1): # 5
line=line.rstrip() # 6
num=fileinput.lineno() # 7
print '%-40s # %2i' %(line,num) # 8
假设执行多次。则每次执行都会在每一行末尾加入多个行号。但这不一定是我们想要的效果。
$ python numberlines.py numberlines.py
结果
$ cat numberlines.py
# File : numberlines.py # 1 # 1
# 2 # 2
import fileinput # 3 # 3
# 4 # 4
for line in fileinput.input(inplace=1): # 5 # 5
line=line.rstrip() # 6 # 6
num=fileinput.lineno() # 7 # 7
print '%-40s # %2i' %(line,num) # 8 # 8
警告:要小心使用replace參数——它非常easy破坏文件。应该在不使用inplace设置的情况下细測自己的程序。在确保程序工作正常后再改动文件。
练习 遍历文本文件
脚本内容
$ cat fileinput-example-1.py
#File : fileinput-example-1.py
import fileinput
import sys
for line in fileinput.input("sys-argv-example-1.py"):
sys.stdout.write("->")
sys.stdout.write(line)
运行结果
$ python fileinput-example-1.py
-># File:sys-argv-example-1.py
->
->import sys
->
->print "Script name is",sys.argv[0]
->
->if len(sys.argv) > 1:
-> print "there is",len(sys.argv)-1,"arguments:"
-> print [x for x in sys.argv[1:]]
->else:
-> print "there are no arguments!"
练习 处理多文件
脚本内容
$ cat fileinput-example-2.py
#File : fileinput-example-2.py
import fileinput
import sys,string
import glob
for line in fileinput.input(glob.glob("sys-exit-*.py")):
if fileinput.isfirstline():
sys.stderr.write("-- reading %s --\n" % fileinput.filename())
sys.stdout.write(str(fileinput.lineno()) + " " + string.upper(line))
运行结果
$ python fileinput-example-2.py
-- reading sys-exit-example-1.py --
1 #FILE :SYS-EXIT-EXAMPLE-1.PY
2
3 IMPORT SYS
4 PRINT "HELLO"
5 SYS.EXIT(1)
6 PRINT "THERE"
7
-- reading sys-exit-example-2.py --
8 #FILE :SYS-EXIT-EXAMPLE-2.PY
9
10 IMPORT SYS
11 PRINT "HELLO"
12 TRY:
13 SYS.EXIT(1)
14 EXCEPT SYSTEMEXIT:
15 PASS
16 PRINT "THERE"
17
练习 转换CRLF为LF
$ cat fileinput-example-3.py
#File : fileinput-example-3.py
import fileinput,sys
for line in fileinput.input(inplace=1):
if line[-2:]=="\r\n":
line=line[:-2]+"\n"
sys.stdout.write(line)
版权声明:本文博主原创文章,博客,未经同意不得转载。
python基础课程_学习笔记15:标准库:有些收藏夹——fileinput的更多相关文章
- python基础课程_学习笔记13:标准库:有些收藏夹——sys
标准库:有些收藏夹 sys sys这个模块可以让你访问和python解释器联系紧密的变量和函数. sys模块中一些重要的函数和变量 函数/变量 描写叙述 argv 命令行參数,包含脚本名称 exit( ...
- python基础课程_学习笔记20:标准库:有些收藏夹——os
标准库:有些收藏夹 os os模块为您提供访问多个操作系统服务特征. os和它的子模块os.path还包含一些用于检查.构造.删除文件夹和文件的函数,以及一些处理路径的函数. os模块中一些重要函数和 ...
- python基础课程_学习笔记26:编程的乐趣
编程的乐趣 编程柔术 当你坐下来,打算如何组织计划要定时,具体程序,然而,无论什么经验.在实现时间的函数的,你会逐渐学会了原来的设计,实用的新知识.我们不应该忽视沿途汲取的教训,相反,它们用于其他设计 ...
- python基础课程_学习笔记21:文件和材料
文件和材料 打开文件 open功能是用来打开文件,语法例如,下面的: open([name[,mode[,buffering]]) open函数使用一个文件名称作为唯一的强制參数,然后返回一个文件对象 ...
- python基础教程_学习笔记14:标准库:一些最爱——re
标准库:一些最爱 re re模块包括对正則表達式的支持,由于以前系统学习过正則表達式,所以基础内容略过,直接看python对于正則表達式的支持. 正則表達式的学习,见<Mastering Reg ...
- python基础教程_学习笔记19:标准库:一些最爱——集合、堆和双端队列
版权声明:本文为博主原创文章.未经博主同意不得转载. https://blog.csdn.net/signjing/article/details/36201499 标准库:一些最爱 集合.堆和双端队 ...
- python基础教程_学习笔记18:标准库:一些最爱——shelve
版权声明:本文为博主原创文章,未经博主同意不得转载. https://blog.csdn.net/signjing/article/details/36029981 标准库:一些最爱 shelve S ...
- python基础教程_学习笔记12:充电时刻——模块
充电时刻--模块 python的标准安装包含一组模块,称为标准库. 模块 >>> import math >>> math.sin(0) 0.0 模块是程序 不论什 ...
- python基础课程_2学习笔记3:图形用户界面
图形用户界面 丰富的平台 写作Python GUI程序前,须要决定使用哪个GUI平台. 简单来说,平台是图形组件的一个特定集合.能够通过叫做GUI工具包的给定Python模块进行訪问. 工具包 描写叙 ...
随机推荐
- span标签可以使用hide()方法隐藏吗?
/获取li下的span var $span = $('ul.selector li span'); //span对象隐藏 $span.hide(); //或者 $span.css('display', ...
- ISO/OSI网络体系结构和TCP/IP协议模型
1. ISO/OSI的参考模型共有7层,由低层至高层分别为:物理层.数据链路层.网络层.传输层.会话层.表示层. 应用层.各层功能分别为: (1)物理层 提供建立.维护和拆除 ...
- C++不确定行为
一个简单的程序引发了一块让人纠结的领域,也许强调编程规范的重要性也在这把.规范了就easy避免一些问题. 程序是这种 int Change(int& a) { a = 4; return a; ...
- (Google面试题)有四个线程1、2、3、4。线程1的功能就是输出1,线程2的功能就是输出2,以此类推.........现在有四个文件ABCD。初始都为空。
现要让四个文件呈如下格式: A:1 2 3 4 1 2.... B:2 3 4 1 2 3.... C:3 4 1 2 3 4.... D:4 1 2 3 4 1.... 请设计程序. 下面举例A,对 ...
- HashMap的工作原理(转)
HashMap的工作原理是近年来常见的Java面试题.几乎每个Java程序员都知道HashMap,都知道哪里要用HashMap,知道Hashtable和HashMap之间的区别,那么为何这道面试题如此 ...
- python之enumerate()函数的探究
原地址:http://www.newsmth.net/nForum/#!article/Python/95860 最近用到enumerate()函数,于是查了相关的资料. 其中的一 ...
- Hive Metastore ObjectStore PersistenceManager自动关闭bug解析
最近在测试HCatalog,由于Hcatalog本身就是一个独立JAR包,虽然它也可以运行service,但是其实这个service就是metastore thrift server,我们在写基于Hc ...
- tolua 有些功能可以用(经过测试)
tolua 提供几个 C++ 与 Lua 进行数据交换的工具函数. ~~ tolua.type 返回一个 C++ 对象的类型描写叙述字符串. local node = display.newNode( ...
- STL之Vector(不定长数组)
vector是同一种对象的集合,每一个对象都有一个相应的整数索引值.和string对象一样,标准库将负责管理与存储元素相关的类存. 引入头文件 #include<vector> 1.vec ...
- android 图片水平反复平铺(repeat x)
<=用来反复显示的图 1.最简单方式 创建wave_repeat.xml <?xml version="1.0" encoding="utf-8"? ...