本文将python文件操作实例进行整理,以便后续取用。

文件打开和创建

Python中使用open()函数打开或创建文件。open()的声明如下:

open(name[, mode[, buffering]]) -> file object

其中,name表示文件名,mode表示文件打开模式。其中文件打开模式mode有如下类型

r 以只读的方式打开,常用
r+ 以读写的方式打开文件
w 以写方式打开文件,如果文件已存在,会先删再写,如果文件不存在,会创建新文件再写,常用
w+ 以读写方式打开文件,如果文件已存在,会先删再写,如果文件不存在,会创建新文件再写
a 以写方式打开文件,如果文件已存在,在文件末尾继续添加,如果文件不存在,会创建新文件再写,常用
a+ 以读写方式打开文件,如果文件已存在,在文件末尾继续添加,如果文件不存在,会创建新文件再写
b 以二进制模式打开文件,可与r、w、a、+结合使用
U 支持所有的换行符号。"\r"、"\n"、"\r\n"都表示换行

open()函数返回的是一个file文件对象,可以对文件进行创建、打开、读写、关闭等操作。file对象常用方法如下:

fp.read([size]) 从文件中读取size个字节内容,作为字符串返回。如果不带参数,字符串形式返回文件全部内容
fp.readline([size]) 从文件中读取一行作为字符串返回,如果指定size,表示每行读取的字节数,依然要读完整行的内容。
fp.readlines([size]) 把文件每一行作为一个list的一个成员,并返回这个list。其实它的内部是通过循环调用readline()来实现的。如果提供size参数,size是表示读取内容的总长,也就是说可能只读到文件的一部分。
fp.write(str) 把str写到文件中,write()并不会在str后加上一个换行符
fp.writelines(seq) 把seq的内容全部写到文件中(多行一次性写入)。这个函数也只是忠实地写入,不会在每行后面加上任何东西。
fp.close() 关闭文件。python会在一个文件不用后自动关闭文件,不过这一功能没有保证,最好还是养成自己关闭的习惯。 如果一个文件在关闭后还对其进行操作会产生ValueError
fp.seek(offset[,whence]) 将文件打操作标记移到offset的位置。这个offset一般是相对于文件的开头来计算的,一般为正数。但如果提供了whence参数就不一定了,whence可以为0表示从头开始计算,1表示以当前位置为原点计算。2表示以文件末尾为原点进行计算。需要注意,如果文件以a或a+的模式打开,每次进行写操作时,文件操作标记会自动返回到文件末尾。
fp.tell() 返回文件指针当前位置,以文件的开头为原点
fp.next() 返回下一行内容,并将文件的指针移到下一行。
fp.flush() 把缓冲区的内容写入硬盘
fp.truncate([size]) 把文件裁成规定的大小,默认的是裁到当前文件操作标记的位置。如果size比文件的大小还要大,依据系统的不同可能是不改变文件,也可能是用0把文件补到相应的大小,也可能是以一些随机的内容加上去。

说明:

(1)read()、readline()、readlines()方法会把每行末尾的'\n'读取,并不会默认的把'\n'去掉。

(2)write()、writelines()分别接收字符串、字符串列表为参数写入到文件中,换行符不会自动的加入,因此,需要显式的加入换行符。

Python读取/写入的典型方法

简单示例说明Python读取文件的几种方式,具体如下:

with open('log.txt', 'r') as f:
for line in f.readlines():
## do something
with open('log.txt', 'r') as f:
for line in f:
## do something
with open('log.txt', 'r') as f:
while True:
line = f.readline()
if not line:
break
## do something
try:
fp = open('log.txt', 'r')
lines = fp.readlines()
fp.close()
except IOError, msg:
print '*** Cannot open', log.txt, ':', msg
sys.exit(1)

Python文件写入的方式如下:

with open('log.txt', 'w') as f:
f.write('Hello, world!')
with open('log.txt', 'w') as f:
f.writelines(["Hello", "World"])
f = open('log.txt', 'w')
f.write('Hello World\n')
f.writelines(["Hello", "World"])
f.close

操作文件常用类库

os/os.path、sys、shutil、fileinput、configparser、linecache、

文件操作实例

1、查找指定目录下包含指定关键词的文件

#-*- coding:utf-8 -*-#

import os

current_dir = os.getcwd()
keyword = '.py' for roots, dirs, files in os.walk(current_dir):
for fn in files:
if keyword in fn:
print os.path.join(roots, fn) os.system('pause')

2、根据指定关键字搜索文件内容并输出文件名

#-*- coding:utf-8 -*-#

import os

current_dir = os.getcwd()
keywords = ['Happy', 'New', 'Year'] flag = True
for roots, dirs, files in os.walk(current_dir):
for fn in files:
fp_abspath = os.path.join(roots, fn)
fp = open(fp_abspath, 'r')
fp_str = fp.read()
for keyword in keywords:
if keyword not in fp_str:
flag = False
if flag:
print fp_abspath
fp.close() os.system('pause')

3、实现将指定目录下的文件内容合并到一个文件。

#-*- coding:utf-8 -*-#

import os
import fileinput current_dir = os.getcwd()
file_lists = []
combine_file = 'combine_files.txt' if os.path.exists(combine_file):
os.remove(combine_file) for roots, dirs, files in os.walk(current_dir):
for fn in files:
if fn.endswith('.txt'):
file_lists.append(os.path.join(roots, fn))
print file_lists
for eachLine in fileinput.input(files=file_lists, inplace=True):
if fileinput.isfirstline():
#print fileinput.filename()
print os.path.split(fileinput.filename())[1]
print eachLine, fw = open(combine_file, 'w') for fn in file_lists:
fp = open(fn, 'r')
fw.writelines(fp.readlines())
fp.close() fw.close()

4、将指定文件内容按行拆分,每行单独写入一个文件。并在每行的起始处标记行号。

# -*- coding: utf-8 -*-

import os
import sys filename = 'temp_1.txt'
filename_prefix = os.path.splitext(filename)[0]
filename_posfix = os.path.splitext(filename)[1] if not os.path.exists(filename):
print "THe %s file not exist,please check" % (filename,) fp = open(filename, 'r')
line_no = 1
for eachLine in fp.readlines():
filename_eachLine = filename_prefix + '_Line_' + str(line_no) + filename_posfix
fw_eachLine = open(filename_eachLine, 'w')
fw_eachLine.write('Line ' + str(line_no) + ': ' + eachLine.rstrip())
fw_eachLine.close()
line_no += 1
fp.close()
print "End the script,exit"

[ Python入门教程 ] Python文件基本操作的更多相关文章

  1. [ Python入门教程 ] Python字典数据类型及基本操作

    字典是Python中重要的数据类型,字典是由"键-值"对组成的集合,"键-值"对之间用逗号隔开,包含在一对花括号中.字典中的"值"通过&qu ...

  2. boost.python入门教程 ----python 嵌入c++

    Python语言简介 Python是一种脚本语言.以开放的开发接口和独特的语法著称.尽管Python在国内引起注意只有几年的时间,但实际上Python出现于上世纪90年代(据www.python.or ...

  3. [ Python入门教程 ] Python文件基本操作_shutil模块

    shutil模块是对os模块中文件操作的补充,提供文件和目录的移动.复制.打包.压缩.解压等功能 shutil常用函数   shutil.copyfile(src, dst)   复制文件, 如果ds ...

  4. [ Python入门教程 ] Python基础语法

    Python的语法非常简练,因此用Python编写的程序可读性强.容易理解.本章将介绍Python的基本语法和概念. Python文件类型 1.源代码.Python的源代码的扩展名以py结尾,可直接运 ...

  5. [ Python入门教程 ] Python中JSON模块基本使用方法

    JSON (JavaScript Object Notation)是一种使用广泛的轻量数据格式,Python标准库中的json模块提供了一种简单的方法来编码和解码JSON格式的数据.用于完成字符串和p ...

  6. [ Python入门教程 ] Python中日志记录模块logging使用实例

    python中的logging模块用于记录日志.用户可以根据程序实现需要自定义日志输出位置.日志级别以及日志格式. 将日志内容输出到屏幕 一个最简单的logging模块使用样例,直接打印显示日志内容到 ...

  7. [ Python入门教程 ] Python的控制语句

    Python控制语句由条件语句.循环语句构成.控制语句根据条件表达式控制程序的流转.本章将介绍Python中控制语句的基本语法. 条件判断语句 (1)if条件语句 if语句用于检测某个条件是否成立.如 ...

  8. [ Python入门教程 ] Python中日期时间datetime模块使用实例

    Python中datetime模块提供强大易用的日期处理功能,用于记录程序操作或修改时间.时间计算.日志时间显示等功能.datatime模块重新封装了time模块,提供的类包括date.time.da ...

  9. [ Python入门教程 ] Python生成随机数模块(random)使用方法

    1.使用randint(a,b)生成指定范围内的随机整数.randint(a,b)表示从序列range([a,b])中获取一个随机数,包括b. >>> random.randint( ...

随机推荐

  1. 解决原生javascript 缺少insertAfter的功能,非Jquery方法

    在现有的方法后插入一个新元素,你可能会想:既然有insertBefore方法,是不是也有一个相应的insertAfter()方法.很可惜,DOM没有提供方法.下面编写insertAfter函数,虽然D ...

  2. CentOS下安装FreeTDS

    导读 官方网站:http://www.freetds.org 下载地址:http://ibiblio.org/pub/Linux/ALPHA/freetds/stable/freetds-stable ...

  3. 第二十二节:Asp.Net Core中使用托管服务实现后台任务

    1. 说明 BackgroundService 是用于实现长时间运行的 IHostedService 的基类,使用程序集:Microsoft.Extensions.Hosting. 2. 实现方式 继 ...

  4. Python term 模块

    Python term 模块 term 模块适用于文字编辑,样式切换,光标移动 等一系列操作适用于终端命令行文字光标处理等操作. 安装 pip install py-term 使用方式 方式一 imp ...

  5. 【UOJ#49】【UR #3】轴仓库

    [UOJ#49][UR #3]轴仓库 题面 UOJ 题解 不难发现一定是每次找到离当前位置最近的一个箱子,然后把它搬过来. 那么如果我们能够确定起始位置,我们就可以二分从两侧多少距离搬箱子,判断一下时 ...

  6. express捕获全局异常的三种方法

    场景 express的路由里抛出异常后,全局中间件没办法捕获,需要在所有的路由函数里写try catch,这坑爹的逻辑让人每次都要多写n行代码 官方错误捕获中件间代码如下 app.use(functi ...

  7. ActiveMQ反序列化(CVE-2015-5254) && ActiveMQ任意文件写入 (CVE-2016-3088)

    ActiveMQ 反序列化漏洞(CVE-2015-5254) 漏洞详情 ActiveMQ启动后,将监听61616和8161两个端口,其中消息在61616这个端口进行传递,使用ActiveMQ这个中间件 ...

  8. [b0010] windows 下 eclipse 开发 hdfs程序样例 (二)

    目的: 学习windows 开发hadoop程序的配置 相关: [b0007] windows 下 eclipse 开发 hdfs程序样例 环境: 基于以下环境配置好后. [b0008] Window ...

  9. sparkSQL中的example学习(2)

    UserDefinedUntypedAggregate.scala(默认返回类型为空,不能更改) import org.apache.spark.sql.{Row, SparkSession} imp ...

  10. Django 练习班级管理系统八 -- 上传文件

    Form表单上传文件 修改 views.py import os def upload(request): if request.method == 'GET': img_list = models. ...