Python中对文件的相关操作详解

文件的操作在今后的Python开发中也是使用非常频繁的。

先说下对文件操作的流程

  1. 打开文件,得到文件的一个句柄,赋值给一个变量
  2. 然后通过句柄对文件进行操作(内容的增、删、改、查)
  3. 最后要关闭文件(有打开就要有关闭,否则文件会一直被暂用,直到程序运行结束。)
文件的基本操作
#按照上面所说的流程
f = open('demo.txt')#1.打开文件,句柄赋值给f
data = f.read()#2.对文件操作,读取文件内容
print(data)#打印文件
f.close()#3.关闭文件 #按照上面的流程,就完成了对文件的基本操作
打开文件模式

前面我们用打开文件,并没有地方选择打开的模式,其实默认就是使用了“只读模式”(r),在只读模式下我们只能读取文件内容,而不能对文件进行写入,追加等操作。

那如果想要写入怎么办,这里就要用到打开模式了。

打开文件是模式有如下:

  1. r,只读模式(默认)
  2. w,只写模式。(不可读,不存在文件时则创建,存在时则删除原有内容写入新内容。)
  3. a,追加模式。(可读,不存在文件时则创建,存在时则在原有内容上追加新内容。)

那么如何使用呢?其实很简单,下面写一个例子:

f = open('demo.txt','w')
f.write('test')
f.close() #我们只需要在open的时候加上‘w’,就可以对文件进行写入操作了

如果想同时读取又可以写入怎么办?打开模式中有个‘"+"表示可以同时读写文件

  1. r+,可读写文件。(可读,可写,可追加)
  2. w+,写读
  3. a+,和a是一样的

还有一个“U”表示在读取时,可以将 \r\n自动转换成 \n

  • rU
  • r+U

"b"表示处理二进制文件,如果我们打开的文件不是文本,而且其他类型的文件就会用到这个模式

(使用场景:FTP发送上传的文件,linux中可以忽略,windows处理二进制文件时需标注)

  • rb
  • wb
  • ab
打开文件编码

前面我们都没有使用到打开编码,其实默认都是 “gbk”

如果我们文件是utf-8编码的格式,且内容中存在中文,则读取的时候不会报错可以正常读取,

如果文件是utf-8编码格式的,内容中添加了中文,这个时候我们默认编码打卡就会报错,如下:

UnicodeDecodeError: 'gbk' codec can't decode byte 0xac in position 5: illegal multibyte sequence

这个时候后我们就要用到 encoding 对打开文件编码格式的修改:

f = open('demo.txt','r+', encoding='utf-8')

#加上encoding='utf-8'就不会出现报错,或者中文乱码了
大文件操作

前面我们读取文件内容,都是一次性读取全部内容,这样操作如果文件小还行,如果文件特别大,内容特别多,比如1G、10G等,则会让我们的电脑卡死,甚至内存溢出。

针对大文件的操作,我们其实可以每次只读一行,读完一行在内存中就删除

f = open('demo.txt','r+', encoding='utf-8')

#只要使用这种循环,读一条,删一条,内存中只保存一行数据
for line in f:
print(line)
f.close()
#此方法针对大文件操作效果显著
文件修改

上面我们用追加模式打开,然后写入文件就可以把追加的内容写入到文件中了。

如果要修改和删除,是不是用读写模式,把内容读出来,修改或删除内容,然后在从新写入到文件中,就可以实现删除和修改了。

但是,我们刚刚提到了大文件,假设20G的文件,你不可能全部读出来,在修改或删除相应内容之后,在重新写入文件,你的程序直接卡死了。那怎么办呢?

其实还是用到上面大文件操作的方式,我们一条一条读,然后一条一条写

#思路就是一行一行读出源文件内容,在一行一行写入新的文件中
f = open('demo.txt', 'r+', encoding='utf-8')#原文件
f2 = open('demo2.txt', 'a', encoding='utf-8')#修改后保存的新文件 for line in f:
#判断如果行中有出现'zhangsan'则修改成'lisi'
if 'zhangsan' in line:
line = line.replace('zhangsan', 'lisi')
#判断如果行中有出现'wangwu'则跳过,既这行不添加到新文件,相当于删除了这行
elif 'wangwu' in line:
continue
f2.write(line)#最后修改过的内容一行一行写入到新的文件中
print(line) f.close()
f2.close()
with 语句

前面我们说了,文件打开就要关闭。但是我们经常忘记关闭,怎么办呢?

Python提供了一个 with语句,使用方式:

#使用with语句,当with代码块执行完毕时,内部会自动关闭并释放文件资源。
with open('demo.txt', 'r', encoding='utf-8') as f:
pass #在Python2.7以后,with还同时支持操作多个文件
with open('demo.txt', 'r', encoding='utf-8') as f, open('demo2.txt', 'r', encoding='utf-8') as f2:
pass

关于Python中的文件操作常用的方法就写这么多,还有一些如

tell
seek
seekable
...
等等之类的方法,在大家实际使用的时候在具体了解吧。

Python学习,第七课 - 文件操作的更多相关文章

  1. Python学习笔记七:文件操作

    文件操作 对照一个word文件的操作方式,来体会文件操作的内容 打开文件:f=open(“file”),提示编码错误,windows默认是GBK f=open(“file”,encoding=”utf ...

  2. Python学习第七课

    Python学习第七课 'Alex' "Alex"print('hello'*5) #重复输出字符串 print('hellowold'[2:]) #类似于切片操作:会取出 llo ...

  3. python学习 day07打卡 文件操作

    本节主要内容: 初识文件操作 只读(r,rb) 只读(w,wb) 追加(a,ab) r+读写 w+写读 a+追加写读 其他操作方法 文件的修改以及另一种打开文件句柄的方法 一. 初识文件操作 使用py ...

  4. Python基础(七)-文件操作

    一.文件处理流程 1.打开文件,得到文件句柄赋值给一个变量 2.通过句柄对文件进行操作 3.关闭文件 二.基本操作 f = open('zhuoge.txt') #打开文件 first_line = ...

  5. python学习笔记(十)、文件操作

    在前面我们了解到了没得模块,其中有一个模块为fileinput,为文件操作模块,不知道小伙伴们是否还记得? 1 打开文件 要打开文件,可以使用fileinput中的fileinput.input函数进 ...

  6. Python学习—基础篇之文件操作

    文件操作 文件操作也是编程中需要熟练掌握的技能,尤其是在后台接口编写和数据分析过程中,对各种类型的文件进行操作,获取文件信息或者对信息进行存储是十分重要的.本篇博客中将主要对常见的文本格式文件和Exc ...

  7. Python学习笔记八:文件操作(续),文件编码与解码,函数,递归,函数式编程介绍,高阶函数

    文件操作(续) 获得文件句柄位置,f.tell(),从0开始,按字符数计数 f.read(5),读取5个字符 返回文件句柄到某位置,f.seek(0) 文件在编辑过程中改变编码,f.detech() ...

  8. Python学习之路4 - 文件操作&编码转换

    文件操作 文件操作大概分三步: 把文件打开. 操作文件. 把文件关上. 打开文件 打开文件用open()函数,打开成功后返回一个资源,具体语法如下. open(要打开的文件,打开方式,打开文件的格式, ...

  9. Python学习(五) —— 文件操作

    一.文件操作 1.文件操作:数据持久化的一种      步骤:找到文件,打开文件,操作:读.写.追写,关闭文件      打开文件:f = open(文件路径,操作模式,编码方式),f:文件句柄.文件 ...

随机推荐

  1. OPENWRT X86 安装使用教程 (未完成)

    目 录  一 下载 Openwrt 镜像文件 二 将镜像文件写入目标磁盘 2.1  写盘工具 2.2 Physdiskwrite 写盘 2.3 win32diskimager 写盘 三 管理界面 3. ...

  2. codeforces 86D,Powerful array 莫队

    传送门:https://codeforces.com/contest/86/problem/D 题意: 给你n个数,m次询问,每次询问问你在区间l,r内每个数字出现的次数的平方于当前这个数的乘积的和 ...

  3. looping through multiple lists

    map: 最大长度输出: zip: 最短输出: third: 有序排列: a = ['a1', 'a2', 'a3'] b = ['b1', 'b2'] print "Map:" ...

  4. Linux 操作虚拟机、数据库

    1.打开虚拟机,输入命令:ifconfig 查看iP和端口号,端口号一般为:22 2.打开Xshell(先安装好),连接虚拟机(根据iP和端口号) 若连接成功,Xshell则会显示虚拟机的ip和端口号 ...

  5. Webpack4不求人系列(1)

    Webpack是一个现在Javascript应用程序的模块化打包器,在Webpack中JS/CSS/图片等资源都被视为JS模块,简化了编程.当Webpack构建时,会递归形成一个模块依赖关系图,然后将 ...

  6. JavaScript 构造树形结构的一种高效算法

    引言 我们经常会碰到树形数据结构,比如组织层级.省市县或者动植物分类等等数据.下面是一个树形结构的例子: 在实际应用中,比较常见的做法是将这些信息存储为下面的结构,特别是当存在1对多的父/子节点关系时 ...

  7. c++简单实现循环队列

    栈的数据结构是先进后出,而队列的数据结构就是 一个出口一个入口入口只能入队,出口只能出队 实现的代码如下: /* 循环静态队列实现 2017年8月5日07:50:58 */ #ifndef __QUE ...

  8. 我的代码真的没有bug,稍等,先试试小黄鸭调试法

    今天测试同学为了赶进度,加班去测试我的功能. 因为我的代码都写完了,也没有陪测的必要,所以就没去了~ 下午第一个问题提过来,根据经验,这个应该是测试的逻辑问题,最后他自己也发现了. 过了一会,提了第二 ...

  9. 设置文本框的 placeholder 的颜色

    使用方法: 选择器类型::-webkit-input-placeholder input::-webkit-input-placeholder{ color:rgba(144,147,153,1); ...

  10. npm install 不更改 package-lock.json 文件的解决方法

    package-lock.json 文件是版本锁定文件 package-lock.json 是在 `npm install` 时候生成的一份文件,用以记录当前状态下实际安装的各个 npm packag ...