Day2-文件操作

文件操作流程：

1.打开文件，得到文件句柄并赋值给一个变量；

2.通过句柄对文件进行操作；

3.关闭文件

################################33

1.打开文件方法：

a.只读方式打开文件

 f = open("yesterday",encoding="utf-8")

 data = f.read()

 data2 = f.read()

 print(data)

 print('-----------data2------%s'%data2)

 执行结果：

 就如夜晚的微风

 May tease the candle flame

 ...

 When I was young

 当我年少轻狂

 -----------data2------

windows默认是gbk的编码格式，python默认是utf-8，如果不指定就使用操作系统的方式打开.文件指针，已经把data从开头读到最后，指针在最后了，所以第二个print只打印------data2----.

而且data属于文件内容，read（）方法会打开全部内容，没法对文件进行操作。

正确的打开方式：

 f=open("yesterday",'r',encoding="utf-8")    #以只读r方式utf-8的编码方式打开文件，不写默认是只读，但顺序必须在这

 data=f.read()

 print(data)

b."写"的方式打开文件

 f=open("yesterday2",'w',encoding="utf-8")

 f.write("我爱北京天安门，\n")

 f.write("天安门上太阳升")

 f.close()

 执行结果：

 生成yesterday2，内容如下

 我爱北京天安门

 天安门上太阳升

c."追加"方式打开文件

 f=open("yesterday2",'a',encoding="utf-8")   # a =append追加

 f.write("我爱北京天安门，。。。。。。\n")

 f.write("天安门上太阳升。。。。")

 f.close()

 执行结果：

 天安门上太阳升我爱北京天安门，。。。。。。

 天安门上太阳升。。。。

d.只读前几行

 yesterday2-----------------

 我爱北京天安门，

 天安门上太阳升我爱北京天安门，。。。。。。

 天安门上太阳升。。。。

 -----------------------------------------------------------

 f = open("yesterday2",'r',encoding="utf-8")

 for i in range(3):

     print(f.readlines())

 执行结果：

 ['我爱北京天安门，\n', '天安门上太阳升我爱北京天安门，。。。。。。\n', '天安门上太阳升。。。。']

 []

 []

 f = open("yesterday2",'r',encoding="utf-8")

 for line in f.readlines():

     print(line)

 执行结果：

 我爱北京天安门，

 天安门上太阳升我爱北京天安门，。。。。。。

 天安门上太阳升。。。。

 f = open("yesterday2",'r',encoding="utf-8")

 for line in f.readlines():

     #print(line)

     print(line.strip())  #strip()是把空格和换行符去掉

 执行结果：

 我爱北京天安门，

 天安门上太阳升我爱北京天安门，。。。。。。

 天安门上太阳升。。。。

e.举例：yesterday文件前9行插入“---我是分割线---”，文件正常打印

 f = open("yesterday",'r',encoding="utf-8")

 for index,line in enumerate(f.readlines()):

     if index == 9:

         print('--------我是分隔线----------')

         continue

     print(line.strip())

 执行结果：

 就如夜晚的微风

 May tease the candle flame

 ...

 (第9行)--------我是分隔线----------

 ...

 When I was young

 当我年少轻狂

问题：

如果文件是20G大小，从硬盘读到内存中，内存就8G，程序就卡住了，内存就撑爆了，f.readlines读一行存在内存中一行，所以f.readlines只适合读小文件。上面是很low的写法.
解决方案：循环一行，删除一行，即内存中只保存一行
f.正确的循环打开方式

 f = open("yesterday",'r',encoding="utf-8")

 for line in f:

     print(line.strip())

 #这种方式，一行一行的读，并且内存中只保留一行，效率最高

举例：只修改第9行，即原第9行不打印了

 f=open("yesterday",'r',encoding='utf-8')

 count=0

 for line in f:

     count += 1

     if count==9:

         print('---------我是分割线----')

         count+=1   #count加1，否则下一条语句continue会把count一直是9，跳不出去

         continue  #直接跳到for第10行开始，循环执行即print打印第10行

     print(line.strip())

read()、readline()、readlines()区别：

1.read()：每次读取整个文件，它通常用于将文件内容放到一个字符串变量中，文件过大或大于可用内存时，不可能处理；

2.readline()：.readline() 每次只读取一行，通常比 .readlines() 慢得多。仅当没有足够内存可以一次读取整个文件时，才应该使用 .readline()；

3.readlines():读取整个文件，.readlines() 自动将文件内容分析成一个行的列表，该列表可以由 Python 的 for ... in ... 结构进行处理；

2.文件句柄的增删改查

句柄tell、seek：

 f = open("yesterday",'r',encoding="utf-8")

 print(f.tell())

 0

 print(f.read(5)) #打印前5个字符，即前5位

 就如夜晚的

 print(f.tell())   #tell（）方法以字符进行计位的

 15

 f = open("yesterday",'r',encoding="utf-8")

 print(f.tell())  #打印当前位置

 0

 print(f.readline())

 就如夜晚的微风

 print(f.readline())

 May tease the candle flame

 print(f.readline())# 一下读取三行

 逗弄蜡烛的火苗

 print(f.tell())

 74

 f.seek(0)   #文件指针又回到文件第一行

 print(f.readline())  #查看到f又开始读取第一行

 就如夜晚的微风

 print(f.encoding)  #打印文件的编码

 utf-8

 print(f.fileno()) #操作系统内部有个接口打开文件，在操作系统的编号，不用，不关注

 3

 print(f.flush()) #执行语句时，先写到内存的buffer缓存，达到缓存的大小才会写入硬盘，用途是存钱时存一次刷到硬盘一次

 None

f.flush()方法：f.write()方法是写入内存的buffer，f.flush是把缓存中的内容写入到磁盘

 >>> f = open("test.text","w")  #在D盘下创建test.text文件

 >>> f.write("hello1\n")  #写入hello1字符串

 7

 >>> f.flush()   #flush后才会有，即f.write是写入内存中的

 >>> f.write("hello2\n")

 7

 >>> f.flush()

举例：打印进度条

 import sys,time

 for i in range(50):

     sys.stdout.write("#")  #sys的标准输出

     sys.stdout.flush()

     time.sleep(0.1) #秒

 ##################################################

截断：指针从第10位到第20位的字符

 f = open("yesterday",'a',encoding='utf-8')

 f.seek(10)  #指针移动到第10位

 f.truncate(20) #截取从第11位到第20位字符

 执行结果：

 我爱北京天安门，天安

读写r+：以只读和追加的方式打开

 f=open("yesterday2",'r+',encoding='utf-8')  #读写：只读和追加的方式打开

 print(f.readline())

 print(f.readline())

 print(f.readline())#指针到第三行

 print(f.seek())

 f.write("----------diao------")  #虽然指针在第3行，但还是在最后追加

 print(f.readline())

 执行结果：

 yesterday2最后一行添加----------diao------

写读w+：创建新文件，既可以写，又可以读。（结论：python2.7上这样就把源文件的字符修改掉变成新的，而python3不支持修改了。）

 f=open("yesterday3",'w+',encoding='utf-8')

 f.write("-------------diao---------\n")

 f.write("-------------diao---------\n")

 f.write("-------------diao---------\n")

 f.write("-------------diao---------\n")

 print(f.tell())

 112

 f.seek(10)

 print(f.tell())

 10

 print(f.readline())

 ---diao---------

 f.write("shouldbeatthebeginingofthesecondlien")

 f.close()

 执行结果：

 生成yesterday3文件，文件内容

 -------------diao---------

 -------------diao---------

 -------------diao---------

 -------------diao---------

 shouldbeatthebeginingofthesecondlien

总结：

写读模式没用，读写模式可以打开文件可以追加内容。
f=open("yesterday2",'r+',encoding='utf-8') #文件句柄，读写模式
f=open("yesterday2",'w+',encoding='utf-8') #文件句柄，写读模式
f=open("yesterday2",'a+',encoding='utf-8') #文件句柄，追加读模式（追加模式下不能读，a+可以读了）
f=open("yesterday2",'rb',encoding='utf-8') #文件句柄，二进制文件（二进制的方式去读）

f=open("yesterday2",'rb',encoding="utf-8")
print(f.readline())
ValueError: binary mode doesn't take an encoding argument（二进制模式不能传递encoding编码了）

二进制读：
f=open("yesterday2",'rb')
print(f.readline())
b'-------------diao---------\r\n'（b代表字节byte类型，windows上都是\r\n）
rb用途：
1.网络传输：socket传输（client--server传输文件，python3只能用二进制格式，python2还能用字符）
二进制写：
f=open("yesterday2",'wb')
f.write("hello binary\n".encode()) #字符串转换成bytes
f.close()
Hello binary 文件内部以二进制存储

windows的换行是\r\n，linux是\n.

 打开文件的模式有：

 r，只读模式（默认）。

 w，只写模式。【不可读；不存在则创建；存在则删除内容；】

 a，追加模式。【可读；   不存在则创建；存在则只追加内容；】

 "+" 表示可以同时读写某个文件

 r+，可读写文件。【可读；可写；可追加】

 w+，写读

 a+，同a

 "U"表示在读取时，可以将 \r \n \r\n自动转换成 \n （与 r 或 r+ 模式同使用）

 rU

 r+U

 "b"表示处理二进制文件（如：FTP发送上传ISO镜像文件，linux可忽略，windows处理二进制文件时需标注）

 rb

 wb

 ab

文件修改：python3上不支持在源文件上修改，现在流行两种修改文件的方式：

1.vim打开文件，是把文件内容加载到内存中，修改完后再写回源文件；（缺点：2G的文件就没法玩了）
2.打开文件，修改文件后保存到另外一个文件中；（建议使用，方法为同时打开两个文件，边读边写，修改的话是打开文件替换后另存到新文件中）

举例说明：

 f = open("yesterday2",'r',encoding="utf-8")

 f_new = open("yesterday4",'w',encoding="utf-8")

 for line in f:

     if "文件yesterday2中的一行字" in line:

         line = line.replace("文件yesterday2中的一行字","文件yesterday4中的一行字")

         f_new.write(line)

 f.close()

 f_new.close()

 执行结果：

 创建新文件yesterday4，并写入

 文件yesterday4中的一行字

with语句----------------------------------------

作用：

1.自动回收内存，自动关闭文件，释放文件资源；

2.与open区别是文件自动写入磁盘，而open方法是写入内存，必须flush后才能写入磁盘；

 with open("yesterday2","r",encoding="utf-8") as f:

     for line in f:

         print(line)

 #open后没有关闭文件，但with就会自动关闭了

在python2.7之后，with支持多文件的上下文管理，即

 with open("yesterday2",'r',encoding="utf-8") as f, \

     open("yesterday3",'r',encoding="utf-8"):

     for line in f:

         print(line)

Day2-文件操作的更多相关文章

小白的Python之路 day2 文件操作
文件操作对文件操作流程打开文件,得到文件句柄并赋值给一个变量通过句柄对文件进行操作关闭文件现有文件如下 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 1 ...
Python学习Day2笔记(集合和文件操作)
1.集合的使用列表是有序的可包含重复内容的集合是无序的不可包含重复内容的 1) 集合关系测试 #列表去重list_1=[1,4,5,6,7,8,9,7,5,4,23,2] #有重复数据 list_ ...
Python基础2 列表元祖字符串字典集合文件操作 -DAY2
本节内容列表.元组操作字符串操作字典操作集合操作文件操作字符编码与转码 1. 列表.元组操作列表是我们最以后最常用的数据类型之一,通过列表可以对数据实现最方便的存储.修改等操作定义列表 ...
Python全栈之路4--内置函数--文件操作
上节重点回顾: 判断对象是否属于某个类,例如: 列表中有个数字,但是循环列表判断长度,用len会报错;因为int不支持len,所以要先判断属于某个类,然后再进行if判断. # isinstance(对 ...
【.NET深呼吸】Zip文件操作（1）：创建和读取zip文档
.net的IO操作支持对zip文件的创建.读写和更新.使用起来也比较简单,.net的一向作风,东西都准备好了,至于如何使用,请看着办. 要对zip文件进行操作,主要用到以下三个类: 1.ZipFile ...
野路子出身PowerShell 文件操作实用功能
本文出处:http://www.cnblogs.com/wy123/p/6129498.html 因工作需要,处理一批文件,本想写C#来处理的,后来想想这个是PowerShell的天职,索性就网上各种 ...
Node基础篇（文件操作）
文件操作相关模块 Node内核提供了很多与文件操作相关的模块,每个模块都提供了一些最基本的操作API,在NPM中也有社区提供的功能包 fs: 基础的文件操作 API path: 提供和路径相关的操作 ...
归档NSKeyedArchiver解归档NSKeyedUnarchiver与文件管理类NSFileManager （文件操作）
========================== 文件操作 ========================== 一.归档NSKeyedArchiver 1.第一种方式:存储一种数据. // 归档 ...
SQL Server附加数据库报错：无法打开物理文件,操作系统错误5
问题描述: 附加数据时,提示无法打开物理文件,操作系统错误5.如下图: 问题原因:可能是文件访问权限方面的问题. 解决方案:找到数据库的mdf和ldf文件,赋予权限即可.如下图: 找到mdf ...
通过cmd完成FTP上传文件操作
一直使用 FileZilla 这个工具进行相关的 FTP 操作,而在某一次版本升级之后,发现不太好用了,连接老是掉,再后来完全连接不上去. 改用了一段时间的 Web 版的 FTP 工具,后来那个页面也 ...

随机推荐

STM32位带操作总结---浅显易懂
正在准备做毕业设计,配置LED_Config()的时候,又看到了位带操作的宏定义,我又嘀咕了,什么是位带操作,一年前在使用位带操作的时候,就查阅过好多资料,Core-M3也看过,但是对于博主这种“低能 ...
hive 动态分区数设置
当对hive分区未做设置时,报错如下: Caused by: org.apache.hadoop.hive.ql.metadata.HiveFatalException: [Error 20004]: ...
Wpf之布局
Wpf之布局上一章大家有了自己的一个Hello World的wpf程序,今天咱们就一起走进WPF,一起来看看wpF的前台xaml这门语言的魅力. 写过web 的人都知道布局这个概念,在web中布局和 ...
Thread 与 Runnable 混合使用测试
package com.dava; public class TesThread extends Thread implements Runnable { public void run() { Sy ...
spring+mybatis事务不起作用的原因
一.场景再现 @Override @Transactional public void updateById(String userId,String username) throws Excepti ...
IONIC2新建项目并添加导航
一. 基础搭建 1. 新建IONIC2项目 ionic start myApp tabs --v2 不加--v2会新建ionic1的项目 2. 运行项目 cd myApp io ...
day001-html知识点总结（-）块级。行内元素区分
-.行内元素和块级元素的区别与转换: 区别: 1.从形式上看,在标准文档流中,行内元素会水平方向呈线性排列,而块级元素会各占一行,垂着方向排列. 2.在结构使用上,块级元素可以包含行内元素和块级元素, ...
nano使用介绍
作者:Vamei 出处:http://www.cnblogs.com/vamei 严禁转载. GNU nano是Unix系统下一款常用的文本编辑器,以简单易用著称.与之相比,功能更强大的Vi和Emac ...
Java中ArrayList,Vector,LinkedList,HashMap,HashTable,HashSet对比及总结
1.所有的集合的父类都是Collection的接口 2.Set List Map 区别 A 在Set里面:无法添加元素的顺序,所以Set里面的元素不能重复 B 在List中:有索引号,类似于数组, ...
ubutun 安装php7.1x
服务器ecs上本来跑了一套nginx+php5.5,由于新项目使用的是laravel5.4,所以不得不把php升级,在此记录下在此安装的过程和遇到的问题,总体来说还算顺利 cd /usr/local/ ...

Day2-文件操作

Day2-文件操作的更多相关文章

随机推荐

热门专题