Python IO编程-读写文件

1.1给出规格化得地址字符串，这些字符串是经过转义的能直接在代码里使用的字符串

　　需要导入os模块 import os

>>>os.path.join('user','bin','spam')　　#可以看做为连接，值得注意的是，不要认为只能这样来连接单个

'user\\bin\\spam'　　#运行结果

>>>for fileName in os.listdir(path):

      totalSize=os.path.getsize(os.path.join(path,fileName))+totalSize

#使用os.path.join()来连接

1.2当前工作目录 os.getcwd() 与 os.chdir(parameter)

 >>>import os

 >>>os.getcwd()    #取得当前工作路径的字符串

 'C:\\Python3'

 >>>os.chdir('C:\\Windows\\System32')    #改变工作路径为传入的字符#串

 #若传入路径不存在，显示FileNotFoundError错误

 >>>os.getcwd()

 'C:\\Windows\\System32'

1.3绝对路径与相对路径

　　这个没什么好说的，就是需要注意下逻辑层次是从当前目录出发的

1.4创建新文件夹 os.makedirs(parameter)

　　方法执行成功后，会创建所有必要的中间文件夹

1.5处理绝对路径与相对路径、寻找从A到B的 os.path.relpath(path,start) 、地址字符串裁切: os.path.basename(path) 、 os.path.dirname(path) 、 os.path.split(path)

 >>>os.path.abspath('.')    #将返回参数的绝对路径字符串

 ‘C:\\python3’

 >>>os.path.isabs('.')    #参数是绝对路径是返回True，否则False

 False

 >>>os.path.relpath('C:\\Windows','C:\\')　　#从后者到前者的路径。若是没有提供Start，就把当前目录作为Start

 ‘Windows’

 >>>path='C:\\Windows\\System32\\calc.exe'

 >>>os.path.dirname(path)　　#返回一个包含最后一个斜杠之前内容的字符串

 ‘C:\\Windows\\System32’

 >>>os.path.basename(path)　　#返回一个包含最后一个斜杠之后内容的字符串

 ‘calc.exe’

　　而当同时需要一个路径的目录名称和基本名称，就可以调用 os.path.split(path)来获得这两个字符串的元组

 >>>path='C:\\Windows\\System32\\calc.exe'

 >>>os.path.split(path)

 ('C:\\Windows\\System32','calc.exe')

　　此功能也可通过调用 os.path.dirname(path) os.path.basename(path) 来实现，不过你也看出来了，显然上者更应该得到我们青睐

 >>>(os.path.dirname(path),os.path.basename(path))

 ('C:\\Windows\\System32','calc.exe')

　　此外， os.path.split(path) 并不能接受一个文件路径并返回每个文件夹的字符串的列表。假如你想要实现这样的功能，可以使用 split() 字符串方法，并根据 os.path.sep 中的字符串进行分割，即将变量： os.path.sep 设置为适配与平台的正确的文件夹分割斜杠

 >>>path='C:\\Windows\\System32\\calc.exe'

 path.split(os.path.sep)　　　　#spilt()方法将返回一个列表，包含该路径的所有部分，如果向他传递os.path.sep，就能在所有操作平台上工作

 ['C:','Windows','System32','calc.exe']

1.7查看文件大小和文件夹内容

 >>>os.path.getsize('C:\\Windows\\System32\\calc.exe')

 776192

 >>>os.listdir('C:\\Windows\\System32')    #返回的是所提供的文件夹里所有文件名的字符串   ********注意这个在os里，不是os.path里

 ['1232049.cpx',

 --snip---

 '2398r09w.dll']

　　示例：

 >>>totalSize=0

 >>>path=os.getcwd()

 >>>for fileName in os.listdir(path):

       totalSize=os.path.getsize(os.path.join(path,fileName))+totalSize

 #使用os.path.join()来连接

 ''

1.8 检查路径有效性

 >>>os.path.exists('C:\\Windows')    #若指定文件夹存在

 True

 >>>os.path.isdir('C:\\Windows\\System32')    #若指定的参数存在，且是一个文件

 True

 >>>os.path.isfile('C:\\Windows\\System32')    #若指定的参数存在并且是一个文件夹

 False

2文件读写过程

　　适用于纯文本文件（即只包含基本文字字符，不包含字体、大小和颜色信息），关于二进制文件的先不做讨论，只需要知道，python中有很多模块，这些模块，使得对二进制文件的处理变得更加容易。这里我们以shelve模块为例

　　1.1读写文件

　　python中，读写文件有3个步骤：

　　　　1.调用open(parameter)函数，返回一个File对象。如果文件不存在，会创建

　　　　2.调用File对象的read()、readlines()或write()方法。

　　　　3.调用File对象的close()方法，关闭该文件。文件使用完毕后必须关闭，因为文件对象会占用操作系统的资源，并且操作系统同一时间能打开的文件数量也是有限的：

　　　　4.见补充

 >>>path='C:\\Windows\\System32'

 >>>helloFile=open(path)

 >>>helloContent=helloFile.read()　　#read()方法返回一个大字符串

 >>>helloContent

 'Hello World\nHello World'
6 >>>helloContent=helloFile.readlines()　　#readlines()方法返回一个字符串的列表，每个字符串值都已一个换行字符'\n’结束
7 >>>helloContent
8 ['Hello Content\n','Hello Content\n']

　　读模式、写模式、添加模式

　　　　是以传给open(parameter1,parameter2)的parameter2参数来区分的

　　关于 open() 的更多信息：点击

>>>baconFile=open('bacon.txt','w')    #w代表写模式，会将原有的全部清除

>>>baconFile.write('Hello world!\n')    #返回写入字符的个数

13

>>>baconFile.close()

>>>baconFile=open('bacon.txt','a')    #a代表添加模式

>>>baconFile.write('Bacon is not a vegetable.')    #返回写入字符的个数

25

　　关于写模式

　　你可以反复调用 write() 来写入文件，但是务必要调用 f.close() 来关闭文件。当我们写文件时，操作系统往往不会立刻把数据写入磁盘，而是放到内存缓存起来，空闲的时候再慢慢写入。只有调用 close() 方法时，操作系统才保证把没有写入的数据全部写入磁盘。忘记调用 close() 的后果是数据可能只写了一部分到磁盘，剩下的丢失了。所以，还是用 with 语句来得保险：

with open('/Users/michael/test.txt', 'w') as f:

    f.write('Hello, world!')

　　'w'和‘a’模式的区别，前者会直接覆盖，后者会向已有文件追加内容　　

　　要写入特定编码的文本文件，请给 open() 函数传入 encoding 参数，将字符串自动转换成指定编码。

　　在python中使用多行字符串写入

def main():

    filename='instance.py'

    path=os.path.abspath('.')

    code='''print('dir -l1')

        s

    a

    '''

    pass

#结果

print('dir -l1')

        s

    a

3用shelve模块保存变量及删除Shelve键值对

　　利用shelve模块，可以将python程序中的变量保存到二进制的shelf文件中。

>>>import shelve

>>>shelfFile=shelve.open('mydata')    #open()方法传入的是文件名，返回的值保存在变量‘shelfFile’中    *********若mydata不存在，会创建一个

>>>cats=['Zophie','Pooka','Simon']

>>>shelfFile['cats']=cats    #这个变量的值是cats（后），键也是cats（前）。键和值相互关联，就像是一个字典一样。cats（后）又被称为shelf值，这个值可以死列表（如上）

>>>shelfFile.close()

　　稍后可以使用shelve模块，重新打开这些文件并取出数据。不比选择读模式或者写模式，因为他们既能读，又能写

>>> shelfFile=shelve.open('mydata')

>>> type(shelveFile)

<class 'shelve.DbfilenameShelf'>

>>> shelfFile['cats']

['Zophie', 'Pooka', 'Simon']

>>>shelfFile.close()

　　shelve的keys()与values()方法 **********要记得是keys()不是key()

shelfFile=shelve.open('mydata')

>>> list(shelfFile.keys())　　#这些方法返回类似列表的值，而不是真正列表，所以应该将他们传递给list()函数，取得列表的形式

['cats']

>>> list(shelfFile.values())

[['Zophie', 'Pooka', 'Simon']]

>>> shelfFile.close()

　　删除shelve中的键值对

del shelfFile['cats']

　　shelve有 items() 方法

>>> for items in mcbShelve.items():

    items

('test', " and sys.argv[1].lower=='save'")

4用pprint.pformat()函数保存变量

　　 pprint.pprint() 函数将列表或字典中的内容漂亮打印到屏幕，而 pprint.pformat() 函数将返回同样的文本字符串，利用他可以将要保存的字符串到一个.py文件中

>>> import pprint

>>> cats=[{'doec': 'chubby', 'name': 'Zophie'}, {'dese': 'fluffy', 'name': 'pooka'}]

>>> pprint.pformat(cats)

"[{'doec': 'chubby', 'name': 'Zophie'}, {'dese': 'fluffy', 'name': 'pooka'}]"

>>> fileObj=open('myCats.py','w')

>>> fileObj.write('cats='+pprint.pformat(cats)+'\n')    #这样保存

81

>>> fileObj.close()

　　可以导入自己创建的.py文件

>>> import myCats

>>> myCats.cats

[{'doec': 'chubby', 'name': 'Zophie'}, {'dese': 'fluffy', 'name': 'pooka'}]

>>> myCats.cats[0]

{'doec': 'chubby', 'name': 'Zophie'}

　　虽然创建一个.py文件能让任何人都能用一个简单的文本编辑器读取和修改文件的内容，但是用shelve模块来保存数据，是将变量保存到文件的最佳方式。因为只有基本数据类型：整形、浮点型、字符串、列表和字典，可以作为简单文本写入一个文件。

四、字符编码

　　要读取非UTF-8编码的文本文件，需要给 open() 函数传入 encoding 参数，例如，读取GBK编码的文件

　　遇到有些编码不规范的文件，你可能会遇到 UnicodeDecodeError ，因为在文本文件中可能夹杂了一些非法编码的字符。遇到这种情况， open() 函数还接收一个 errors 参数，表示如果遇到编码错误后如何处理。最简单的方式是直接忽略：

>>> f = open('/Users/michael/gbk.txt', 'r', encoding='gbk', errors='ignore')

　　更多errors参数：http://www.runoob.com/python/att-string-encode.html

五、补充

　　由于文件读写过程中可能会产生 IOError ，而一旦出错，后面的 f.close 就不会调用，所以为了保证无论是否出错都能够调用 f.close() ，我们使用 try...finally 来实现：

try:

    f=open('C:/Systems/test.txt','r')

    print(f.read())

finally:

    if f:

        f.close()

　　但每次这样写会觉得太繁琐，所以我们用 with...as 语句，python引入了with语句来帮我们自动调用 close（）方法。

with open('C:/Systems/test.txt','r') as f:

    print(f.read())

　　调用 read（）方法会一次读取全部文件，假如文件特别大，超出了内存的容量，那么内存就爆了，我们可以使用 read(size) 方法来帮助我们一次读取size大小的文件。另外，还可以调用 readline() 方法， readlines() 他会读取全部内容然后返回一个按行的list

file-like object

　　像函数 open() 返回的这种有个 read() 方法的对象，在Python中统称为file-like Object。除了file外，还可以是内存的字节流，网络流，自定义流等等。file-like Object不要求从特定类继承，只要写个 read() 方法就行。 StringIO （这个应该是使用open（）返回的对象）就是在内存中创建的file-like Object，常用作临时缓冲。

二进制文件

　　直接以默认的方式调用open（），打开的是文本文件，并且是utf-8编码的，若是需要打开二进制文件（如图片、视频）需要向open（）传入rb参数

>>> f = open('/Users/michael/test.jpg', 'rb')

>>> f.read()

b'\xff\xd8\xff\xe1\x00\x18Exif\x00\x00...' # 十六进制表示的字节

打开非utf-8编码文件：

　　向open（）传入encoding参数

>>> f = open('/Users/michael/gbk.txt', 'r', encoding='gbk')

>>> f.read()

'测试'

　　使用errors参数定义遇到错误时的处理方式，比如遇到编码不规范的文件，则会出现UnicodeDecodeError错误

>>> f = open('/Users/michael/gbk.txt', 'r', encoding='gbk', errors='ignore')

Python IO编程-读写文件的更多相关文章

Python IO编程-组织文件
对于日常中遇到的批量任务,有些可以通过请求python完成自动化,我非常渴望拥有这些能力,在去年学习了python读写文件之后,我马上迫不及待的开始学习‘组织文件’,经过学习,我发现python组织文 ...
Python I/O编程 --读写文件、StringIO/ BytesIO
I/O编程 Input/Output 输入/输出 Stream(流)是一个很重要的概念,可以把流想象成一个水管,数据就是水管里的水 Input Stream就是数据从外面(磁盘.网络)流进内存,Ou ...
Python3 IO编程之文件读写
读写文件是最常见的IO操作.python内置了读写文件的函数,用法和C是兼容的. 读写文件前,我们先必须了解一个,在磁盘上读写文件的功能都是由操作系统提供的,现代操作系统不允许普通的程序终结操作磁盘, ...
Commons IO方便读写文件的工具类
Commons IO是apache的一个开源的工具包,封装了IO操作的相关类,使用Commons IO可以很方便的读写文件,url源代码等. 普通地读取一个网页的源代码的代码可能如下 InputStr ...
Java IO如何读写文件
Java把这些不同来源和目标的数据都统一抽象为数据流:Java语言的输入输出功能是十分强大而灵活的:在Java类库中,IO部分的内容是很庞大的,因为它涉及的领域很广泛:标准输入输出,文件的操作,网络上 ...
第五篇：使用无缓冲IO函数读写文件
前言本文介绍使用无缓冲IO函数进行文件读写. 所谓的无缓冲是指该IO函数通过调用系统调用实现,其实系统调用内部的读写实现也是使用了缓冲技术的. 读写步骤 1. 打开文件 open 函数 2. 读写文 ...
使用无缓冲IO函数读写文件
前言本文介绍使用无缓冲IO函数进行文件读写. 所谓的无缓冲是指该IO函数通过调用系统调用实现,其实系统调用内部的读写实现也是使用了缓冲技术的. 读写步骤 1. 打开文件 open 函数 2. 读写文 ...
python IO编程-StringIO和BytesIO
链接:https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/0014319187857 ...
IO流读写文件
读写文件如前所述,一个流被定义为一个数据序列.输入流用于从源读取数据,输出流用于向目标写数据. 下图是一个描述输入流和输出流的类层次图. 下面将要讨论的两个重要的流是 FileInputStream ...

随机推荐

Android学习心得（13）－－－ Android代码混淆（1）
我在博客上发表一些我的Android学习心得,希望对大家能有帮助. 这一篇我们讲述一下最新的ADT环境下怎样进行Android混淆在新版本号的ADT创建项目时.混码的文件不再是proguard.cf ...
【网络协议】ICMP协议、Ping、Traceroute
ICMP协议 ICMP常常被觉得是IP层的一个组成部分,它是网络层的一个协议.它传递差错报文以及其它须要注意的信息.ICMP报文通常被IP层或更高层(TCP.UDP等)使用,它是在IP数据报内 ...
单片机小白学步系列（十四）点亮第一个LED的程序分析
本篇我们将分析上一篇所写的程序代码.未来学习单片机的大部分精力,我们也将放在程序代码的编写上. 可是不用操心.我会很具体的介绍每一个程序的编写思路和各种注意事项等. 之前我们写的程序例如以下: #in ...
SQL SERVER读书笔记：阻塞与死锁
阻塞是事务隔离带来的副作用,而并不是SQL SERVER的错. 死锁则是互相争用资源而引发.由于死锁会选择牺牲者,所以死锁的危害没有阻塞大.但有时为了解决死锁,会采取对资源加锁,导致阻塞的方式来避免.
简单list转化为tree结构
1 @Override public List<Module> getTree() { List<Module> list = moduleMapper.queryList() ...
bzoj4956: [Wf2017]Secret Chamber at Mount Rushmore
F......loyd? 这范围也是..... 然而大了也不会.... #include<cstdio> #include<iostream> #include<cstr ...
jQuery不熟点总结
jQuery 事件 1 .trigger() 方法触发被选元素的指定事件类型. 2 .delegate() 事件委派 1.不占内存2.可以给未来元素(后期动态添加的元素)添加事件. 2. 添加元 ...
Blender插件之Panel
目标 [x] 总结Blender之Panel 总结 Blender之Panel需要从Blender界面组成开始理解. 直观上Blender的界面层次为 Editors ‣ Regions ‣ (Tab ...
Qt5.9 WebChannel
Qt WebChannel enables peer-to-peer communication between a server (QML/C++ application) and a client ...
C - Elephant（贪心）
Problem description An elephant decided to visit his friend. It turned out that the elephant's house ...

Python IO编程-读写文件

file-like object

Python IO编程-读写文件的更多相关文章

随机推荐

热门专题