文件I/O操作

1.什么是文件I/O操作

首先I/O(input/output),即输入/输出端口,然后文件,大家应该都是是什么,一个数据,一个txt或者html文档就是一个文件。文件操作就是对文件进行读写删除等的操作。文件I/O操作,个人理解,就是与用户有交互式的文件操作,换句话就是读写操作

文件也是一个可迭代对象

2.有哪些操作:

1):I/O操作:raw_input函数,input函数即可以进行I/O操作,也就是前面说的让代码活起来,这里不再赘述

2):文件操作:

打开关闭文件:

  1. 打开文件:
    1.   open/with open/file
    2.   f=open('c:/xxx.txt')
    3.   f=file('c:/xxx.txt')(这个写法是python2特有,和open一样的)
    4.   with open('c:/xxx.txt') as f:suite
  2. 关闭文件:close(),如果使用with则不必考虑文件关闭问题,会自动关闭文件

读写操作:

r 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。
rb 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。
r+ 打开一个文件用于读写。文件指针将会放在文件的开头。
rb+ 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。
w 打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
wb 以二进制格式打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
w+ 打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
wb+ 以二进制格式打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
a 打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
ab 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
a+ 打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。
ab+

以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。

xb

以可写入的二进制形式打开

x,w都是可写入模式,X是如果路径下存在同名文件则抛出异常,但是w不管存在否,不存在则新建,存在则覆盖

当文件对象创建成功后,会自带一些文件属性:

 (以下的方法或者属性都很简单,不演示,自行练习)

f.fileno():文件描述符,描述文件大小

f.readlines():以列表形式返回所有行,每一行作为列表元素,包括行结束符(换行符\n等)

f.readline():每一次只返回一行,包括行结束符

f.next():以迭代的方式,不会移动文件指针

f.tell():返回当前指针在文件中的位置,换句话就是告诉你文件内的当前位置

f.name:属性,不为方法,不加括号,读取文件名字【什么是属性,个人理解,即不能加括号来实例化后进行调用的方法

f.flush():将缓冲区的进程结束,内容保存到文件里

f.xreadlines():比readlines更高效的方法,但已废弃

f.isatty():判断该文件是否为终端设备文件,返回一个bool值

f.truncate(size):窃取文件,内容并只保存size个字节

f.closed :属性,不加括号,判断文件是否已关闭,返回bool

f.mode :属性,获取当前文件的打开方式

f.newlines:属性,本身为换行符,行结束符字符串,如果没有读取到则返回none

f.softspace:属性,软空间,0表示输出一段数据后加入一个空格,1表示不加

f.seek(offset[, whence]):重新定位指针位置(指针这个概念很重要,很多语言都有,自行体会)

  • offset -- 开始的偏移量,也就是代表需要移动偏移的字节数

  • whence可选,默认值为 0。给offset参数一个定义,表示要从哪个位置开始偏移;0代表从文件开头开始算起,1代表从当前位置开始算起,2代表从文件末尾算起

w:就是在指针指向文件内容开头位置写入

a:就是在指针指向文件内容结尾写入

以上的属性可以赋值

读取返回出文件内容:

使用迭代法:

for I in f:  #这里直接迭代文件,效率更高,不用使用list转化为列表在迭代,并且效率不高

  pirnt (i)

注意:

读取文件:

f=open('python.txt')

for i in f:

    print(i)

此时迭代时f不加.read()则是一行一行输出,迭代时f加.read()则是一个字符逐个输出,这一点很重要

linecache

1.作用

linecache模块允许从任何文件里得到任何的行,并且使用缓存进行优化,常见的情况是从单个文件读取多行

此模块使用内存来缓存文件内容,这是需要耗费内存的,打开文件的大小和速度和电脑的内存大小有关系

2.函数:

常用函数:

linecache.checkcache(filename):检查缓存的有效性。如果在缓存中的文件在硬盘上发生了变化,并且你需要更新版本,使用这个函数。如果省略filename,将检查缓存里的所有条目。

linecache.clearcache():清除缓存。如果你不再需要先前从getline()中得到的行。读取文件之后,如果不需要使用文件的缓存时,需要在最后清理一下缓存,使linecache.clearcache()清理缓存,释放缓存。

linecache.getline(filename,lineno):从名为filename的文件中得到第lineno行。这个函数从不会抛出一个异常–产生错误时它将返回”(换行符将包含在找到的行里)。如果文件没有找到,这个函数将会在sys.path搜索。

linecache.getlines(filename):从名为filename的文件中得到全部内容,输出为列表格式,以文件每行为列表中的一个元素,并以linenum-1为元素在列表中的位置存储

linecache.updatecache(filename):更新文件名为filename的缓存。如果filename文件更新了,使用这个函数可以更新linecache.getlines(filename)返回的列表。

注意:使用linecache.getlines('XXX.txt')打开文件的内容之后,如果XXX.txt文件发生改变,当再次用linecache.getlines获取的内容并不是文件的已改变的内容,还是之前的内容,此时有两种方法:

  • 使用linecache.checkcache(filename)来更新文件在硬盘上的缓存,然后在执行linecache.getlines('XXX.txt')就可以获取到XXX.txt的最新内容;
  • 直接使用linecache.updatecache('XXX.txt'),即可获取最新的a.txt的罪行内容

其实linecache模块和文件操作很像对不?确实有点像,功能也差不多,用时自行选择:

fileinput

因为这个模块用得不是很多,基础概念已经有网友总结的很好了,所以下面部分内容我直接转载别人的,原帖:Python中fileinput模块介绍

1.作用:

fileinput模块可以对一个或多个文件中的内容进行迭代、遍历等操作。该模块的input()函数有点类似文件readlines()方法,区别在于前者是一个迭代对象,需要用for循环迭代,后者是一次性读取所有行。

用fileinput对文件进行循环遍历,格式化输出,查找、替换等操作,非常方便

2.函数:

fileinput.input()       #返回能够用于for循环遍历的对象

fileinput.input (files=None, inplace=False, backup='', bufsize=0, mode='r', openhook=None)

  • files:文件的路径列表,默认是stdin方式,多文件['1.txt','2.txt',...]
  • inplace:是否将标准输出的结果写回文件,默认不取代
  • backup:备份文件的扩展名,只指定扩展名,如.bak。如果该文件的备份文件已存在,则会自动覆盖。
  • bufsize:缓冲区大小,默认为0,如果文件很大,可以修改此参数,一般默认即可
  • mode:读写模式,默认为只读
  • openhook:该钩子用于控制打开的所有文件,比如说编码方式等

fileinput.filename()    #返回当前文件的名称

fileinput.lineno()      #返回当前已经读取的行的数量(或者序号)

fileinput.filelineno()  #返回当前读取的行的行号

fileinput.isfirstline() #检查当前行是否是文件的第一行

fileinput.isstdin()     #判断最后一行是否从stdin中读取

fileinput.close()       #关闭队列

(以下则为本人原创总结)

文件替换操作时,是可以实现,但是会修改源文件格式,添加字符串符号,换行符等的,排列也有问题,源文件留下,更改文件放在其后:

有点问题是不?别着急,我们进行测试一下:

fileinput(filename,inplace=0)中,先看inplace的作用:(不给出inplace则默认为0)

上面的replace是字符串的替换方法,如果没给出inplace则只是输出,但不会修改源文件

当inplace=1时:

当同样的操作,给出input为1之后,源文件发生改变,而带有backup=’bak’时,源文件修改的同时会备份源文件并在原来基础上加上backup参数的后缀,换句话就是备份一个源文件,然后再在源文件上修改。这样的操作在编程开发时是很需要的

看出什么没?是的,可以看出:如果不加inplace, 即默认为0,inplace=0则对比输出,不会修改源文件的;当inplace=1时不输出,修改源文件

以上的都是围绕I/O文件操作,多练习,多总结

洗礼灵魂,修炼python(19)--文件I/O操作,linecache,fileinput模块的更多相关文章

  1. Python之文件与目录操作及压缩模块(os、shutil、zipfile、tarfile)

    Python中可以用于对文件和目录进行操作的内置模块包括: 模块/函数名称 功能描述 open()函数 文件读取或写入 os.path模块 文件路径操作 os模块 文件和目录简单操作 zipfile模 ...

  2. python 关于文件夹的操作

    在python中,文件夹的操作主要是利用os模块来实现的, 其中关于文件夹的方法为:os.lister() , os.path.join() , os.path.isdir() #  path 表示文 ...

  3. 【转】Python之文件与目录操作(os、zipfile、tarfile、shutil)

    [转]Python之文件与目录操作(os.zipfile.tarfile.shutil) Python中可以用于对文件和目录进行操作的内置模块包括: 模块/函数名称 功能描述 open()函数 文件读 ...

  4. Python之文件与目录操作(os、zipfile、tarfile、shutil)

    Python中可以用于对文件和目录进行操作的内置模块包括: 模块/函数名称 功能描述 open()函数 文件读取或写入 os.path模块 文件路径操作 os模块 文件和目录简单操作 zipfile模 ...

  5. python中文件的基础操作

    打开文件的三种方式: open(r'E:\学习日记\python\code\文件的简单操作.py') open('E:\\学习日记\\python\\code\\文件的简单操作.py') open(' ...

  6. 洗礼灵魂,修炼python(17)--跨平台操作三剑客—os,os.path.sys模块

    os 1.作用: 因为客户基本都是使用不同的操作系统,在不同的系统下,要完成一个项目,那必须跨平台操作,而python本来就是一个跨平台的语言,而有了os模块,则不需要在意什么系统.并且os模块是用于 ...

  7. Python之文件和目录操作

    1.文件基本操作 python内置了打开文件的函数open(),使用规则如下:   File_object=open(filename[,access_mode][,buffering]) Filen ...

  8. python 中文件夹的操作

    文件有两个管家属性:路径和文件名. 路径指明了文件在磁盘的位置,文件名原点的后面部分称为扩展名(后缀),它指明了文件的类型. 一:文件夹操作 Python中os 模块可以处理文件夹 1,当前工作目录 ...

  9. Python中文件路径名的操作

    1 文件路径名操作 对于文件路径名的操作在编程中是必不可少的,比如说,有时候要列举一个路径下的文件,那么首先就要获取一个路径,再就是路径名的一个拼接问题,通过字符串的拼接就可以得到一个路径名.Pyth ...

  10. Python对文件的读写操作

    Python使用open函数来读写文件,open函数的第一个参数是文件名,第二个参数是可选的,有4种常见模式:(1)r 打开一个文件来读数据,这是默认模式:(2)w 打开一个文件来写数据,如果文件已有 ...

随机推荐

  1. [原创]MOF提权下载者代码

    0x001 网上的mof提权 调用的是js执行添加用户 而且有个缺陷 还不能一步到位...目标3389也连不上...也不知道上面安装了什么软件...毛然添加用户也不好比如有个类似狗之类的拦截添加用户 ...

  2. Consul内部分享ppt

    Consul 是一个支持多数据中心,分布式,高可用的服务发现和配置共享系统.由 HashiCorp 公司使用 Go 语言开发,基于Raft协议.部署起来非常容易,只需要极少的可执行程序和配置文件,具有 ...

  3. Python多进程库multiprocessing中进程池Pool类的使用

    问题起因 最近要将一个文本分割成好几个topic,每个topic设计一个regressor,各regressor是相互独立的,最后汇总所有topic的regressor得到总得预测结果.没错!类似ba ...

  4. 前端进击的巨人(六):知否知否,须知this

    常见this的误解 指向函数自身(源于this英文意思的误解) 指向函数的词法作用域(部分情况) this的应用环境 1. 全局环境 无论是否在严格模式下,全局执行环境中(任何函数体外部)this都指 ...

  5. nginx部分实现原理解析

    nginx底层实现有几个主要的模块: 进程模块 事件模块 网络模块 进程模块 默认采用守护模式启动,守护模式让master进程启动后在后台运行,不在窗口上卡住. Nginx 启动后会有一个 Maste ...

  6. ES启动报错之引导检测失败

    [--16T18::,][ERROR][o.e.b.Bootstrap ] [node-] node validation exception [] bootstrap checks failed [ ...

  7. OSPF笔记

    OSPF:现实情况中99%的网络运行的是这种路由协议 OSPF有三张表:邻居表,链路状态数据库(LSDB),路由表 SPF算法 OSPF架构为花瓣形(不同area组成花瓣)就是为了防环,因为骨干区域运 ...

  8. MVC 【Razor 视图引擎】基础操作 --页面跳转,传值,表单提交

    ASPX  与  Razor  仅仅是视图不一样. 新建项目----ASP.NET MVC 4 Web 应用程序------选择模板(空).视图引擎(Razor ) 1.视图中 c# 代码  与 HT ...

  9. HighCharts使用更多图表HighChartsMore

    添加highcharts-moreimport HighCharts from 'highcharts'import highchartsMore from 'highcharts/highchart ...

  10. 【操作系统】二、JVM线程与Linux内核线程的映射

    Linux从内核2.6开始使用NPTL (Native POSIX Thread Library)支持,但这时线程本质上还轻量级进程. Java里的线程是由JVM来管理的,它如何对应到操作系统的线程是 ...