def fileCopy(src, dst, srcEncoding, dstEncoding):
with open(src, 'r', encoding=srcEncoding) as srcfp:
with open(dst, 'w', encoding=dstEncoding) as dstfp:
dstfp.write(srcfp.read())
fileCopy('sample.txt', 'sample_new.txt', 'cp936', 'utf8')

一.文件基础和基本操作。

1.什么是文件?

为了长期保存数据以便重复使用、修改和共享,必须将数据以文件的形式存储到外部存储介质(如磁盘、U盘、光盘等)或云盘中。

文件:存储在外部介质上的数据或信息的集合 。

程序中的源程序 数据中保存着数据 图像中的像素数据 …

有序的数据序列。

2.文件中的编码

文本显示:计算机显示功能的基本问题

编码:信息从一种形式转换为另一种形式的过程

列如:ASCII码、Unicode、UTF-8…

3.常用的编码

ASCII码:是标准化字符集 7个二进制位编码,表示128个字符, ord()和chr()函数查看

Unicode:跨语言、 跨平台进行文本转换和处理,对每种语言中字符设定统一且唯一的二进制编码,每个字符两个字节长 65536 个字符的编码空间,“ 严” :Unicode的十六进制数为4E25

UTF-8编码:可变长度的Unicode的实现方式 ,“ 严” :十六进制数为E4B8A5Unicode

GBK编码 :《汉字内码扩展规范》 双字节编码

Python中字符串类型未编码 编码encode() 解码decode()

4.文件的分类:

按文件中数据的组织形式把文件分为文本文件二进制文件

a.文本文件

文本文件存储的是常规字符串,以ASCII码方式存储。如英文字母、汉字、数字字符串。由若干文本行组成,通常每行以换行符'\n'结尾。文本文件可以使用字处理软件如gedit、记事本进行编辑。

b.二进制文件

二进制文件把对象内容以字节串(bytes)进行存储,无法用记事本或其他普通字处理软件直接进行编辑,通常也无法被人类直接阅读和理解,需要使用专门的软件进行解码后读取、显示、修改或执行。常见的如图形图像文件、音视频文件、可执行文件、资源文件、各种数据库文件、各类office文档等都属于二进制文件。

优点: 更加节省空间 采用二进制无格式存储 表示更为精确

注意:

文本文件是基于字符定长的ASCII;

二进制文件编码是变长的,灵活利用率要高;

不同的二进制文件解码方式是不同的。

5.文件的操作流程

a.打开文件

建立磁盘上的文件与程序中的对象相关联

通过相关的文件对象获得

b.文件操作

读取

写入

定位

其他:追加、 计算等

c.关闭文件

切断文件与程序的联系

写入磁盘,并释放文件缓冲区

6.文件的打开

文件对象名=open(文件名[, 打开方式[, 缓冲区]])

a.文件名:指定了被打开的文件名称。

b.打开模式:指定了打开文件后的处理方式,见表7-1。

c.缓冲区:指定了读写文件的缓存模式。0表示不缓存,1表示缓存,如大于1则表示缓冲区的大小。默认值是缓存模式。

d.open( )函数返回1个文件对象,该对象可以对文件进行各种操作。

例如: f1 = open( 'file1.txt', 'r' ) f2 = open( 'file2.txt', 'w')

文件打开模式:表7-1,例7-1 文件对象属性

7.文件的对象

文件的打开方式

文件对象属性

8.文件对象的常用方法(读写函数)

9.操作实例

a.向文本文件中写入内容

 f=open('sample.txt', 'a+')
s= '文本文件的读取方法\n文本文件的写入方法\n'
f.write(s)
f.close()

更建议这样写:

 s= '文本文件的读取方法\n文本文件的写入方法\n'
with open('sample.txt','a+') as f:
f.write(s)

使用with自动关闭资源。可以在代码块执行完毕后还原进入该代码块时的现场。 不论何种原因跳出with块,总能保证文件被正确关闭。

在实际开发中,读写文件应优先考虑使用上下文管理语句with,关键字with可以自动管理资源,可以在代码块执行完毕后自动还原进入该代码块时的上下文,常用于文件操作、数据库连接、网络连接、多线程与多进程同步时的锁对象管理等场合。

with open(filename, mode, encoding) as fp: #这里写通过文件对象fp读写文件内容的语句

上下文管理语句with还支持下面的用法:

 with open('test.txt', 'r') as src, open('test_new.txt', 'w') as dst:#读写合并
dst.write(src.read())

b.随机产生10个数并写入文件中

 import random
alist=[random.randint(1,100) for i in range(10)]
data=[str(i)+'\n' for i in alist]
with open(r'D:\data.txt','w') as fp:
fp.writelines(data)

c.读取文本文件的前五个字符

 f=open( 'sample.txt', 'r')
s=f.read(5) #读取文件的前5个字符
f.close( )
print('s=',s)
print('字符串s的长度(字符个数)=', len(s))

d.读取并显示文本文件的所有行

 f=open(r'D:\Zen.txt', 'r')
while True:
line=f.readline()
if line=='':
break
print(line)
f.close()

或者可以写成这样

 f=open(r'D:\Zen.txt', 'r')
li=f.readlines()
for line in li:
print(line)
f.close()

e.将一个CP936编码格式的文本文件中的内容全部复制到另一个使用UTF8编码的文本文件中。

Python—文件的更多相关文章

  1. Linux下Python 文件内容替换脚本

    Linux下Python 文件替换脚本 import sys,os if len(sys.argv)<=4: old_text,new_text = sys.argv[1],sys.argv[2 ...

  2. 【Python文件处理】递归批处理文件夹子目录内所有txt数据

    因为有个需求,需要处理文件夹内所有txt文件,将txt里面的数据筛选,重新存储. 虽然手工可以做,但想到了python一直主张的是自动化测试,就想试着写一个自动化处理数据的程序. 一.分析数据格式 需 ...

  3. Python文件使用“wb”方式打开,写入内容

    Python文件使用"wb"方式打开,写入字符串会报错,因为这种打开方式为:以二进制格式打开一个文件只用于写入.如果该文件已存在则将其覆盖.如果该文件不存在,创建新文件. 所以写入 ...

  4. Python 文件操作函数

    这个博客是 Building powerful image classification models using very little data 的前期准备,用于把图片数据按照教程指示放到规定的文 ...

  5. python文件I/O(转)

    Python 文件I/O 本章只讲述所有基本的的I/O函数,更多函数请参考Python标准文档. 打印到屏幕 最简单的输出方法是用print语句,你可以给它传递零个或多个用逗号隔开的表达式.此函数把你 ...

  6. python 文件操作总结

    Python 文件I/O 本章只讲述所有基本的的I/O函数,更多函数请参考Python标准文档. 打印到屏幕 最简单的输出方法是用print语句,你可以给它传递零个或多个用逗号隔开的表达式.此函数把你 ...

  7. Python基础篇【第2篇】: Python文件操作

    Python文件操作 在Python中一个文件,就是一个操作对象,通过不同属性即可对文件进行各种操作.Python中提供了许多的内置函数和方法能够对文件进行基本操作. Python对文件的操作概括来说 ...

  8. python文件和元组

    python文件操作 相较于java,Python里的文件操作简单了很多 python 获取当前文件所在的文件夹: os.path.dirname(__file__) 写了一个工具类,用来在当前文件夹 ...

  9. Python文件基础

    ===========Python文件基础========= 写,先写在了IO buffer了,所以要及时保存 关闭.关闭会自动保存. file.close() 读取全部文件内容用read,读取一行用 ...

  10. python文件打包格式,pip包管理

    1..whl是python文件的一种打包格式, 在有些情况下,可以将文件的后缀名改为.zip并解压 2.cmd中,提示pip版本太低,先升级pip   pip install --upgrade pi ...

随机推荐

  1. 洛谷P3812 【模板】线性基

    题目背景 这是一道模板题. 题目描述 给定n个整数(数字可能重复),求在这些数中选取任意个,使得他们的异或和最大. 输入输出格式 输入格式: 第一行一个数n,表示元素个数 接下来一行n个数 输出格式: ...

  2. jQuery实现 自动滚屏操作

    实现自动滚屏思路: 1.滚屏即:文本的往上移动一段距离: 2.那么我们使文本每过一段时间就往上移动一段固定距离,就可实现滚屏: 3.直到文本底部出现在浏览器窗口中,专业点就是 文本移动的距离 + 浏览 ...

  3. PHP实现全自动化邮件发送 phpmailer

    PHPmailer           composer地址 function SendMail($msg,$theme,$content) { $mail = new \PHPMailer\PHPM ...

  4. Hbase 表的Rowkey设计避免数据热点

    一.案例分析 常见避免数据热点问题的处理方式有:加盐.哈希.反转等方法结合预分区使用. 由于目前原数据第一字段为时间戳形式,第二字段为电话号码,直接存储容易引起热点问题,通过加随机列.组合时间戳.字段 ...

  5. 中国软件大会上大快搜索入选中国数字化转型TOP100服务商

    大快搜索自荣获“2018中国大数据企业50强”殊荣,12月20日在由工信部指导,中国电子信息产业化发展研究院主办的2018中国软件大会上,大快搜索获评“2018中国大数据基础软件领域领军企业”称号,入 ...

  6. Ubuntu中 MySQL 的中文编码问题

    使用Ubuntu在安装好MySQL数据库之后,如果直接创建数据库,再创建数据表,那么是无法向字段插入中文的,会报Incorrect string value错误. c实现编码设置的两种方法: (1)动 ...

  7. django_ORM学生管理系统

    一.新建django项目准备工作 CMD新建项目命令:django-admin startproject [项目名称] pycharm的project目录里新建app命令:python manage. ...

  8. Java学习笔记十八:Java面向对象的三大特性之封装

    Java面向对象的三大特性之封装 一:面向对象的三大特性: 封装 继承 多态   二:封装的概念: 将类的某些信息隐藏在类内部,不允许外部程序直接访问,而是通过该类提供的方法来实现对隐藏信息的操作和访 ...

  9. spring cloud 服务注册中心eureka高可用集群搭建

    spring cloud 服务注册中心eureka高可用集群搭建 一,准备工作 eureka可以类比zookeeper,本文用三台机器搭建集群,也就是说要启动三个eureka注册中心 1 本文三台eu ...

  10. NB-IOT使用LWM2M移动onenet基础通信套件对接之APN设置

    1. 先搞懂APN是做什么的?APN指一种网络接入技术,是通过手机上网时必须配置的一个参数,它决定了手机通过哪种接入方式来访问网络.对于手机用户来说,可以访问的外部网络类型有很多,例如:Interne ...