python学习day9 字符编码和文件处理

1.字符编码

x='上'

#unicode的二进制---------》编码--------》gbk格式的二进制

res=x.encode('gbk') #bytes 字节类型

print(res,type(res))

m=res.decode('gbk')

print(m) #把gbk解码成unicode，python打印自动转换成字符

2.文件处理

　　1.什么是文件

　　文件是操作系统为应用程序或者用户提供一种操作硬盘的虚拟单位

　　强调：

　　　　文件是操作系统提供的虚拟单位

　　　　应用程序或者用户对文件的读写操作其实都是向操作系统发送指令

　　2.为何要用文件

　　　　文件对应的硬盘空间，如果需要考虑永久保存数据那必须使用文件

　　3.如何用文件

　　　路径问题

　　　　绝对路径优点：无论从哪里运行，都能找到文件

　　　　　　　　缺点：比较冗长

　　　　win： c:\a\b\c\d.txt

　　　　linux: /a/b/c/d.txt

　　　　相对路径:相当于当前执行文件所在文件夹优点：比较简洁

　　　　　　　　　　　　　　　　　　　　　　　缺点：必须在执行文件夹中才能找到文件

　　　　a/b/c/d.txt

　　　　(1)打开文件

　　　　f=open(r'D:\abc\d\e.txt',mode='rt',encoding='utf-8') 以utf-8字符编码表解码保存在硬盘中的文件打开到内存中。python应用程序会申请内存空间，存放f，另外会向操作系统发出申请，将文件读取进内存，f返回一个文件句柄

　　　　print(f)

　　　　（2）读/写文件

　　　　　　data=f.read（） # 一次性把文件全部读出

　　　　　　print （data）

　　　　（3）关闭文件

　　　　f.close() # 向操作系统发送指令，让操作系统关闭打开的文件，回收操作系统资源

　　　　print(f)

　　　　f.read

　　　　上下文管理

　　　　with open('a.txt',mode='rt',encoding='utf-8') as f: #结束使用文件后，会自动关闭文件

　　　　　　data=f.read()

　　　　　　print(data)

3.文件的打开模式

基本介绍

控制文件读写操作的模式

r（默认）

控制文件读写内容的模式（不能单独使用，必须与r,w,a连用）

详细介绍

控制文件读写操作的模式

r（默认）：只读模式，以该模式打开文件，当文件不存在时则报错，当文件存在时文件指针在文件开头

with open('a.txt',mode='rt',encoding='utf-8') as f:

　　data=f.read()

　　print(f.readable()) #True

　　print(f.writable()) #False

　　line=f.readline()

　　print(line,end='')

　　print(data,type(data))

　　for line in f:

　　　　print(line)

　　print（f.readlines()）# 逐行读入内容，保存成列表文件，每行保存成一个元素

w：只写模式，以该模式打开文件，当文件不存在时创建一个空文档，当文件存在时清空文件内容，文件指针在文件开头

　　　with open('a.txt',mode='wt,encoding='utf-8') as f:

　　　　print(f.readable()) # False

　　　　print(f.writable) # True

　　在打开了文件不关闭的情况下，连续的写入，新写的内容总是跟在老内容之后

　　f.write('abc\n')

　　lines=['aaaa\n','2222\n','3333\n']

　　for line in lines:

　　　　f.write(line) 列表的元素一个一个的写入到文件中

　　f.writelines(lines)

　　f.write('aaaa\nbbb\nccc\n')

a:只追加写模式，以该模式打开文件，当文件不存在时创建一个空文档，当文件存在时不清空文件内容，文件指针跳到文件末尾

with open('c.txt',mode='at',encoding='utf-8') as f:

　　f.write('你好\n')

　　f.write('dadad\n')

　　f.writelines([1,2,3]) # 会报错，整型不能加在str后面

控制文件读写内容的模式（不能单独使用，必须与r,w,a连用）

t（默认）：无论读写都是以字符为单位的，只能操作文本文件，必须指定encoding参数

b：无论读写都是以字符为单位的，可以操作所有文件，一定不能指定encoding参数

with open('a.txt',mode='rb') as f:

　　data=f.read()

　　print(data,type(data))# 直接输出硬盘中保存的二进制数

　　print(data.decode('utd-8'))# 把二进制按照utf-8编码表解码成unicode，打印内存中unicode直接解码成字符

with open('01.mp4',mode='rb') as f:

　　 data=f.read()

　　print(data,type(data))

with open('a.txt',mode='wb') as f: # 直接读取二进制

　　f.write('字符打哈收到空间阿斯顿'.encode('utf-8')) 把字符对应的unicode编码成utf-8二进制写入文件

　　拷贝文件小程序

　　inp_path=input('请输入要打开的文件路径：').strip()

　　inp_path1=input('请输入要写入的文件路径').strip()

　　with open(inp_path,mode='rb') as read_f\

　　　　open(inp_path,mode='wb') as write_f:

　　　　data = read_f.read()

　　　　write_f.write(data)

了解

+：不能单独使用，必须与rwa连用 r+，w+，a+

with open('a.txt','r+t',encoding='utf-8') as f:

　　print(f.readable()) 可读

　　print(f.writable()) 也可写

　　data=f.reanline() 单独读一行内容，默认从开头读

　　print(data)

　　f.write('六子') 写在文件最后

# with open('a.txt','r+t',encoding='utf-8') as f:
#     # print(f.readable())
#     # print(f.writable())
#
#     f.seek(10) 调整文件指针，单位是字节，unicode用3个字节表示一个汉字，修改第10个字节，会乱码
#     # print(f.tell())
#     f.write('你好啊')修改文件，是直接从当前指针往后修改，覆盖掉旧内容

4.文件修改的两种方式
　　1.以读的方式打开源文件
　　2.将文件内容一次性全读入内存，在内存中完成修改
　　3.以写的方式打开源文件，然后将修改的结果一次性写入源文件

总结：
优点：在文件修改过程中硬盘只存在一份数据
缺点：浪费内存

with open('a.txt',mode='rt',encoding='utf-8') as f1:
　　msg=f1.read()
　　new_msg=msg.replace('alex','SB')

with open('a.txt',mode='wt',encoding='utf-8') as f2:
　　f2.write(new_msg)

方式二
　1.以读的方式打开源文件，以写的方式打开一个临时文件
　2.读取源文件的一行内容到内存中，将修改的结果存入临时文件，循环直到全部修改完
  3.删除源文件，将临时文件重命名为源文件名
　　优点：同一时间在内存中只有文件的一行内容，更节省内存
   缺点：在文件修改过程中硬盘会存在两份数据　

with open('b.txt',mode='rt',encoding='utf-8') as read_f,\
　　open('.b.txt.swap',mode='wt',encoding='utf-8') as write_f:
　　for line in read_f:
　　　　write_f.write(line.replace('sb','alex'))
os.remove('b.txt')
os.rename('.b.txt.swap','b.txt')

python学习day9 字符编码和文件处理的更多相关文章

python 基础之字符编码和文件处理
一.字符编码 (1)计算机基础知识 (2)python 解释器执行py文件的原理 <1>python 解释器启动 <2>python解释器相当于一个文本编辑器,打开txt.py ...
Python全栈开发之路【第三篇】：Python基础之字符编码和文件操作
本节内容一.三元运算三元运算又称三目运算,是对简单的条件语句的简写,如: 简单条件语句: if 条件成立: val = 1 else: val = 2 改成三元运算: val = 1 if 条件成 ...
Python自动化开发 - 字符编码、文件和集合
本节内容字符编码文件操作集合一.字符编码 1.编码计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理.解决思路:数字与符号建立一对一映射,用不同数字表示不同符号. ASCI ...
Python入门基础--字符编码与文件处理
字符编码文本编辑器存取文件的原理 #1.打开编辑器就打开了启动了一个进程,是在内存中的,所以,用编辑器编写的内容也都是存放与内存中的,断电后数据丢失 #2.要想永久保存,需要点击保存按钮:编辑器把内 ...
python数据类型、字符编码、文件处理
介绍: 1.什么是数据? 例:x=10,10是我们要存储的数据 2.为何数据要分不同的类型? 数据是用来表示状态的,不同的状态用不同的类型的数据去表示 1.数据类型 1.数字(整形,长整形,浮点型,复 ...
Python基础之字符编码，文件操作流与函数
一.字符编码 1.字符编码的发展史阶段一:现代计算机起源于美国,最早诞生也是基于英文考虑的ASCII ASCII:一个Bytes代表一个字符(英文字符/键盘上的所有其他字符),1Bytes=8bit ...
【Python学习】字符编码
先说两个基础知识. (1)计算机内部,数据是由0,1组成的: (2)计算机最小的数据单位,就是一个二进制单位即bit,接下来就是8个二进制单位表示一个字节(Byte). 1 ASCII码 ASCII码 ...
二、python数据类型、字符编码、文件处理
一. 前言 1. 什么是数据: x = 10,10就是我们要存储的数据 2. 为何数据要分不同的类型数据是用来表示状态的, 不同的状态就应该用不同类型的数据去表示 3. 数据类型数字(整型.长整型 ...
python学习之字符编码
字符串涉及到编码:ascii gbk gb2312 unicode uft-8 对于英文字符ASCII(可以看成utf-8的子集)就可以了,中文用gbk/gb2312; unicode:世界统一(兼容 ...

随机推荐

windows下mvn verify异常
[ERROR] Failed to execute goal org.apache.maven.plugins:maven-jarsigner-plugin:1.4:sign (sign) on pr ...
mysql 替代Oracle instr
在迁移项目时遇到的,原项目的数据库使用的Oracle,现在要迁移到MySQL中,而项目中用到了Oracle的instr函数,而MySQL只能查找子串是否在父串中,没法按照出现的次数进行查找. 先来介绍 ...
代码：jquery小效果—— 吸顶
吸顶: 可以防止滚屏过程中,代码被多次调用 <script src="http://cdn.bootcss.com/jquery/1.11.1/jquery.min.js"& ...
tomcat jvm 内存调优适用于 JDK 6 & 7
参考:https://blog.csdn.net/m0_37327416/article/details/76185051 1.jvm内存管理机制: 1)堆(Heap)和非堆(Non-heap)内存 ...
Node 在 Centos7 系统下的安装
1,下载二进制包 https://nodejs.org/zh-cn/download/ 根据自己的需求选择对应的版本,不推荐使用源码包,容易出现错误 2,上传到 linux 服务器 3, 解 ...
<记录> PHP Redis操作类
namespace common\controller; class Redis { public $redisObj = null; //redis实例化时静态变量 static protected ...
xlwt模块
python使用xlwt模块操作Excel 该模块安装很简单 $ pip install xlwt 语法 import xlwt # 创建一个workbook 设置编码 workbook = xlwt ...
classloader trace
类加载机制: 程序启动时,根据入口函数调用相关功能,功能在不同类中即在不同的class文件中,jvm根据类加载机制来动态加载class文件到内存中,只有被加载后才能被调用,否则引发异常 1.装载:查找 ...
C#利用CDO.Message发送邮件
如何引用CDO.Message? cod.message的引用位置: C:\Windows\System32\cdosys.dll CDO.Message objMail = new CDO.Mess ...
Unable to connect to zookeeper server within timeout: 5000
错误严重: StandardWrapper.Throwable org.springframework.beans.factory.BeanCreationException: Error crea ...

python学习day9 字符编码和文件处理

python学习day9 字符编码和文件处理的更多相关文章

随机推荐

热门专题