1.字符编码

x='上'

#unicode的二进制---------》编码--------》gbk格式的二进制

res=x.encode('gbk') #bytes 字节类型

print(res,type(res))

m=res.decode('gbk')

print(m)  #把gbk解码成unicode,python打印自动转换成字符

2.文件处理

  1.什么是文件

  文件是操作系统为应用程序或者用户提供一种操作硬盘的虚拟单位

  强调:

    文件是操作系统提供的虚拟单位

    应用程序或者用户对文件的读写操作其实都是向操作系统发送指令

  2.为何要用文件

    文件对应的硬盘空间,如果需要考虑永久保存数据那必须使用文件

  3.如何用文件

   路径问题

    绝对路径 优点:无论从哪里运行,都能找到文件

        缺点:比较冗长

    win: c:\a\b\c\d.txt

    linux: /a/b/c/d.txt

    相对路径:相当于当前执行文件所在文件夹 优点:比较简洁

                       缺点:必须在执行文件夹中才能找到文件

    a/b/c/d.txt

    (1)打开文件

    f=open(r'D:\abc\d\e.txt',mode='rt',encoding='utf-8') 以utf-8字符编码表解码保存在硬盘中的文件打开到内存中。python应用程序会申请内存空间,存放f,另外会向操作系统发出申请,将文件读取进内存,f返回一个文件句柄

    print(f)

    (2)读/写文件

      data=f.read() # 一次性把文件全部读出

      print (data)

    (3)关闭文件

    f.close() # 向操作系统发送指令,让操作系统关闭打开的文件,回收操作系统资源

    print(f)

    f.read

    上下文管理

    with open('a.txt',mode='rt',encoding='utf-8') as f: #结束使用文件后,会自动关闭文件

      data=f.read()

      print(data)

3.文件的打开模式

基本介绍

控制文件读写操作的模式

r(默认)

w

a

控制文件读写内容的模式(不能单独使用,必须与r,w,a连用)

t

b

详细介绍

控制文件读写操作的模式

r(默认):只读模式,以该模式打开文件,当文件不存在时则报错,当文件存在时文件指针在文件开头

with open('a.txt',mode='rt',encoding='utf-8') as f:

  data=f.read()

  print(f.readable()) #True

  print(f.writable()) #False

  line=f.readline()

  print(line,end='')

  print(data,type(data))

  for line in f:

    print(line)

  print(f.readlines())# 逐行读入内容,保存成列表文件,每行保存成一个元素

w:只写模式,以该模式打开文件,当文件不存在时创建一个空文档,当文件存在时清空文件内容,文件指针在文件开头

   with open('a.txt',mode='wt,encoding='utf-8') as f:

    print(f.readable()) # False

    print(f.writable)  # True

  在打开了文件不关闭的情况下,连续的写入,新写的内容总是跟在老内容之后

  f.write('abc\n')

  lines=['aaaa\n','2222\n','3333\n']

  for line in lines:

    f.write(line) 列表的元素一个一个的写入到文件中

  f.writelines(lines)

  f.write('aaaa\nbbb\nccc\n')

a:只追加写模式,以该模式打开文件,当文件不存在时创建一个空文档,当文件存在时不清空文件内容,文件指针跳到文件末尾

with open('c.txt',mode='at',encoding='utf-8') as f:

  f.write('你好\n')

  f.write('dadad\n')

  f.writelines([1,2,3]) # 会报错,整型不能加在str后面

控制文件读写内容的模式(不能单独使用,必须与r,w,a连用)

t(默认):无论读写都是以字符为单位的,只能操作文本文件,必须指定encoding参数

b:无论读写都是以字符为单位的,可以操作所有文件,一定不能指定encoding参数

with open('a.txt',mode='rb') as f:

  data=f.read()

  print(data,type(data))# 直接输出硬盘中保存的二进制数

  print(data.decode('utd-8'))# 把二进制按照utf-8编码表解码成unicode,打印内存中unicode直接解码成字符

with open('01.mp4',mode='rb') as f:

   data=f.read()

  print(data,type(data))

with open('a.txt',mode='wb') as f: # 直接读取二进制

  f.write('字符打哈收到空间阿斯顿'.encode('utf-8')) 把字符对应的unicode编码成utf-8二进制写入文件

  拷贝文件小程序

  inp_path=input('请输入要打开的文件路径:').strip()

  inp_path1=input('请输入要写入的文件路径').strip()

  with open(inp_path,mode='rb') as read_f\

    open(inp_path,mode='wb') as write_f:

    data = read_f.read()

    write_f.write(data)

了解

+:不能单独使用,必须与rwa连用 r+,w+,a+

with open('a.txt','r+t',encoding='utf-8') as f:

  print(f.readable())  可读

  print(f.writable())  也可写

  data=f.reanline()  单独读一行内容,默认从开头读

  print(data)

  f.write('六子') 写在文件最后

# with open('a.txt','r+t',encoding='utf-8') as f:
# # print(f.readable())
# # print(f.writable())
#
# f.seek(10) 调整文件指针,单位是字节,unicode用3个字节表示一个汉字,修改第10个字节,会乱码
# # print(f.tell())
# f.write('你好啊')修改文件,是直接从当前指针往后修改,覆盖掉旧内容 4.文件修改的两种方式
  1.以读的方式打开源文件
  2.将文件内容一次性全读入内存,在内存中完成修改
  3.以写的方式打开源文件,然后将修改的结果一次性写入源文件 总结:
优点:在文件修改过程中硬盘只存在一份数据
缺点:浪费内存 with open('a.txt',mode='rt',encoding='utf-8') as f1:
  msg=f1.read()
  new_msg=msg.replace('alex','SB') with open('a.txt',mode='wt',encoding='utf-8') as f2:
  f2.write(new_msg) 方式二
 1.以读的方式打开源文件,以写的方式打开一个临时文件
 2.读取源文件的一行内容到内存中,将修改的结果存入临时文件,循环直到全部修改完
3.删除源文件,将临时文件重命名为源文件名
  优点:同一时间在内存中只有文件的一行内容,更节省内存
缺点:在文件修改过程中硬盘会存在两份数据  with open('b.txt',mode='rt',encoding='utf-8') as read_f,\
  open('.b.txt.swap',mode='wt',encoding='utf-8') as write_f:
  for line in read_f:
    write_f.write(line.replace('sb','alex'))
os.remove('b.txt')
os.rename('.b.txt.swap','b.txt')

python学习day9 字符编码和文件处理的更多相关文章

  1. python 基础之字符编码和文件处理

    一.字符编码 (1)计算机基础知识 (2)python 解释器执行py文件的原理 <1>python 解释器启动 <2>python解释器相当于一个文本编辑器,打开txt.py ...

  2. Python全栈开发之路 【第三篇】:Python基础之字符编码和文件操作

    本节内容 一.三元运算 三元运算又称三目运算,是对简单的条件语句的简写,如: 简单条件语句: if 条件成立: val = 1 else: val = 2 改成三元运算: val = 1 if 条件成 ...

  3. Python自动化开发 - 字符编码、文件和集合

    本节内容 字符编码 文件操作 集合 一.字符编码 1.编码 计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理.解决思路:数字与符号建立一对一映射,用不同数字表示不同符号. ASCI ...

  4. Python入门基础--字符编码与文件处理

    字符编码 文本编辑器存取文件的原理 #1.打开编辑器就打开了启动了一个进程,是在内存中的,所以,用编辑器编写的内容也都是存放与内存中的,断电后数据丢失 #2.要想永久保存,需要点击保存按钮:编辑器把内 ...

  5. python数据类型、字符编码、文件处理

    介绍: 1.什么是数据? 例:x=10,10是我们要存储的数据 2.为何数据要分不同的类型? 数据是用来表示状态的,不同的状态用不同的类型的数据去表示 1.数据类型 1.数字(整形,长整形,浮点型,复 ...

  6. Python基础之字符编码,文件操作流与函数

    一.字符编码 1.字符编码的发展史 阶段一:现代计算机起源于美国,最早诞生也是基于英文考虑的ASCII ASCII:一个Bytes代表一个字符(英文字符/键盘上的所有其他字符),1Bytes=8bit ...

  7. 【Python学习】字符编码

    先说两个基础知识. (1)计算机内部,数据是由0,1组成的: (2)计算机最小的数据单位,就是一个二进制单位即bit,接下来就是8个二进制单位表示一个字节(Byte). 1 ASCII码 ASCII码 ...

  8. 二、python数据类型、字符编码、文件处理

    一. 前言 1. 什么是数据: x = 10,10就是我们要存储的数据 2. 为何数据要分不同的类型 数据是用来表示状态的, 不同的状态就应该用不同类型的数据去表示 3. 数据类型 数字(整型.长整型 ...

  9. python学习之字符编码

    字符串涉及到编码:ascii gbk gb2312 unicode uft-8 对于英文字符ASCII(可以看成utf-8的子集)就可以了,中文用gbk/gb2312; unicode:世界统一(兼容 ...

随机推荐

  1. exe加载DLL的时候会有一系列的搜索路径

    假如安全DLL搜索模式启用,搜索顺序如下: 1. 应用程序所在的路径 2. Windows SYSTEM目录.通过调用GetSystemDirectory函数可以获取这个目录的路径. 3. 16位系统 ...

  2. xsync

    shell  小工具,用于集群搭建: xsync脚本基于rsync工具,rsync 远程同步工具,主要用于备份和镜像.具有速度快.避免复制相同内容和支持符号链接的优点,它只是拷贝文件不同的部分,因而减 ...

  3. MySQL 中 mysqld_safe 与 mysqld 区别,以及 mysqld_safe 的使用介绍

    [mysqld_safe 与 mysqld 区别] 直接运行mysqld程序来启动MySQL服务的方法很少见 mysqld_safe脚本会在启动MySQL服务器后继续监控其运行情况,并在其死机时重新启 ...

  4. C# 中的 ConfigurationManager类引用方法

    c#添加了Configuration;后,竟然找不到 ConfigurationManager 这个类,后来才发现:虽然引用了using System.Configuration;这个包,但是还是不行 ...

  5. redis内部数据结构和外部数据结构揭秘

    Redis有哪些数据结构? 字符串String.字典Hash.列表List.集合Set.有序集合SortedSet. 很多人面试时都遇到过这种场景吧? 其实除了上面的几种常见数据结构,还需要加上数据结 ...

  6. WMI Provider Host

    WMI 即 Windows Management Instrumentation(Windows 管理规范)的简写,是 Windows 操作系统的一项内置功能,它为软件和管理脚本提供了一种标准化方法, ...

  7. WPF 自定义鼠标光标

    在程序中使用自定义鼠标光标的三种方式: RadioButton senderButton = sender as RadioButton; 方式一:                       str ...

  8. Mongo 应用查询

    官网操作手册,基本就够用 https://docs.mongodb.com/manual/ 下面是个分组查询的例子,项目中用到然后查了个例子,自己理解了下,觉得很好很强大. https://blog. ...

  9. 切换用户身份su与sudo

    普通用户切换到root用户的方式有:su和sudo. 1,su - (su为switch user,即切换用户的简写) 格式:su -l USERNAME(-l为login,即登陆的简写) -l可以将 ...

  10. How to Pronounce the Letters NG – No Hard G

    How to Pronounce the Letters NG – No Hard G Share Tweet Share Most of the time when you see the lett ...