python垃圾回收机制:

python中的垃圾回收机制是以引用计数为主,分代收集为辅,引用计数的缺陷是循环引用的问题,一个对象的引用数为0 ,那么这个对象就会被python虚拟机回收内存

字符编码

字符编码的介绍

计算机存放的都是二级制数字,我们输入一个字符,计算机是不认识的,那么就需要一个编码表,吧我们写入的字符转换为二级制数,然后将输入字符对应的二进制数写入内存,再由内存写入硬盘

在这之间只有一种编码表

ASCII:只能表示英文字符,用1Bytes对应一个英文字符

内存:ASCII

硬盘:ASCII

GBK:可以表示中文字符和英文字符,用1Bytes表示一个英文字符,用2Bytes表示一个中文字符

内存:GBK
硬盘:GBK

Shift-JIS:
内存:Shift-JIS
硬盘:Shift-JIS

Euc-kr:
内存:Euc-kr
硬盘:Euc-kr

以上是各个国家的字符编码,但是这种字符编码只能在自己的国家使用,所以之后出现了一种统一的字符编码

unicode:可以对应万国字符,统一用2个Bytes表示一个字符

两大特点:

1:可以兼容万国字符

2 与万国字符都有一种数字与数字的对应关系

人们写入的字符先转码为unicode编码写进内存，再有硬盘里的GBK、EUC-kr或Shift-JIS编码表进行编码之后写进硬盘

如果要使用，就将字符经过解码，转变为unicode编码，写进内存后再通过unicode编码表一一对应。

GBK数字-----解码decode----->unicode数字

Shift-JIS数字-----解码decode----->unicode数字

GBK数字<-----编码encode-----unicode数字

UTF-8数字<-----编码encode-----unicode数字

不同的字符编码转换为英文和中文对应的字节数如下

字符编码　　　　英文　　　　中文

ASCII　　　　1Bytes　　　　无

GBK　　　　 1Bytes　　　 2Bytes

Unicode 2Bytes　　 2Bytes

　Utf-8　 1Bytes　　　3Bytes

保证不乱码的关键

当初用什么字符编码存的,取的时候就用什么编码解码

强调:此时计算机只能使用unicode与字符的对应关系

在pytohn2中

1 (执行python程序的第二个阶段)解释器在将py文件当普通的文本文件读入内存时默认使用的编码是ASCII
2 有两种字符串类型:
　　str:x="上" # 文件头指定的编码格式的二进制
　　unicode:x=u"上" # 存成unicode格式的二进制

ps:pyhon2中unicode就是python3的str类型

在python3中:

1 (执行python程序的第二个阶段)解释器在将test.py当普通的文本文件读入内存时默认使用的编码是UTF-8
2 (执行python程序的第三个阶段,开始识别语法),会字符类型的值开辟一个内存空间存入unicode格式的二进制
ps:python3中的str类型是unicode编码的二进制

3 字符串类型
　　str: x="上" 把‘上’ 存成unicode格式的二进制
　　字节串=x.encode('utf-8')

文件头:
在文件首行写上:coding:utf-8
就是在告诉python解释器,不要用其默认的编码,用文件头指定的编码

文件处理

1 什么是文件:

文件就是操作系统为用户/操作系统提供的操作硬盘的抽象单位

2 为什么要用文件

实现将内存中的数据永久保存到硬盘中

3 如何用文件

文件操作的基本步骤

f=open(r'a.txt',encoding='utf-8') #打开文件,拿到一个文件对象f,f就相当于一个遥控器,可以向操作系统发送指令

f.read() # 读写文件,向操作系统发送读写文件指令

f.close() # 关闭文件,回收操作系统的资源

强调:一定要在程序结束前关闭打开的文件

上下文管理:

with open('文件路径'，mode='打开模式'，encoding='编码表') as f: 　　

　　pass

with结束后会自动关闭文件

4 文件的打开模式

r:只读模式

w:只写模式

a:只追加模式

5 控制读写文件单位的方式(必须与r/w/a连用)

t:文本模式(默认的),一定要指定encoding参数

优点;操作系统会将硬盘中的二进制数字解码城unicode然后返回

强调::只针对文本文件才会有效

whit open('a.txt',mode='rt',encoding = 'utf-8' ) as f:

    data = f.read()

    print(data,type(data))

with open('f.png','mode=''rt,encoding = 'utf-8')as f:

    data = f.read()

二进制模式,一定不能制定encoding参数

with open('q.png','rb')as f:

    data = f.read()

    print(data,type(data))

with open('a.txt',mode = 'rb') as f:

    data = f.read()

    print(data,type(data))

    print(data.decode('utf-8'))

r: 只读模式L(默认的)

1当文件不存在是,会报错

2 当文件存在时,文件指针指向文件的开头

with open('a.txt',mode='rt',encoding='utf-8') as f:

    res1=f.read()

    print('111===>',res1)

    res2=f.read()

    print('222===>',res2)

with open('a.txt',mode='rt',encoding='utf-8') as f:

    print(f.read())

    print(f.readable())

    print(f.writable())

    print(f.readline())

    print(f.readline())

with open('a.txt',mode='rt',encoding='utf-8') as f:

    for line in f:

        print(line)

with open('a.txt',mode='rt',encoding='utf-8') as f:

    l=[]

    for line in f:

        l.append(line)

        print(l)

        print(f.readlines()

w: 只写模式

1 当文件不存在时,新建一个空文档

2 当文件存在时,清空文件内容,文件指针跑到文件的开头

with open('c.txt',mode='wt',encoding='utf-8') as f:

    print(f.readable())

    print(f.writable())

    print(f.read())

    f.write('哈哈哈\n')

    f.write('你愁啥\n')

    f.write('瞅你咋地\n')

    f.write('1111\n2222\n333\n4444\n')

    info=['egon:123\n','alex:456\n','lxx:lxx123\n']

    for line in info:

        f.write(line)

        f.writelines(info)

with open('c.txt',mode='rb') as f:

    print(f.read())

with open('c.txt',mode='wb') as f:

    f.write('哈哈哈\n'.encode('utf-8'))

    f.write('你愁啥\n'.encode('utf-8'))

    f.write('瞅你咋地\n'.encode('utf-8'))

a: 只追加写模式

1 当文件不存时,新建一个空文档，文件指针跑到文件的末尾
2 当文件存在时,文件指针跑到文件的末尾

with open('c.txt',mode='at',encoding='utf-8') as f:

    print(f.readable())

    print(f.writable())

    f.write('虎老师:123\n')

在文件打开不关闭的情况下，连续的写入，下一次写入一定是基于上一次写入指针的位置而继续的

with open('d.txt',mode='wt',encoding='utf-8') as f:

    f.write('虎老师1:123\n')

    f.write('虎老师2:123\n')

    f.write('虎老师3:123\n')

with open('d.txt',mode='wt',encoding='utf-8') as f:

    f.write('虎老师4:123\n')

with open('d.txt',mode='at',encoding='utf-8') as f:

    f.write('虎老师1:123\n')

    f.write('虎老师2:123\n')

    f.write('虎老师3:123\n')

with open('d.txt',mode='at',encoding='utf-8') as f:

    f.write('虎老师4:123\n')

06 Python字符编码与文件处理的更多相关文章

Python 字符编码及其文件操作
本章节内容导航: 1.字符编码:人识别的语言与机器机器识别的语言转化的媒介. 2.字符与字节:字符占多少个字节,字符串转化 3.文件操作:操作硬盘中的一块区域:读写操作注:浅拷贝与深拷贝用法: d ...
python字符编码与文件打开
一字符编码储备知识点: 1.计算机系统分为三层: 应用程序操作系统计算机硬件 2.运行Python程序的三个步骤 1.先启动python解释器 2.再将python文件当做普通的文本文件读入内 ...
python字符编码和文件处理
一.了解字符编码的知识储备 1.文本编辑器存取文件的原理(nodepad++,python,word) 打开编辑器就打开了启动了一个进程,是在内存中的,所以,用编辑器编写的内容也都是存放于内存中的,断 ...
python字符编码与文件操作
目录字符编码字符编码是什么字符编码的发展史字符编码实际应用编码与解码乱码问题 python解释器层面文件操作文件操作简介文件的内置方法文件的读写模式文件的操作模式作业答案第 ...
python基础（三）----字符编码以及文件处理
字符编码与文件处理一.字符编码由字符翻译成二进制数字的过程字符--------(翻译过程)------->数字这个过程实际就是一个字符如何对应一个特定数字的标准,这个标准称之 ...
python基础知识5---数据类型、字符编码、文件处理
阅读目录一引子二数字三字符串四列表五元组六字典七集合八数据类型总结九运算符十字符编码十一文件处理十二作业一引子 1 什么是数据? x=10,10 ...
Python之字符编码与文件操作
目录字符编码 Python2和Python3中字符串类型的差别文件操作文件操作的方式文件内光标的移动文件修改字符编码什么是字符编码? ''' 字符编码就是制定的一个将人类的语言的字符与二 ...
python字符编码-文件操作
字符编码字符编码历史及发展为什么有字符编码 ''' 原因:人们想要将数据存入计算机计算机的能存储的信息都是二进制的数据内存是基于电工作的,而电信号只有高低频两种,就用01来表示高低电频,所以计 ...
python文件操作：字符编码与文件处理
一.字符编码二.文件处理一.字符编码储备知识点: 1. 计算机系统分为三层: 应用程序操作系统计算机硬件 2. 运行python程序的三个步骤 1. 先启动python解释器 2. 再将py ...

随机推荐

CH1808 Milking Grid
题意 POJ2185 数据加强版描述 Every morning when they are milked, the Farmer John's cows form a rectangular gr ...
使用nomad && consul && fabio 创建简单的微服务系统
具体每个组件的功能就不详细说明了 nomad 一个调度工具,consul 一个服务发现,健康检查多数据中心支持的工具 fabio 一个基于consul的负载均衡&&动态路由工具,对于集 ...
UEditor自定义toolbar工具条
使用ueditor的同学都知道,ueditor里有很多功能,很全面,但有时候我们的编辑器不需要太多的功能,比如前台评论或者留言,就不需要这么多功能了,那我们怎么去定制自己想要的工具呢?官方给出了两个方 ...
hadoop深入研究:(十三)——序列化框架
hadoop深入研究:(十三)--序列化框架 Mapreduce之序列化框架(转自http://blog.csdn.net/lastsweetop/article/details/9376495) 框 ...
C#使用WebService
一.新建webservice 新建项目→asp.net Web服务应用程序或者在现有项目中点击右键新建web服务程序asmx 只要在webservice类里面的方法标注为[WebMethod ...
unity代码添加动画，并传参数
测试界面 button一个 sprite一个测试代码 public class BgObject : MonoBehaviour { void Start() { List<string> ...
native关键字（本地方法）、 java调用so动态链接库
Java native关键字一. 什么是Native Method 简单地讲,一个Native Method就是一个java调用非java代码的接口.一个Native Method是这样一个ja ...
MPI 派生数据类型 MPI_Type_create_struct()，MPI_Type_contiguous()，MPI_Type_vector()，MPI_Type_create_hvector()，MPI_Type_indexed()
▶ 使用 MPI 派生数据类型,减少数据在传输过程中的耗时 ● MPI_Type_create_struct() 范例代码 { ; int globalDataInt[globalSize], glo ...
Python 中 logging 日志模块在多进程环境下的使用
因为我的个人网站 restran.net 已经启用,博客园的内容已经不再更新.请访问我的个人网站获取这篇文章的最新内容,Python 中 logging 日志模块在多进程环境下的使用使用 Pytho ...
图片拼接SIFT
图片拼接 SIFT: 特征点处理:位置插值,去除低对比度点,去除边缘点方向估计描述子提取下面的程序中使用: 第一步: 使用SIFT生成器提取描述子和特征第二步: 使用KNN检测来自A,B图的S ...

06 Python字符编码与文件处理