python2和python3的编码encode解码decode函数
python比较坑的一个点;意义完全变了的两个函数
首先 常用的编码方式有3种,utf-8: 常用的传输和存储格式,Unicode的一种简化
Unicode:包括了所有可能字符的国际统一编码
GBK:中文的一种编码标准,包括中文和英文
在python2中 解码函数decode是 其他编码(utf-8或GBK或其他)——>Unicode编码 用法:u=str.decode('utf-8') 括号里是原编码格式
encode是 Unicode编码——>其他编码(utf-8或GBK或其他) 用法:g=u.encode('gbk') u是Unicode编码格式,括号里是目标编码格式
在python3中:python3中不用再考虑Unicode也不用考虑字符串的原编码类型, 文件读入str后都是Unicode编码,文件处理后, 想写到文件用什么编码方式,在函数中用变量定义就好。
字符串有两种数据类型,一种是字符串str,另一种是字节数据bytes
编码函数还是encode,但意义完全不同了,编码函数是 字符串str——>目标编码格式的字节类型bytes
s = "中文"
t=s.encode(encoding='utf-8')
p=s.encode(encoding='gbk')
print(t)
print(p)
输出:
b'\xe4\xb8\xad\xe6\x96\x87'
b'\xd6\xd0\xce\xc4'
解码函数还是decode,但意义完全不同了,解码函数是 字节类型bytes——>字节编码类型的字符串str
s = "中文" p=s.encode(encoding='gbk') sp=p.decode(encoding='gbk') print(p) print(sp)
b'\xd6\xd0\xce\xc4'
中文
这里要注意以什么格式编码就要以什么格式解码,要不然会报错
s = "中文" p=s.encode(encoding='gbk') sp=p.decode(encoding='utf-8') print(p) print(sp)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd6 in position 0: invalid continuation byte
举个大栗子
s = "中文" g=s.encode(encoding='gbk') #从utf-8转成gbk字节码
gg=g.decode(encoding='gbk') #从gbk字节码转成gbk字符串
u=gg.encode(encoding='utf-8')#从gbk转成utf-8
uu=u.decode(encoding='utf-8')
k=uu.encode(encoding='gbk') #从utf-8转成gbk
kk=k.decode(encoding='gbk')
print(g)
print(gg)
print(u)
print(uu)
print(k)
print(kk)
输出:
b'\xd6\xd0\xce\xc4'
中文
b'\xe4\xb8\xad\xe6\x96\x87'
中文
b'\xd6\xd0\xce\xc4'
中文
注意:在python3中,str全部都是Unicode编码,所以看str变量的编码没有什么意义,而如果encode了,自然要encode里的变量参数来按编码类型编码
python2和python3的编码encode解码decode函数的更多相关文章
- day008 字符编码之 字符编码 、Python2和Python3字符编码的区别
计算机基础(掌握) 启动应用程序的流程 双击qq 操作系统接受指令然后把该操作转化为0和1发送给CPU CPU接受指令然后把指令发送给内存 内存接受指令把指令发送给硬盘获取数据 qq在内存中运行 文本 ...
- python3中编码与解码的问题
python3中编码与解码的问题 ASCII .Unicode.UTF-8 ASCII 我们知道,在计算机内部,所有的信息最终都表示为一个二进制的字符串.每一个二进制位(bit)有0和1两种状态,因此 ...
- 字符编码 + python2和python3的编码区别(day08整理)
目录 昨日回顾 二十三.元组内置方法 二十四.散列表 二十五.字典内置方法 二十六.集合内置方法 二十七.深浅拷贝 拷贝 浅拷贝 深拷贝 今日内容 二十八.字符编码 1.文本编辑器存储信息的过程 2. ...
- 关于base64编码Encode和Decode编码的几种方式
关于base64编码Encode和Decode编码的几种方式 Base64是一种能将任意Binary资料用64种字元组合成字串的方法,而这个Binary资料和字串资料彼此之间是可以互相转换的,十分方便 ...
- python encode和decode函数说明【转载】
python encode和decode函数说明 字符串编码常用类型:utf-8,gb2312,cp936,gbk等. python中,我们使用decode()和encode()来进行解码和编码 在p ...
- Python2 与 Python3 的编码对比
在 Python 中,不论是 Python2 还是 Python3 中,总体上说,字符都只有两大类: 通用的 Unicode 字符: (unicode 被编码后的)某种编码类型的字符,比如 UTF-8 ...
- 最简单的服务器和客户机(python3的编码与解码问题)
在学习python的过程中,我越来越感觉到python2和python3之间有很多不同点,最近发现的一点就是编码问题. 在代码清单14-1和14-2中,因为作者是用python2来写得,然后我是用py ...
- 关于Python字符编码encode和decode
(注:本文部分内容摘自互联网,由于作者水平有限,不足之处,还望留言指正.) 记得几天前,部门的一个小姑娘问我,怎么她Python打印出来的中文信息都乱码了?我走过去,略思一二,瞬间给她搞定,其实这是字 ...
- Python2与Python3字符编码的区别
目录 字符编码应用之Python(掌握) 执行Python程序的三个阶段 Python2与Python3字符串类型的区别(了解) Python2 str类型 Unicode类型 Python3 字符编 ...
随机推荐
- [CF846A]Curriculum Vitae题解
枚举一个点,假设它一定符合条件,据此珂以\(O(n)\)算出要删去几个点 于是就\(O(n^2)\)解决了,貌似加一个前缀和可以在\(O(n)\)的时间复杂度内解决本问题,但对于这个数据范围来说\(O ...
- [CF1182F]Maximum Sine
题意:\(f(x) = \text{abs}(\text{sin}(\frac{p}{q} \pi x))\),给定\(a,b,p,q\),求\(x\in[a,b]\)最大的\(f(x)\). 题解: ...
- js中元素更新value页面体现不出来的原因
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
- php函数名前添加& 函数的引用返回
function &test(){ static $b=0; $b= $b+1; return $b; } $a= test(); echo $a,"\n"; $a = 3 ...
- 使dialog可拖拽指令
在项目开发过程中,需要支持dialog弹窗可拖拽,则需要对dialog添加指令.具体操作说明如下: (1)在用于存放指令的文件夹内,新建拖拽指令文件夹,例如命名为:el-dragDialog,如下所示 ...
- 前端工具-ES6相关工具
处理 ES6 语法 使用 Babel Babel 是一个用于将 ECMAScript 2015+ 代码转换为新旧浏览器或其他环境支持的 JavaScript 向下兼容版本代码的工具链. Babel 主 ...
- day32—CSS多列布局学习
转行学开发,代码100天——2018-04-17 关于多列布局,前期已经梳理过,今天的培训课程学习中再次提及,趁此也做个总结和检验. 多列布局的介绍参考: day08—css布局解决方案之多列布局 ...
- ajax基础--基本概念
1.Ajax的全称: Asynchronous Javascript And XML,就是使用is代码获取服务器数据 局部异步刷新 IP地址:用来标识查找某一台计算机 域名:ip地址太难记了,使用域名 ...
- Vue2.0响应式原理以及重写数组方法
// 重写数组方法 let oldArrayPrototype = Array.prototype; let proto = Object.create(oldArrayPrototype); ['p ...
- 远程连接SuSE系统的配置方法
今天,在VMware上搭建了SuSE Linux系统,使用xshell远程进行连接,一直连接不上,后来百度了一下,连接成功,这里总结一下配置的办法: (1):关闭防火墙 (2):配置sshd( Pas ...