各种编码在内存中所占的大小:

ascii:    英文:8bit (1B)

uft-:    英文:8bit (1B)

          中文:24bit (3B)

GBK:      英文:8bit (1B)

          中文:16bit (2B)

unicode:  英文:32bit (4B)

          中文:32bit (4B)

python3代码执行过程:

解释器找到代码文件(文件以utf8/GBK..存储)，
把代码字符串按文件头定义的编码进行解码到内存，转成unicode
所有的变量字符都会以unicode编码声明(str的编码方式就是unicode)

unicode只在内存中进行显示, 传输和存储需要用到utf8/GBK.., 所以必须转成utf8/GBK..

str和bytes的区别就是编码方式的不同:

 str(unicode编码)      ==>     bytes(utf8/GBK..)       ==>         存储, 传输

 bytes = str.encode('utf-8')     # 编码

 str = bytes.decode('utf-8')     # 解码

python3中str和bytes表现和编码:

 英文:

     str:    表现方式==>'a'

             编码方式==>0101      unicode

     bytes:  表现方式==>b'a'

             编码方式==>0101      utf8/GBK..

 中文:

     str:    表现方式==>'中'

             编码方式==>0101      unicode

     bytes:  表现方式==>b'x\e9'

             编码方式==>0101      utf8/GBK..

在python2中:

u'xxx'为unicode对象, 就是python3中的str
bytes和str是同一个类型

 s = 'a'

 print (s, type(s))              # 'a', <type 'str'>

 s = u'中文'

 print(s, type(s))               # u'\u4e2d\u6587', <type 'unicode'>

 # 编码变成utf-8, 一个中文三个字节

 s1 = s.encode('utf-8')

 print(s1, type(s1))             # '\xe4\xb8\xad\xe6\x96\x87', <type 'str'>

 # bytes和str是同一个类型

 s1 = 'a'

 s2 = bytes('a')

 print(s1 is s2)                 # True

python中编码问题的更多相关文章

bytes类型和python中编码的转换方法
一.bytes类型 bytes类型是指一堆字节的集合,在python中以b开头的字符串都是bytes类型.例如: >>> a = "中国" >>> ...
Python中编码的详细讲解
看这篇文章前,你应该已经知道了为什么有编码,以及编码的种类情况 ASCII 占1个字节,只支持英文 GB2312 占2个字节,支持6700+汉字 GBK GB2312的升级版,支持21000+汉字 S ...
Python中编码和字符串
编码和字符串编码在学习回顾中总结一下ASCII编码.Unicode编码和utf-8编码. 计算机中只能处理数字,我们若要处理文本的话就要将文件转换为数字.所以,这就涉及该怎样转换的问题,也就是编码 ...
理解Python中编码的应用
完全理解字符编码与 Python 的渊源前,我们有必要把一些基础概念弄清楚,虽然有些概念我们每天都在接触甚至在使用它,但并不一定真正理解它.比如:字节.字符.字符集.字符码.字符编码. 字节字节( ...
Python中编码问题：u'\xe6\x97\xa0\xe5\x90\x8d' 类型的转为utf-8的解决办法
相信小伙伴们遇到过类似这样的问题,python2中各种头疼的转码,类似u'\xe6\x97\xa0\xe5\x90\x8d' 的编码,直接s.decode()是无法解决编码问题.尝试了无数办法,都无法 ...
Python中编码问题：u'\xe6\x97\xa0\xe5\x90\x8d' 类型和 ‘\u559c\u6b22\u4e00\u4e2a\u4eba ’ 转为utf-8的解决办法
相信小伙伴们遇到过类似这样的问题,python2中各种头疼的转码,类似u'\xe6\x97\xa0\xe5\x90\x8d' 的编码,直接s.decode()是无法解决编码问题.尝试了无数办法,都无法 ...
Python中编码问题？
一.键盘输入 raw_input('请输入:'.decode('utf-8').encode('gbk'))raw_input(unicode('请输入:','utf-8').encode('gbk' ...
python中编码判断
https://www.cnblogs.com/lc-D-a/p/6074878.html python3 用isinstance()检查unicode编码报错
Python中编码encode()与解码decode()
1 print('这是编码'.encode('utf-8')) # 结果 b'\xe8\xbf\x99\xe6\x98\xaf\xe7\xbc\x96\xe7\xa0\x81' 2 print('这是 ...

随机推荐

Mosaic 前端微服务框架
Mosaic 是一系列的服务.库,集成在一起,定义了组件如何彼此交互,可以用来支持大规模的web 站点开发一张架构图说明尽管上图中的一些组件已经迭代演化了(skipper 的route 配置,上 ...
python 调试之assert and logging
断言 assert assert后面跟的表达式应该是True,否则,根据程序运行的逻辑,后面的代码肯定会出错. 如果断言失败,会抛出AssertionError def foo(s): n = int ...
ThreadLocal使用注意
ThreadLocal<T>的出现是一种空间换时间的思想的运用,是为了多线程环境下单线程内变量共享的问题.它的原理就是每个线程通过ThreadLocal.ThreadLocalMap,保存 ...
kafka 知识点
Replica如何分布为了尽量做好负载均衡和容错能力,需要将同一个Partition的Replica尽量分散到不同的机器.如果所有的Replica都在同一个Broker上,那一旦该Broker宕机, ...
spring cloud 各子项目作用
spring cloud 各子项目作用: table th:first-of-type { width: 80px; } table th:nth-of-type(2) { width: 150px; ...
TypeScript 之模块
https://m.runoob.com/manual/gitbook/TypeScript/_book/doc/handbook/Modules.html 外部模块简写外部模块简写:declare ...
Linux vi文本编辑器
vi文本编辑器 1.最基本用法 vi somefile.4 1/ 首先会进入“一般模式”,此模式只接受各种命令快捷键,不能编辑文件内容 2/ 按i键,就会从一般模式进入编辑模式,此模式下,敲入的都是 ...
一次修改mysql字段类型引发的技术探究
说来,mysql数据库是我们项目中用的比较多的库,ORM工具喜欢采用细粒度的MyBatis.这里面就这么引出了两者之间的故事! 首先,说改字段吧,将一个表中的varchar字段改为enum字段.如下: ...
使用Vivado的block design
使用Vivado的block design (1)调用ZYNQ7 Processing System (2)配置ZYNQ7系统 (3)外设端口配置根据开发板原理图MIO48和MIO49配置成了串口通 ...
Django中的URL映射
1.为什么回去urls.py文件中寻找映射呢? 因为在settings.py中配置了ROOT_URLCONF为urls.py: ROOT_URLCONF = 'first_project.urls' ...

python中编码问题

各种编码在内存中所占的大小:

python3代码执行过程:

unicode只在内存中进行显示, 传输和存储需要用到utf8/GBK.., 所以必须转成utf8/GBK..

python3中str和bytes表现和编码:

在python2中:

python中编码问题的更多相关文章

随机推荐

热门专题