python之路day06--python2/3小区别,小数据池的概念,编码的进阶str转为bytes类型,编码和解码
python2
#print() print'abc'
#range() xrange()生成器
#raw_input() python3
# print('abc')
# range()
# input()
= 赋值
== 比较值是否相等
is 比较的是内存地址是否一致,返回True or False
id(内容) 返回内容
li1 =[1,2,3]
li2 =li1 #赋值
print(li1 is li2) #True
print(id(li1),id(li2))#48358464 48358464
小数据池
小数据池,也称为小整数缓存机制,或者称为驻留机制等等,博主认为,只要你在网上查到的这些名字其实说的都是一个意思,叫什么因人而异。
那么到底什么是小数据池?他有什么作用呢?
大前提:小数据池也是只针对 int(float),str,bool。
小数据池是针对不同代码块之间的缓存机制!!!
按数据类型划分
数字,字符串 ————> 小数据池的概念,在一定的范围内,共用一个内存地址,节省内存空间
数字的范围 -5-256
字符串:1/不能含有特殊字符
2/str*20 还是同一个地址,str*21 后都是两个地址
i1 =2
i2 =2
print(id(i1),id(i2)) #1779386016 1779386016 i1 =300
i2 =300
print(id(i1),id(i2)) #58219664 58219664 i1 =300
i2 =i1 #赋值运算地址是一样的
print(id(i1),id(i2)) # 51010704 51010704
剩下的list,dict,tuple,set 都不是一个地址,没有小数据池的概念
编码的进阶 str--bytes 类型
ascii A:00000010 8位 用一个字节来表示一个字母,字符 unicode A:00000010 00000001 00000010 00000010 32位 4个字节
中:00000010 00000001 00000010 00000010 32位 4个字节
utf-8 : A:00000010 8位 一个字节
中:00000010 00000001 00000010 24位 3个字节 gbk: A: 00000110 8位一个字节
中:00000010 00000110 16位2个字节 1/各个编码之间的二进制,是不能互相识别的,会产生乱码
2/文件的存储,传输,不能是unicode(只能是utff-8,gbk,ascii等)。因为unicode用4个字节表示一个字符,占用空间太大,传输慢。
py3:
文本 str在内存中是用unicdoe编码的。 bytes类型:也是一种数据类型,是一种特殊的。是以(utff-8,gbk,ascii等编码的)
str与bytes 方法都差不多,只是内存中编码不同。 对于英文:
str: 表现形式 s ='alex'
编码方式: 010101010 用的是unicode编码 bytes:表现形式:s = b'alex'
编码形式:010101010 用的是utff-8,gbk,ascii等编码的
ps: s ='alex'
s1 = b'alex'
print(type(s),type(s1)) #<class 'str'> <class 'bytes'>
对于中文:
str: 表现形式 s ='中国'
编码方式: 010101010 用的是unicode编码 bytes:表现形式:s = b'x\e91\e91\e01\e21\e31\e32' 中文显示不出来,所以不用bytes,用str
编码方式:010101010 用的是utff-8,gbk,ascii等编码的
ps: s ='中国'
s1 = '中国' #python3中bytes类型中文表示不出来。
print(type(s),type(s1)) #<class 'str'> <class 'bytes'>
encode编码,如何将str-->bytes类型,方便传输存储
s1 = 'alex'
s11 = s1.encode('utf-8') #可以设置编码方式
print(s11,type(s11)) #b'alex' <class 'bytes'> s2 = '中国'
s22 = s2.encode('utf-8')
print(s22,type(s22)) #b'\xe4\xb8\xad\xe5\x9b\xbd' <class 'bytes'>
字符转编码操作
unicode相当于一个中介,utf-8要转为GBK,要先decode('utf-8')解码成unicode(--告诉unicode你是什么编码--),后在encode('gbk')编码为GBK。
encode编码、decode解码

#str --->byte encode 编码
# s = '二哥'
# b = s.encode('utf-8')
# print(b)
# #byte --->str decode 解码
# s1 = b.decode('utf-8')
# print(s1)
# s = 'abf'
# b = s.encode('utf-8')
# print(b)
# #byte --->str decode 解码
# s1 = b.decode('gbk')
# print(s1)
python之路day06--python2/3小区别,小数据池的概念,编码的进阶str转为bytes类型,编码和解码的更多相关文章
- Python 3中的str和bytes类型
Python3 中的str和bytes类型 Python3最重要的新特性之一是:对字符串和二进制数据流做了明确的区分.文本总是Unicode,由str类型表示,二进制数据则由bytes类型表示.Pyt ...
- id,is的用法,小数据池的概念及编码知识进阶
一:id 查询内存地址 name = 'alex' print(id(name)) li = [1,2,3] print(id(li)) 二:is 判断的是内存地址 name1 = 'alex@' ...
- Python之路Day06
小数据池 == 判断两个值是否相等 is -- 是,判断两边的内存地址是否相同 a=10 b=10 print(a is b) id() -- 查看内存地址 代码块 一个py文件,一个函数,一个模块, ...
- Python str 与 bytes 类型(Python2/3 对 str 的处理)
本文均在 Python 3 下测试通过,python 2.x 会略有不同. 1. str/bytes >> s = '123' >> type(s) str >> ...
- Python2和3版本对str和bytes类型的处理
python2中字符串分为2种类型: 字节类型:str,字节类型,通过decode()转化为unicode类型 unicode类型:unicode ,通过encode转化为str字节类型 字节类型 和 ...
- 初学python之路-day06
每天一篇总结,今天学习了大概有深浅拷贝,元组类型,字典类型与集合类型.第一次感觉有点难度,需要花费多点时间来掌握. 深浅拷贝,分为值拷贝.浅拷贝.深拷贝. ls = [1, 'abc', [10]] ...
- Python之路第十一天,高级(3)-线程池
线程池 简单的线程池的实现: import queue import threading import time class ThreadPool(object): def __init__(self ...
- Python str 与 bytes 类型 之间的转换
bytes:字节数组,通常用它可以描述 “一个字符串”,只不过该字符串是 “bytes类型”,所以容易与str类型混淆,他们二者之间的转换: https://blog.csdn.net/lanchu ...
- python的小数据池和深浅拷贝
小数据池 一种数据缓存机制,也称驻留机制 在同一代码块,相同的值不会开辟新的内存 特殊字符除外 小数据池只针对:在控制台时! 数字 :-5到256间的整数会被缓存 布尔值:都会缓存8 字符串 小于等于 ...
随机推荐
- eclipse如何修改android工程的包名?
在我们android项目开发到一定的程度时由于需要,我们必须修改一下工程的包名,以便更好的发布我们的项目.但是在这个过程中有时候修改好了之后会出现一些错误.下面由小编一步步教你如何更改包名,和解决出现 ...
- 一幅图,看懂中国CMMI
以下数据由Fancier凡奉信息根据历年CMMI Institute公布的CMMI评估结果的汇总整理.数据跨度2008-2017年,包含对中国CMMI与全球CMMI的不同等级.版本的统计.
- shell判断USB接口是否有设备插入
#/bin/sh usb_num=$(cat /proc/scsi/scsi | grep "Vendor" | wc -l)if [ $usb_num = 2 ];then ...
- ASP.NET Zero--解决方案结构(层)
解决方案结构(层) 创建和下载项目后,您将具有如下所示的解决方案结构: 解决方案有8个项目: Core项目包含域层类(如 实体 和 域服务). Application项目包含应用程序逻辑(如应用程序服 ...
- 我现在有个表,里面有100个不同的单词,每个单词对应有大概20个词组,我想通过sql,每个单词随机获取对应的3个词组,请问怎么写可以实现?
闲来无事刷技术论坛,看到一个这样的问题: 我现在有个表,里面有100个不同的单词,每个单词对应有大概20个词组,我想通过sql,每个单词随机获取对应的3个词组,请问怎么写可以实现? 感觉题材很新颖,角 ...
- C#与SQL Server数据库连接
using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.T ...
- c/c++ socket API 调用后的错误判断 perror errno
socket API 调用后的错误判断 perror errno 调用完socket API后,需要判断调用是否成功与失败.如果失败,会自动设置errno(是个整数), 并且用perror可以打印出具 ...
- Cs231n课堂内容记录-Lecture 8 深度学习框架
Lecture 8 Deep Learning Software 课堂笔记参见:https://blog.csdn.net/u012554092/article/details/78159316 今 ...
- const int *p;int *const p;区别及用法
在单片机程序设计中,我们经常会用到const这个关键字,在有些单片机的编译器中可能会是code(比如51系列单片机),但我们在学习C语言的时候,首先还是先学到的const.我们知道,const关键字的 ...
- 超哥笔记 -- 用户管理、权限设置、进程管理、中文配置、计划任务和yum源配置(5)
一 网卡配置 ifconfig 查询.设置网卡和ip等参数 ifup,ifdown 脚本命令,更简单的方式启动关闭网络 ip 符合指令,直接修改上述功能 网络配置文件: /etc/sysconf ...
