一、is 和 == 介绍

1. is  比较的是两个对象的内存地址是否相同,它们是不是同一个对象。

2. ==  比较的是两个对象的内容是否相同。

在使用is前,先介绍Python的一个内置函数id(),它是用于查看对象在内存中的id.

>>> a = 10
>>> b = 'hello'
>>> c= (1, 3, 5)
>>> id(a); id(b); id(c)
4365573024
4372638160
4372561496

代码实例:

# 数字
>>> a = 5
>>> b = 5
>>> print(a==b)
True
>>> a is b
True #字符串
>>> n1 = 'jason'
>>> n2 = 'jason'
>>> print(n1==n2)
True
>>> n1 is n2
True #列表
>>> ls1 = [1, 3, 5, 7]
>>> ls2 = [1, 3, 5, 7]
>>> print(ls1==ls2)
True
>>> ls1 is ls2
False #元组
>>> tu1 = (1, 2, 3)
>>> tu2 = (1, 2, 3)
>>> print(tu1 == tu2)
True
>>> tu1 is tu2
False #字典
>>> info1 = {'name': 'jason', 'age': 25}
>>> info2 = {'name': 'jason', 'age': 25}
>>> print(info1 == info2)
True
>>> info1 is info2
False
>>> id(info1)
4372560920
>>> id(info2)
4367493088 #集合

>>> seta = set(['a', 'b', 'c'])
  >>> setb = set(['a', 'b', 'c'])
  >>> print(seta == setb)
  True
  >>> seta is setb
  False

总结:

当对象为数字、字符串时,对象1 is 对象2为True;当对象为列表、元组、字典、集合时,对象1 is 对象2为False。 

再看下面的一组列子:

>>> a = -4  # 对象也为数字,为什么为False了
>>> b = -4
>>> a is b
True
>>> a = -6
>>> b = -6
>>> a is b
False
>>> a = -5
>>> b = -5
>>> a is b
True
>>> a = 257
>>> b = 257
>>> a is b
False >>> a = 'hello'
>>> b = 'hello'
>>> a is b
True
>>> new_a = a * 20
>>> new_b = b * 20
>>> new_a is new_b
False

注意,Python仅仅对比较小的整数对象进行缓存(范围为范围[-5, 256])缓存起来,而并非是所有整数对象。需要注意的是,这仅仅是在命令行中执行,而在Pycharm或者保存为文件执行,结果是不一样的,这是因为解释器做了一部分优化。

二、encode和decode

注意:

1) python2中默认使用的是ASCII码,所以默认不支持中文.

2) python3中默认使用的是unicode码

在Python的内存中, 在程序的运行阶段, 使用的是unicode编码. 因为unicode是万国码, 什么内容都可以显示, 但是在数据传输和存储的时候, 由于unicode比较浪费空间和资源, 需要把unicode转成UTF-8或GBK进行存储. 怎么转换呢, 在python中可以对文字信息进行编码, 编码之后的内容就可以进行传输了. 编码之后的数据是bytes类型的数据. 其实, 还是原来的数据, 只是经过编码之后, 表现形式发生了改变而已.

字符串在传输的时候转换成bytes, 由encode来完成.

代码示例:

name = 'jason'
name1 = name.encode('utf-8')
print(name1)
name2 = name.encode('GBK')
print(name2) s = '好'
s1 = s.encode('utf-8') #utf-8编码,中文占3个字节
print(s1)
s2 = s.encode('GBK') #GBK编码, 中文占2个字节
print(s2) #执行结果:

b'jason'
  b'jason'
  b'\xe5\xa5\xbd'
  b'\xba\xc3'

英文编码之后的结果和源字符串一致. 中文编码之后的结果, 根据编码的不同, 得到的编码结果也不同. 从上方代码示例可以看出, 一个中文的utf-8编码是三个字节. 一个GBK的中文编码是两个字节.编码之后的类型就是bytes类型. 在网络传输和存储的时候, python保存和存储的就是bytes类型. 那么对方接收的时候, 也是接收的bytes类型的数据, 可以使用decode()来进行解码操作. 把bytes类型的数据还原回我们熟悉的字符串.

greeting = '你好世界'
s = greeting.encode('utf-8')
print(s)
s1 = b'\xe4\xbd\xa0\xe5\xa5\xbd\xe4\xb8\x96\xe7\x95\x8c'
print(s1.decode('utf-8')) #运行结果
b'\xe4\xbd\xa0\xe5\xa5\xbd\xe4\xb8\x96\xe7\x95\x8c'
你好世界 # \x分隔的, 每个\x和其后字符, 表示的是一个字节

编码和解码的时候都需要指定编码格式:

s = '你好'
s2 = s.encode('GBK')
print('s2:', s2)
# 把GBK转为utf-8, 首先要把GBK转为unicode,也就是需要解码
s3 = s2.decode('GBK')
# 重新编码成utf-8
s4 = s3.encode('utf-8')
print('s4:', s4) # 运行结果
s2: b'\xc4\xe3\xba\xc3'
s4: b'\xe4\xbd\xa0\xe5\xa5\xbd'

以上就是关于编码解码的简单解释.

Python学习-is和==区别, encode和decode的更多相关文章

  1. python day- 6 is 和 ==的区别 encode 和 decode

    1.is 和  == 的区别. == 是由来判断左右两边的内容是否相等. is 是用来判断内存地址是否相同. 引进 id (   )函数 小数据池: 对于字符串 ,数字 ,bool 值进行 id()计 ...

  2. [转载] python必碰到的问题---encode与decode,中文乱码

    阅读来源: 字符串在Python内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码(decode)成unicode,再从unicod ...

  3. 配置python学习环境遇到的问题:[Decode error - output not utf-8]

    因为前阵子学习monkeyrunner的时候,碰到了很多关于.py的脚本,其实我是一知半解的,也没打算去学习一下.将就着看看吧,后来无意中看到自动化测试工程师都要求会脚本语言的时候,刺激了我,想了想, ...

  4. Python—编码与解码(encode()和decode())

    编码与解码 decode英文意思是解码,encode英文原意是编码. Python 里面的编码和解码也就是 unicode 和 str 这两种形式的相互转化.编码是 unicode -> str ...

  5. 【python】浅谈encode和decode

    对于encode和decode,笔者也是根据自己的理解,有不对的地方还请多多指点. 编码的理解: 1.编码:utf-8,utf-16,gbk,gb2312,gb18030等,编码为了便于理解,可以把它 ...

  6. python的str,unicode对象的encode和decode方法, Python中字符编码的总结和对比bytes和str

    python_2.x_unicode_to_str.py a = u"中文字符"; a.encode("GBK"); #打印: '\xd6\xd0\xce\xc ...

  7. 【python】python新手必碰到的问题---encode与decode,中文乱码[转]

    转自:http://blog.csdn.net/a921800467b/article/details/8579510 为什么会报错“UnicodeEncodeError:'ascii' codec ...

  8. python encode和decode函数说明【转载】

    python encode和decode函数说明 字符串编码常用类型:utf-8,gb2312,cp936,gbk等. python中,我们使用decode()和encode()来进行解码和编码 在p ...

  9. python的str,unicode对象的encode和decode方法

    python的str,unicode对象的encode和decode方法 python中的str对象其实就是"8-bit string" ,字节字符串,本质上类似java中的byt ...

随机推荐

  1. <lable>标签

    最近用各种框架的时候,发现很多平常自己写代码没注意到的标签和用法,在这里记录一下. 其实是很多细节方面需要注意的写法. <label> 定义:为input元素定义标注 label标签不会向 ...

  2. HTML页面仿WORD样式

    公司要求不再浏览器中添加office插件的前提下.展示WORD文档中的内容要求一一对应.经过查询资料以及调整,得出如下相关资料: 1  标题样式: 目录 -- 宋体 小二 加粗 一级标题 -- 微软雅 ...

  3. Flink的Job启动JobManager端(源码分析)

    通过前面的文章了解到 Driver将用户代码转换成streamGraph再转换成Jobgraph后向Jobmanager端提交 JobManager启动以后会在Dispatcher.java起来RPC ...

  4. 【Jmeter】- 使用 jmeter 进行 dubbo 接口测试

    大家都知道 dubbo 是一个优秀 rpc 框架,它一般(dubbox 除外)通过对外提供 tcp协议的接口进行外部调用.而我们日常使用的测试工具 jmeter 并不支持 dubbo 协议的请求.所以 ...

  5. 2019杭电多校 hdu6662 Acesrc and Travel (树形dp

    http://acm.hdu.edu.cn/showproblem.php?pid=6662 题意:有两个人在树上博弈,每个点节点有两个分数a[i]和b[i],先手先选择一个点,后手在先手选的点的相邻 ...

  6. CodeForces 948B Primal Sport

    Primal Sport 题意:2个人玩游戏, 每次轮到一个人选择一个比当前值小的素数, 然后在找到比素数的倍数中最小的并且不小于当前数的一个数. 现在这个游戏玩了2轮, 现在想找到最小的那个起点X0 ...

  7. 【Offer】[62] 【圆圈中最后剩下的数字】

    题目描述 思路分析 测试用例 Java代码 代码链接 题目描述 0,1,,n-1这n个数字排成一个圆圈,从数字0开始,每次从这个圆圈里删除第m个数字.求出这个圆圈里剩下的最后一个数字. 牛客网刷题地址 ...

  8. 阿里云 windows frp 远程桌面

    环境: 阿里云服务器 server 2008 ,想要被远程访问的终端(本机)是win7 x64 目的:实现在别的地方(家里,出差在外) 用 远程桌面 访问 位于公司内部的电脑 frp 介绍:https ...

  9. Vue兄弟组件通信

    Vue兄弟组件通信之借助中央事件总线 下载链接:https://www.yinxiangit.com 其实要实现兄弟组件通信,就算是通过父子组件通信的方式也是可以达到的,如 子 ——>父——&g ...

  10. innobackupex备份参数slave-info、safe-slave-backup

    mysql物理备份用的比较多的是innobackupex命令,备份常用,但对于里面的两个参数slave-info.safe-slave-backup一直搞的不太明白,今儿亲测了一下. 先解释一下参数意 ...