Python 浮点数的冷知识

本周的PyCoder's Weekly 上分享了一篇小文章，它里面提到的冷知识很有意思，我稍作补充，分享给大家。

它提到的部分问题，读者们可以先思考下：

若两个元组相等，即 a==b 且 a is b，那么相同索引的元素（如 a[0] 、b[0]）是否必然相等呢？
若两个对象的 hash 结果相等，即 hash(a) == hash(b)，那么它们是否必然相等呢？

答案当然都为否（不然就不叫冷知识了），大家可以先尝试回答一下，然后再往下看。

-----思考分割线-----

好了，先来看看第一个问题。两个相同的元组 a、b，它们有如下的关系：

>>> a = (float('nan'),)

>>> b = a

>>> a   # (nan,)

>>> b   # (nan,)

>>> type(a), type(b)

(<type 'tuple'>, <type 'tuple'>)

>>> a == b

True

>>> a is b  # 即 id(a) == id(b)

True

>>> a[0] == b[0]

False

以上代码表明：a 等于 b（类型、值与 id 都相等），但是它们的对位元素却不相等。

两个元组都只有一个元素（逗号后面没有别的元素，这是单元素的元组的表示方法，即 len(a)==1 ）。float() 是个内置函数，可以将入参构造成一个浮点数。

为什么会这样呢？先查阅一下文档，这个内置函数的解析规则是：

sign           ::=  "+" | "-"

infinity       ::=  "Infinity" | "inf"

nan            ::=  "nan"

numeric_value  ::=  floatnumber | infinity | nan

numeric_string ::=  [sign] numeric_value

它在解析时，可以解析前后的空格、前缀的加减号（+/-）、浮点数，除此之外，还可以解析两类字符串（不区分大小写）："Infinity"或"inf"，表示无穷大数；“nan”，表示不是数（not-a-number），确切地说，指的是除了数以外的所有东西。

前面分享的第一个冷知识就跟“nan”有关，作为整体，两个元组相等，但是它们唯一的元素却不相等。之所以会这样，因为“nan”表示除了数以外的东西，它是一个范围，所以不可比较。

作为对比，我们来看看两个“无穷大的浮点数”是什么结果：

>>> a = (float('inf'),)

>>> b = a

>>> a   # (inf,)

>>> b   # (inf,)

>>> a == b  # True

>>> a is b  # True

>>> a[0] == b[0]  # True

注意最后一次比较，它跟前面的两个元组恰好相反，由此，我们可以得出结论：两个无穷大的浮点数，数值相等，而两个“不是数的东西”，数值不相等。

化简一下，可以这样看：

>>> a = float('inf')

>>> b = float('inf')

>>> c = float('nan')

>>> d = float('nan')

>>> a == b  # True

>>> c == d  # False

以上就是第一个冷知识的揭秘。接着看第二个：

>>> hash(float('nan')) == hash(float('nan'))

True

前面刚说了两个“不是数的东西”不相等，这里却显示它们的哈希结果相等，这挺违背常理的。

我们可以推理出一条简单的结论：不相等的两个对象，其哈希结果可能相等。

原因在于，hash(float('nan')) 的结果等于 0，它是个固定值，作比较时当然就相等了。

其实，关于 hash() 函数，还埋了一个彩蛋：

>>> hash(float('inf'))  # 314159

>>> hash(float('-inf')) # -314159

有没有觉得这个数值很熟悉啊？它正是圆周率的前五位 3.14159，去除小数点后的结果。在早期的 Python 版本中，负无穷大数的哈希结果其实是 -271828，正是取自于自然对数 e。这两个数都是硬编码在 Python 解释器中的，算是某种致敬吧。

由于 float('nan') 的哈希值相等，这通常意味着它们不可以作为字典的不同键值，但是事实却出人意料：

>>> a = {float('nan'): 1, float('nan'): 2}

>>> a

{nan: 1, nan: 2}

# 作为对比：

>>> b = {float('inf'): 1, float('inf'): 2}

>>> b

{inf: 2}

如上所示，两个 nan 键值在表示上一模一样（注意，它们没有用引号括起来），它们可以共存，而 inf 却只能归并成一个，再次展示出了 nan 的神奇。

好了，两个很冷的小知识分享完毕，背后的原因都在于 float() 取浮点数时，Python 允许了 nan（不是数）的存在，它表示不确切的存在，所以导致了这些奇怪的结果。

最后，我们作下小结：

包含 float('nan') 的两个元组，当做整体作比较时，结果相等；两个相等的元组，其对位的元素可能不相等
float('nan') 表示一个“不是数”的东西，它本身不是确定值，两个对象作比较时不相等，但是其哈希结果是固定值，作比较时相等；可用作字典的键值，而且是不冲突的键值
float('inf') 表示一个无穷大的浮点数，可看作确定的值，两个对象做比较时相等，其哈希结果也相等；可用作字典的键值，但是会产生冲突
float('nan') 的哈希结果为 0，float('inf') 的哈希结果为 314159

参考资料：

https://docs.python.org/3/library/functions.html#float

https://www.pythondoeswhat.com/2019/09/welcome-to-float-zone.html

公众号【Python猫】，本号连载优质的系列文章，有喵星哲学猫系列、Python进阶系列、好书推荐系列、技术写作、优质英文推荐与翻译等等，欢迎关注哦。

Python 浮点数的冷知识的更多相关文章

盘点 Python 中的那些冷知识（二）
上一篇文章分享了 Python中的那些冷知识,地址在这里盘点 Python 中的那些冷知识(一) 今天将接着分享!! 06. 默认参数最好不为可变对象函数的参数分三种可变参数默认参数关键字参 ...
python 冷知识（装13 指南）
python 冷知识(装13 指南) list1 += list2 和 list1 = list1 + list2 的区别 alpha = [1, 2, 3] beta = alpha # alpha ...
10个不为人知的 Python 冷知识
转载: 1. 省略号也是对象 ...这是省略号,在Python中,一切皆对象.它也不例外. 在 Python 中,它叫做 Ellipsis . 在 Python 3 中你可以直接写…来得到这玩意. 而 ...
python冷知识（续）
python 冷知识 1.交互式中修改最大递归深度大家都知道使用递归是有风险的,递归深度过深容易导致堆栈的溢出. 那到底,默认递归次数限制是多少呢? 可以使用sys这个库来查看 >>&g ...
python冷知识
目录省略号也是对象奇怪的字符串 and 和 or 的取值顺序访问类中的私有方法时有时无的切片异常两次 return for 死循环 intern机制省略号也是对象在python中一切皆对 ...
10 个不为人知的Python冷知识
1. 省略号也是对象 ... 这是省略号,在Python中,一切皆对象.它也不例外. 在 Python 中,它叫做 Ellipsis . 在 Python 3 中你可以直接写-来得到这玩意. > ...
python小技巧小知识
python小技巧小知识 python系统变量(修改调用shell命令路径)或用户空间说明 20150418 python调用系统命令,报找不到.怎么办? 类似执行shell的: [ -f /etc ...
Python开发（一）：Python介绍与基础知识
Python开发(一):Python介绍与基础知识本次内容一:Python介绍: 二:Python是一门什么语言三:Python:安装四:第一个程序 “Hello world” 五:Pytho ...
这些鲜为人知的前端冷知识，你都GET了吗？
背景最近公司项目不多,比较清闲,划水摸鱼混迹于各大技术博客平台,瞬间又GET了好多前端技能,一些属于技巧,一些则是闻所未闻的冷知识,一时间还消化不过来,不由的发出一声感叹! 前端可真是博大精深于是 ...

随机推荐

SCAU-1076 K尾相等数
代码借鉴SCAU-OJ(感谢!!) 题目:1076 K尾相等数时间限制:500MS 内存限制:65536K提交次数:251 通过次数:80 题型: 编程题语言: G++;GCC Desc ...
TensorFlow在windows 下的安装
前言:从2015年谷歌将tensorflow开源后,这位用于深度学习的强大神器便把Caffe,Keras,Torch7等这一票人全部干掉,github上的star和fork是一路飙升,几乎是它们的总和 ...
Python拼接字符串的七种方式
忘了在哪看到一位编程大牛调侃,他说程序员每天就做两件事,其中之一就是处理字符串.相信不少同学会有同感. 几乎任何一种编程语言,都把字符串列为最基础和不可或缺的数据类型.而拼接字符串是必备的一种技能.今 ...
html——标签基础
img标签:使用 src="xxx" 来链接图片当图片显示不出来的时候显示alt 中定义的内容当图片显示了出来鼠标移动到图片上的时候显示的是 title 中定义的 ...
Spring中常见的设计模式——原型模式
1.原型模式应用场景当遇到大量耗费劳动力的 get,set赋值场景时,如下: public class SetGetParam { public void setParam(UserDto user ...
JavaScript笔记八
1.原型(prototype) - 创建一个函数以后,解析器都会默认在函数中添加一个数prototype prototype属性指向的是一个对象,这个对象我们称为原型对象. - 当函数作为构造函数使用 ...
hadoop全分布式的搭建
修改主机名:vim /etc/sysconfig/network 1 修改 hadoop-env.sh 2 修改core-site.xml /hadoop/tmpdir: 产生 namenode中fs ...
Java 浅拷贝、深拷贝，你知多少？
这是今天我们在技术群里面讨论的一个知识点,讨论的相当激烈,由于对这一块使用的比较少,所以对这一块多少有些盲区.这篇文章总结了所讨论的内容,希望这篇文章对你有所帮助. 在 Java 开发中,对象拷贝或者 ...
5分钟上手自动化测试——Airtest+Poco快速上手
版权声明:该文章为AirtestProject原创文章:允许转载,但转载必须注明“转载”并保留原链接前言本文档将演示使用`AirtestProject`专用的编辑器AirtestIDE,编写`Ai ...
Vue引入
Vue引入概念: 1.el:实例 new Vue({ el: '#app' }) // 实例与页面挂载点一一对应 // 一个页面中可以出现多个实例对应多个挂载点 // 实例只操作挂载点内部内容 2. ...

Python 浮点数的冷知识

Python 浮点数的冷知识的更多相关文章

随机推荐

热门专题