前言

在上一篇 Java 中HashMap详解(含HashTable, ConcurrentHashMap) 中提到在map.put(key, value)的过程中,计算完key的hash值, 是通过hash & (n-1)来得出该元素在Node数组中的下标的,其中n是Node数组的长度。 其实我们更容易想到的是hash % n,这样刚好会得到0~n-1之间的数字,可以用作数组下标。那么为何此处是用的位运算呢?

结论

先说结论。 这里有一个前提,那就是HashMap中Node数组的长度始终保持是2^n, 比如默认的16, 如果创建HashMap的时候指定了初始的capacity,而这个capacity可能不是2^n, 会在内部转化一下,得到一个大于这个capacity的最小的2^n的数字来初始化数组。 每次扩容的时候也是进行2倍的扩容。

在这个前提下,hash & (n-1) 与 hash % n 是等价的。 而位运算更快一些。

论证

先来看一组数字:

n  (格式为2^m=十进制数字=二进制数字) n-1 (格式为2^m - 1=十进制数字=二进制数字)
2^2 = 4 = 100 2^2 - 1 = 3 = 011
2^3 = 8 = 1000 2^3 - 1 = 7 = 0111
2^4 = 16 = 10000 2^4 - 1 = 15 = 01111
2^5 = 32 = 100000 2^5 -1 = 31 = 011111

此处我们可以看到规律,2^m的二进制就是1的后面加上m个0, 而2^m -1的二进制就是0的后面加上m个1.

下面我们来看 hash % n(求余数)的运算:

首先看hash/n,由于n=2^m, 我们先看hash/2的情况,这样一来就简单了,因为我们都知道,二进制的情况下,一个数字除以2其实就是右移一位,在左边加一个0,右边移出去一位。如果觉得不好理解,就类比十进制的数字除以10的情况,是一样的。举一反三一下,hash/4的情况自然就是右移2位,由于n=2^m, 其实hash/n的操作就是右移m位

右移之后我们得到的是hash/n的整除,那么余数呢?其实就是我们移出去的数字

举个例子,假设hash = 18, n=4,我们知道18/4=4 , 18%4 =2,看看按照我们上面的运算是否会得到相同的结果:

18=10010, 4=2^2

1 0 0 1 0      右移2位    0 0 1 0 0 1 0
hash=18 数组长度n=4=2^2 18/4得到的整除 余数18%4

通过运算可以很容易的验证18/4 = 00100 = 4 , 而18%4 = 10 = 2, 是正确的。

现在假设Node数组进行了扩容n=8,再来看一下:

1 0 0 1 0      右移3位    0 0 0 1 0 0 1 0
hash=18 数组长度n=8=2^3 18/4得到的整除 余数18%8

同样经过运算18 / 8 = 10 = 2, 18 % 8 = 10 = 2, 是正确的。

现在我们可以看到规律, hash % (2^m)的结果, 其实是就是hash这个数字二进制表达的最后m位(被移出去的m位)

而前面我们又知道2^m-1其实就是0后面加上m个1. 还用上面的例子,我们看一下18 & (2^3-1)的运算:

18= 1 0 0 1 0
2^3-1= 0 0 1 1 1
与运算 0 0 0 1 0

我们知道,任何数字与1做与运算,还是得到该数字;任何数字与0做与运算,都得0,那么hash & (2^m-1) ,高位的都是零,只得到低位的m个数字,与上面计算的hash % (2^m)是一样的结果。

证明完成。

HashMap的哈希函数为何用(n - 1) & hash的更多相关文章

  1. 【C# 集合】Hash哈希函数 |散列函数|摘要算法

    希函数定义 哈希函数(英語:Hash function)又称散列函数.散列函数.摘要算法.单向散列函数.散列函数把消息或数据压缩成摘要,使得数据量变小,将数据的格式固定下来.该函数将数据打乱混合,重新 ...

  2. HashMap中的哈希函数分析

    首先我们要知道,在理想情况下的哈希表中,哈希函数生成的哈希值是value在数组中的下标,其范围是分布于负无穷到正无穷的整个实整数轴的.而在现实情况下,是不可能存在这么大的一个数组的.接下来分析Hash ...

  3. 算法初级面试题05——哈希函数/表、生成多个哈希函数、哈希扩容、利用哈希分流找出大文件的重复内容、设计RandomPool结构、布隆过滤器、一致性哈希、并查集、岛问题

    今天主要讨论:哈希函数.哈希表.布隆过滤器.一致性哈希.并查集的介绍和应用. 题目一 认识哈希函数和哈希表 1.输入无限大 2.输出有限的S集合 3.输入什么就输出什么 4.会发生哈希碰撞 5.会均匀 ...

  4. HashMap分析 + 哈希表

    http://www.cnblogs.com/hzmark/archive/2012/12/24/HashMap.html http://www.cnblogs.com/xqzt/archive/20 ...

  5. 左神算法第五节课:认识哈希函数和哈希表,设计RandomPool结构,布隆过滤器,一致性哈希,岛问题,并查集结构

    认识哈希函数和哈希表 MD5Hash值的返回范围:0~9+a~f,是16位,故范围是0~16^16(2^64)-1, [Hash函数],又叫散列函数: Hash的性质: 1)  输入域无穷大: 2)  ...

  6. 字符串哈希函数(String Hash Functions)

    哈希函数举例 http://www.cse.yorku.ca/~oz/hash.html Node.js使用的哈希函数 https://www.npmjs.org/package/string-has ...

  7. lintcode:哈希函数

    题目: 哈希函数 在数据结构中,哈希函数是用来将一个字符串(或任何其他类型)转化为小于哈希表大小且大于等于零的整数.一个好的哈希函数可以尽可能少地产生冲突.一种广泛使用的哈希函数算法是使用数值33,假 ...

  8. Eight(bfs+全排列的哈希函数)

    Time Limit: 1000MS   Memory Limit: 65536K Total Submissions: 22207   Accepted: 9846   Special Judge ...

  9. lintcode-->哈希函数

    在数据结构中,哈希函数是用来将一个字符串(或任何其他类型)转化为小于哈希表大小且大于等于零的整数.一个好的哈希函数可以尽可能少地产生冲突.一种广泛使用的哈希函数算法是使用数值33,假设任何字符串都是基 ...

随机推荐

  1. Python 中多线程共享全局变量的问题

    写在前面不得不看的一些P话: Python 中多个线程之间是可以共享全局变量的数据的. 但是,多线程共享全局变量是会出问题的. 假设两个线程 t1 和 t2 都要对全局变量g_num (默认是0)进行 ...

  2. linux中CentOS配置文件编辑错误撤回

    未编辑状态下 U键 撤销 DD 快速删除

  3. Tomcat深入浅出——Servlet(二)

    一.Servlet简介 Servlet类最终开发步骤: 第一步:编写一个Servlet类,直接继承HttpServlet 第二步:重写doGet方法或者doPost方法,重写哪个我说的算! 第三步:将 ...

  4. 腾讯云数据库公有云市场稳居TOP 2!

    7月4日,国际权威机构IDC发布的<2021年下半年中国关系型数据库软件市场跟踪报告>显示,腾讯云数据库在关系型数据库软件市场(公有云模式)中,位列第二. IDC报告显示,2021下半年中 ...

  5. StringBuilder的构造方法和append方法

    Java中StringBuilder的构造方法 StringBuilder构造方法: public StringBuilder(): 创建一个空白可变的字符串对象,不含有任何内容 public Str ...

  6. github package的使用教程

    一.写在前面 上一次,笔者向大家介绍了把gitlab仓库作为npm私包的使用方法,具体的详见我的博文地址https://www.cnblogs.com/cnroadbridge/p/16406476. ...

  7. zabbix监控添加学习笔记

    在实际生产环境中,除了CPU.内存等一些系统信息可以挂载zabbix的自带模板Template OS Linux:但是一些公司开发的定制服务需要自己写模板或者监控项去监控: 一.监控公司的java服务 ...

  8. get 和 post 的区别

    1. get 提交的信息显示在地址栏中 post 提交的信息不显示在地址栏中 2. get 对于敏感数据信息不安全,因为信息显示在地址栏中 post 对于敏感数据安全 3. get 不支持大数据量请求 ...

  9. DBPack SQL Tracing 功能及数据加密功能详解

    上周,我们正式发布了 DBPack SQL Tracing 功能和数据加密功能,现对这两个功能做如下说明. SQL Tracing 通过 DBPack 代理开启的全局事务,会自动在 http head ...

  10. MySQL表操作过程的基础代码解析

    GreatSQL社区原创内容未经授权不得随意使用,转载请联系小编并注明来源. MySQL 的表有很多种,对表的操作主要是增删改查,今天来浅谈一下这些操作的底层代码和流程,以下以 tmp table为例 ...