HashMap之tableSizeFor方法图解
在看HashMap源码时,注意到一个问题,容量必须是2的整数幂,为了保证这一点,专门给出了一个巧妙而高效的方法tableSizeFor。不妨想一下,如果是自己解决这个问题,该怎么解决?
给定一个int类型的整数n,如何求出不小于它的最接近的2的整数幂m,比如给定10得出16,给定25得出32?
普通人的简单粗暴方式
普通人的想法可能比较简单,直接对n求以2为底的对数,结果m是double类型,若小数部分为0,则m就是我们要求的指数;小数部分不为0,则对m向上取整,最后直接求2的m次幂。
首先遇到的问题是jdk没有提供对2求对数的数学公式,只有对自然对数e求对数的公式Math.log(double a)。
好在我们可以用对数的换底公式
示例代码
public static int fun(int n) {
double m = Math.log(n) / Math.log(2);
int m2 = (int) Math.ceil(m);
return (int) Math.pow(2, m2);
}
不考虑是否有精度损失,上述代码很简洁,只有三步,求对数+取整+求指数。
问题
回顾HashMap中的需求我们知道,这个方法属于很基础的方法,将在初始化或者添加时被大量执行,这就要求方法本身一定要高效。
这里虽然代码简洁,但调用的方法细看的话代码还是很多的,而且涉及到的运算,比如对数,指数,除运算,取整,强制类型转换,都是比较高级的,必然依靠大量的底层简单操作实现。
一个程序运行的时间除了和环境比如时钟周期的长度和每条指令的平均时钟周期数有关外,还和指令数有关。感性的认识也能告诉我们,上述代码的实际执行的最终指令一定不会少。
我们之所有要用这个方法转换为2的幂,是为了减少哈希冲突,提高存取效率,结果这个方法本身严重影响了效率,岂不是拣了芝麻丢了西瓜?
大神的实现
我们不妨看看HashMap的作者是如何实现的。
static final int tableSizeFor(int cap) {
int n = cap - 1;
//移位运算
n |= n >>> 1;
n |= n >>> 2;
n |= n >>> 4;
n |= n >>> 8;
n |= n >>> 16;
return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}
第一行很简单,为什么要-1放在最后说,最后一行是两个三目运算符,其中之一操作是n+1,都很容易理解。关键是中间五步移位加上或运算。
移位的思想
说一下我理解的作者的思想:
2的整数幂用二进制表示都是最高有效位为1,其余全是0,比如十进制8和32,下图只用了一个字节示意。

对任意十进制数转换为2的整数幂,结果是这个数本身的最高有效位的前一位变成1,最高有效位以及其后的位都变为0。
核心思想是,先将最高有效位以及其后的位都变为1,最后再+1,就进位到前一位变成1,其后所有的满2变0。所以关键是如何将最高有效位后面都变为1。
还是用图来示意。这里将十进制的25转换为32。

作者的做法是先移位,再或运算。
右移一位,再或运算,就有两位变为1;
右移两位,再或运算,就有四位变为1,,,
最后右移16位再或运算,保证32位的int类型整数最高有效位之后的位都能变为1.
全过程示意图
自己觉得理解了,但是感觉文章写出来很绕,估计看到这里的你也有这种感觉。这里对整个过程画图示意。
初始值
选取任意int类型数字,下图x表示不确定0或者1.

我们目的是将所有的x变为1,如下图

最后+1,就能进位得到2的整数幂。

我们要做的就是不断通过右移+或运算来达到目的。
右移一位+或运算

可以看出,右移一位再或运算,有两位变成了1。
右移二位+或运算

右移两位再或运算,有四位变成了1。
右移四位+或运算

右移四位再或运算,有八位变成了1。
右移八位+或运算

右移八位再或运算,有十六位变成了1。
右移十六位+或运算

右移十六位再或运算,注意这里不是三十二位全变,而是最高位后面的全变1。
结果+1

可以看出,不管x是多少,我们都能将其转换为1。而且分别经过1,2,4,8,16次转换,不管这个int类型值多大,我们都会将其转换,只是值较小时,可能多做几次无意义操作。
初始容量-1
之所以在开始以前先将容量-1,是为了避免给定容量已经是8,16这样2的幂时,不减一直接移位会导致得到的结果比预期大。比如预期16得到应该是16,直接移位的话会得到32。在上图中就是所有x本身已经是0的情况下,不减1得到的结果变大了。
总结
回到一开始的问题,这个方法之所以高效,是因为移位运算和或运算都属于比较底层的操作,代码的数量不会比最终的指令数多,也就是通过几个简单操作实现了我们的目的。
为啥要专门写一篇文章来解释这个方法,是因为在看这个方法的时候,意识到了一些原本不太在意的问题。通过这个方法,就理解了为啥学计算机要学一些基础的知识,比如二进制的操作,逻辑运算等等,以及为啥一些高级的算法看起来都在处理简单的问题。如果单纯学习可能觉得枯燥,但实际上它们都是有大用处的。平时可能看不出来,在一些关键的细节就看出普通人和大神的区别了。
要学的还有很多!
HashMap之tableSizeFor方法图解的更多相关文章
- HashMap的tableSizeFor方法解读
static final int tableSizeFor(int cap) { int n = cap - 1; n |= n >>> 1; n |= n >>> ...
- hashmap分解大法--tableSizeFor方法
tableSizeFor方法 /** * 根据容量参数,返回一个2的n次幂的table长度. */ private static final int tableSizeFor(int c) { int ...
- HashMap之put方法流程解读
说明:本文中所谈论的HashMap基于JDK 1.8版本源码进行分析和说明. HashMap的put方法算是HashMap中比较核心的功能了,复杂程度高但是算法巧妙,同时在上一版本的基础之上优化了存储 ...
- HashMap的tableSizeFor解析
我们都知道,对于HashMap来说,数组的容量为2的倍数,但是我们可以在创建map的时候传入一个数组的大小 此时,这个初始化数组大小会传给一个双参的构造器 1. 创建HashMap public st ...
- hashMap的get()方法,错用并发造成cpu和负载高
一次线上问题的解决 线上发现服务cpu使用达到98%,负载高达200多,64核心cpu,下面介绍解决过程: 1.top命令查出占用cpu高的进程pid 2.使用jstack -l pid >du ...
- Java基础:HashMap中putAll方法的疑惑
最近回顾了下HashMap的源码(JDK1.7),当读到putAll方法时,发现了之前写的TODO标记,当时由于时间匆忙没来得及深究,现在回顾到了就再仔细思考了下 @Override public v ...
- jdk1.8 HashMap的keySet方法详解
我在看HashMap源码的时候有一个问题让我产生了兴趣,那就是HashMap的keySet方法,没有调用HashMap的有关数据的任何方法就能获取到map的所有的键,他是怎么做到的,然后我就通过模拟k ...
- HashMap的put方法返回值问题
API文档中的描述: 先看一个例子 Map<Character, Integer> map = new HashMap<Character, Integer>(); Syste ...
- HashMap的clear方法
我们都知道HashMap的clear()方法会清楚map的映射关系,至于怎么实现的呢? 下面先看一下clear()方法的源码 public void clear() { Node<K,V> ...
随机推荐
- POJ - 2553 tarjan算法+缩点
题意: 给你n个点,和m条单向边,问你有多少点满足(G)={v∈V|∀w∈V:(v→w)⇒(w→v)}关系,并把这些点输出(要注意的是这个关系中是蕴含关系而不是且(&&)关系) 题解: ...
- Hyper-V安装CentOS修改分辨率
grubby --update-kernel=ALL --args="video=hyperv_fb:1600x900" reboot https://blog.csdn.net/ ...
- iTerm2终端工具在Mac OS上使用详解
一.概述 因个人工作需要,使用终端工具进行运维和开发工作,但是Mac OS 自带的终端工具使用堡垒机登录配置不了,而且使用CRT等终端工具每次登录堡垒机都需要配置密码,操作起来很麻烦.一直想找一款终端 ...
- codeforces 1000C - Covered Points Count 【差分】
题目:戳这里 题意:给出n个线段,问被1~n个线段覆盖的点分别有多少. 解题思路: 这题很容易想到排序后维护每个端点被覆盖的线段数,关键是端点值不好处理.比较好的做法是用差分的思想,把闭区间的线段改为 ...
- 美团CodeM资格赛第二题
锦标赛 时间限制:1秒 空间限制:32768K 组委会正在为美团点评CodeM大赛的决赛设计新赛制.比赛有 n 个人参加(其中 n 为2的幂),每个参赛者根据资格赛和预赛.复赛的成绩,会有不同的积分. ...
- codevs1154能量项链 环形区间DP 细节
中文题..题意略 我们知道每次枚举最后合并哪两个.. 于是枚举中间节点k 我犯的错误是将转移方程写成了,dp[l][r]=max(dp[l][r],dp[l][k]+dp[k+1][r]+a[l]*a ...
- PicGo:搭建图床
PicGo:搭建图床 PicGo 免费搭建个人图床工具PicGo: 支持Windows.MacOS 和 Linux 软件目前覆盖的图床有8个平台: SM.MS图床.腾讯云COS.GitHub图床.七牛 ...
- Linux 驱动框架---驱动中的并发
并发指多个执行单元被同时.并行的执行,而并发执行的单元对共享资源的访问就容易导致竟态.并发产生的情况分为抢占和并行(多核)和硬抢占(中断).Linux为解决这一问题增加了一系列的接口来解决并发导致的竟 ...
- 7816协议时序和采用UART模拟7816时序与智能卡APDU指令协议
7816时序 7816时一个比较早的老通讯时序了,最近项目上需要用UART模拟所以,简单学习时序. 时序比较简单,熟悉UART的一眼看着就像是串口的时序,只是他没有停止位,取而代之的就是保护时间gur ...
- php 配置主机虚拟目录(使用虚拟域名访问 127.0.0.1) 一点也不好使?????
php 配置主机虚拟目录(使用虚拟域名访问 127.0.0.1)steps:1>打开目录 D:\xwamp\bin\apache\apache2.4.9\conf 修改文件 httpd ...