HashMap实现原理(jdk1.7),源码分析
HashMap实现原理(jdk1.7),源码分析
HashMap是一个用来存储Key-Value键值对的集合,每一个键值对都是一个Entry对象,这些Entry被以某种方式分散在一个数组中,这个数组就是HashMap的主干。
一、几大常量
//默认容量 16
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;
//最大容量
static final int MAXIMUM_CAPACITY = 1 << 30;
//默认负载因子
static final float DEFAULT_LOAD_FACTOR = 0.75f;
//空的哈希表
static final Entry<?,?>[] EMPTY_TABLE = {};
//实际使用的哈希表,存储数据的数组,Entry类型,每个键值对都是一个Entry
transient Entry<K,V>[] table = (Entry<K,V>[]) EMPTY_TABLE;
//数组
transient int size;
//阈值
int threshold;
//负载因子
final float loadFactor;
//修改次数,用于多线程问题
transient int modCount;
//使用替代哈希的默认阀值
static final int ALTERNATIVE_HASHING_THRESHOLD_DEFAULT = Integer.MAX_VALUE;
//随机的哈希种子, 有助于减少哈希碰撞的次数
transient int hashSeed = 0;
二、构造器
//以两参构造器为例
public HashMap(int initialCapacity, float loadFactor) {
if (initialCapacity < 0)
throw new IllegalArgumentException("Illegal initial capacity: " + initialCapacity);
//传入容量大于最大容量,以最大容量初始容量
if (initialCapacity > MAXIMUM_CAPACITY)
initialCapacity = MAXIMUM_CAPACITY;
if (loadFactor <= 0 || Float.isNaN(loadFactor))
throw new IllegalArgumentException("Illegal load factor: " + loadFactor);
this.loadFactor = loadFactor;
threshold = initialCapacity;
init();
}
三、put方法
public V put(K key, V value) {
if (table == EMPTY_TABLE) {
//1.如果hash表为空,则根据阈值扩展
inflateTable(threshold);
}
if (key == null)
//2.键为空的处理方式
return putForNullKey(value);
//3.计算key的哈希值
int hash = haSsh(key);
//4.根据上一步的哈希值得到其再数组中的位置i
int i = indexFor(hash, table.length);
//5.如果i上有元素,则对当前位置的链表进行遍历(HashMap是由数组加链表构成的,一个位置上可能不止有一个元素)
for (Entry<K,V> e = table[i]; e != null; e = e.next) {
Object k;
//5.1. 查看该链表是否有键相同的元素,如果有,就以新值替换旧值,并返回旧值
if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
V oldValue = e.value;
e.value = value;
e.recordAccess(this);
return oldValue;
}
}
//6.修改次数+1
modCount++;
//7.使用头插法插入Entry对象
addEntry(hash, key, value, i);
return null;
}
put内的方法深入分析:
1. inflateTable(threshold);
private void inflateTable(int toSize) {
//算出一个大于等于toSize的 2的次方数 作为哈希表的容量
int capacity = roundUpToPowerOf2(toSize);
//新的阈值,大小为 容量*负载因子
threshold = (int) Math.min(capacity * loadFactor, MAXIMUM_CAPACITY + 1);
table = new Entry[capacity];
initHashSeedAsNeeded(capacity);
}
2. putForNullKey(value);
private V putForNullKey(V value) {
//这里可以看到,key为null时和正常的put没什么区别,只不过是直接以数组第一个位置作为插入点
for (Entry<K,V> e = table[0]; e != null; e = e.next) {
if (e.key == null) {
V oldValue = e.value;
e.value = value;
e.recordAccess(this);
return oldValue;
}
}
modCount++;
addEntry(0, null, value, 0);
return null;
}
3. indexFor(hash, table.length);
//使算得的hash值与 数组长度-1 进行"与"运算
static int indexFor(int h, int length) {
//官方源码注释说的很清楚了,长度必须是非零的2次方数
// assert Integer.bitCount(length) == 1 : "length must be a non-zero power of 2";
return h & (length-1);
}
/*
那么为什么一定要是2的次方数呢
假设length=16,那么15的二进制则为0000 1111(以8位表示),
如果h = xxxx 0101, h = xxxx 1111,下面进行"与"运算
0000 1111 0000 1111 0000 1111
xxxx 0101 xxxx 1111 xxxx xxxx
& —————————————— & —————————————— & ——————————————
0000 0101 0000 1111 0000 xxxx
根据上述结果我们可以得出这样的结论:任何一个hash值 & (length-1) 的结果只与hash的后n位有关,
n取决于length是2的几次幂,这样,运算出来的结果一定在0 ~ (length-1)这个范围之内
*/
4. addEntry(hash, key, value, i);
void addEntry(int hash, K key, V value, int bucketIndex) {
//扩容操作,当hash表元素个数大于等于阈值了,并且要插入的位置已经有值了,才进行扩容
if ((size >= threshold) && (null != table[bucketIndex])) {
//扩容位原来容量的2倍
resize(2 * table.length);
hash = (null != key) ? hash(key) : 0;
//计算元素在数组插入的位置
bucketIndex = indexFor(hash, table.length);
}
//创建新的Entry对象放到对应的位置,使用的是头插法
createEntry(hash, key, value, bucketIndex);
}
5. resize(2 * table.length);
//这是addEntry中的方法,用于对hash表进行扩容,其实就是新建一个长度为newCapaciy的数组,然后把旧数组的元素放到新数组
void resize(int newCapacity) {
Entry[] oldTable = table;
int oldCapacity = oldTable.length;
if (oldCapacity == MAXIMUM_CAPACITY) {
threshold = Integer.MAX_VALUE;
return;
}
Entry[] newTable = new Entry[newCapacity];
//这就是新旧数组元素转移方法,下面有源码分析
transfer(newTable, initHashSeedAsNeeded(newCapacity));
//重新指定为新数组引用
table = newTable;
//重新计算阈值
threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);
}
//transfer分析
void transfer(Entry[] newTable, boolean rehash) {
int newCapacity = newTable.length;
//遍历原hash表,e指向当前元素,next指向e的下一个元素
for (Entry<K,V> e : table) {
while(null != e) {
Entry<K,V> next = e.next;
if (rehash) {
e.hash = null == e.key ? 0 : hash(e.key);
}
//重新计算元素在新数组中应该存入的位置
int i = indexFor(e.hash, newCapacity);
//使用头插法,依次插入新的位置
e.next = newTable[i];
newTable[i] = e;
e = next;
}
}
}
四、get方法
public V get(Object key) {
if (key == null)
//key为空的情况,和上述的putForNullKey相同,也是从数组第一个位置寻找
return getForNullKey();
//遍历数组,根据key的hash值找到数组的位置,然后遍历链表
Entry<K,V> entry = getEntry(key);
//返回key对应的值
return null == entry ? null : entry.getValue();
}
总结
- HashMap(JDK1.7)是由数组加链表的形式存储键值对,每个键值对都是一个Entry对象。
- 默认容量为16,默认负载因子为0.75,默认阈值为12(容量*负载因子),插入的键值对时,如果容器内总个数超过阈值,并且插入的位置不为空,就会进行扩容,扩展为原来的2倍。
- 容量必须为非零的2次幂,详解见上面的indexFor方法
- 每个键值对存入容器的原则是:计算当前key的哈希值,与当前数组长度-1的值进行“与”运算得到插入的位置,如果当前位置为空,则直接将键值对插入数组,如果当前位置有值,则以当前位置的第一个元素为头节点,构成链表,然后让数组该位置存放新的元素。
- 当插入的键为空时,默认放在数组第一个位置,因此HashMap最多只能存放一个key为空的键值对。
- HashMap是线程不安全的。HashMap使用了modCount字段来记录其内部结构发生变化的次数(put方法覆盖某个key对应的value值不属于结构变化)。
HashMap实现原理(jdk1.7),源码分析的更多相关文章
- ConcurrentHashMap底层实现原理(JDK1.8)源码分析
ref:https://blog.csdn.net/xu768840497/article/details/79194701 http://www.cnblogs.com/leesf456/p/545 ...
- 集合之HashMap(含JDK1.8源码分析)
一.前言 之前的List,讲了ArrayList.LinkedList,反映的是两种思想: (1)ArrayList以数组形式实现,顺序插入.查找快,插入.删除较慢 (2)LinkedList以链表形 ...
- Java中HashMap底层实现原理(JDK1.8)源码分析
这几天学习了HashMap的底层实现,但是发现好几个版本的,代码不一,而且看了Android包的HashMap和JDK中的HashMap的也不是一样,原来他们没有指定JDK版本,很多文章都是旧版本JD ...
- HashMap底层实现原理(JDK1.8)源码分析
ref:https://blog.csdn.net/tuke_tuke/article/details/51588156 http://www.cnblogs.com/xiaolovewei/p/79 ...
- 集合之HashSet(含JDK1.8源码分析)
一.前言 我们已经分析了List接口下的ArrayList和LinkedList,以及Map接口下的HashMap.LinkedHashMap.TreeMap,接下来看的是Set接口下HashSet和 ...
- 【集合框架】JDK1.8源码分析之HashMap(一) 转载
[集合框架]JDK1.8源码分析之HashMap(一) 一.前言 在分析jdk1.8后的HashMap源码时,发现网上好多分析都是基于之前的jdk,而Java8的HashMap对之前做了较大的优化 ...
- 【集合框架】JDK1.8源码分析之HashMap & LinkedHashMap迭代器(三)
一.前言 在遍历HashMap与LinkedHashMap时,我们通常都会使用到迭代器,而HashMap的迭代器与LinkedHashMap迭代器是如何工作的呢?下面我们来一起分析分析. 二.迭代器继 ...
- 【集合框架】JDK1.8源码分析HashSet && LinkedHashSet(八)
一.前言 分析完了List的两个主要类之后,我们来分析Set接口下的类,HashSet和LinkedHashSet,其实,在分析完HashMap与LinkedHashMap之后,再来分析HashSet ...
- SpringMVC关于json、xml自动转换的原理研究[附带源码分析 --转
SpringMVC关于json.xml自动转换的原理研究[附带源码分析] 原文地址:http://www.cnblogs.com/fangjian0423/p/springMVC-xml-json-c ...
- 【集合框架】JDK1.8源码分析之ArrayList详解(一)
[集合框架]JDK1.8源码分析之ArrayList详解(一) 一. 从ArrayList字表面推测 ArrayList类的命名是由Array和List单词组合而成,Array的中文意思是数组,Lis ...
随机推荐
- Java之反射 — 用法及原理
Java之反射 - 用法及原理 定义 Java反射机制是在运行状态中,对于任意一个类,都能够知道这个类的所有属性和方法:对于任意一个对象,都能够调用它的任意方法和属性:这种动态获取信息以及动态调用对象 ...
- 038、Java中逻辑运算之非运算“!”
01.代码如下: package TIANPAN; /** * 此处为文档注释 * * @author 田攀 微信382477247 */ public class TestDemo { public ...
- lpwizard 生成的 allegro 封装中 .psx 文件使用方法。
lpwizard 有时候生成 allegro 封装的时候会生成 .psx 文件,这个文件其实是脚本文件,用于某些特殊形状焊盘的处理. 具体的使用方法如下: 在Allegro中,选择 File > ...
- 调用dos
两个方法 function RunDosCommand(Command: string): string; var hReadPipe: THandle; hWritePipe: THandle; S ...
- C# Winform使用线程,委托定时更新界面UI控件,解决界面卡顿问题(转载)
一.定时执行主界面控件值 1.利用定时器 Thread t = null; private void InitTSJK() { t = new Thread(new ThreadStart(GetDa ...
- NIFI
Apache nifi 第一篇(概述) Apache nifi 第二篇(小白初试) nifi数据对接流程初次尝试 NIFI ExecuteSQL配置教程(1.8) Processor(处理器)之配置 ...
- c#查看本机网络端口和对应的程序名
360安全卫士里面有个组件叫流量防火墙,感觉挺好用,但是不想安装360全家桶,于是自己捣鼓着用C#写一个比较简化的版本. 查看电脑上开启的TCP或UDP端口,可以用netstat命令,netstat用 ...
- .Net 笔记
1.介绍 .net一般指.Net Framework框架.一种平台,一种技术. C#是一种编程语言,可以开发基于.net平台的应用. .Net Framework是框架是.Net平台不可缺少的一部分, ...
- gitolite服务器配置的一些心得
1.假设说有服务器1,hostname为lab1,服务器2,hostname为lab2,分别生成的给对方使用的公钥为server-lab1.pub.server-lab2.pub,服务器1和2都有自己 ...
- Centos 时间与主机时间不匹配问题解决
有时候新安装的虚拟机的系统时间会和主机的时间差8个小时,这是因为虚拟机和主机所在的时区不同. 这会导致当你往mysql数据库插入数据时如果设置时间为current_time结果会和虚拟机保持一致. 1 ...