HashMap和ConcurrentHashMap的区别，HashMap的底层源码。

　　Hashmap本质是数组加链表。根据key取得hash值，然后计算出数组下标，如果多个key对应到同一个下标，就用链表串起来，新插入的在前面。

　　ConcurrentHashMap：在hashMap的基础上，ConcurrentHashMap将数据分为多个segment，默认16个（concurrency level），然后每次操作对一个segment加锁，避免多线程锁的几率，提高并发效率。

一、HashMap概述

　　HashMap基于哈希表的 Map 接口的实现。此实现提供所有可选的映射操作，并允许使用 null 值和 null 键。（除了不同步和允许使用 null 之外，HashMap 类与 Hashtable 大致相同。）此类不保证映射的顺序，特别是它不保证该顺序恒久不变。

　　值得注意的是HashMap不是线程安全的，如果想要线程安全的HashMap，可以通过Collections类的静态方法synchronizedMap获得线程安全的HashMap。

1  Map map = Collections.synchronizedMap(new HashMap());

二、HashMap的数据结构

　HashMap的底层主要是基于数组和链表来实现的，它之所以有相当快的查询速度主要是因为它是通过计算散列码来决定存储的位置，能够很快的计算出对象所存储的位置。HashMap中主要是通过key的hashCode来计算hash值的，只要hashCode相同，计算出来的hash值就一样。如果存储的对象对多了，就有可能不同的对象所算出来的hash值是相同的，这就出现了所谓的hash冲突。学过数据结构的同学都知道，解决hash冲突的方法有很多，HashMap底层是通过链表来解决hash冲突的。

从上图中可以看出，HashMap底层就是一个数组结构，数组中存放的是一个Entry对象，如果产生的hash冲突，也就是说要存储的那个位置上面已经存储了对象了，这时候该位置存储的就是一个链表了。我们看看HashMap中Entry类的代码：

 1 static class Entry<K,V> implements Map.Entry<K,V> {

 2         final K key;

 3         V value;

 4         Entry<K,V> next;

 5         final int hash;

 6

 7         /**

 8          * Creates new entry.

 9          */

10         Entry(int h, K k, V v, Entry<K,V> n) {

11             value = v;

12             next = n; //hash值冲突后存放在链表的下一个

13             key = k;

14             hash = h;

15         }

16

17         .........

18     }

HashMap其实就是一个Entry数组，Entry对象中包含了键和值，其中next也是一个Entry对象，它就是用来处理hash冲突的，形成一个链表。

三、HashMap源码分析

　　先看看HashMap类中的一些关键属性：

1 transient Entry[] table;//存储元素的实体数组

2

3 transient int size;//存放元素的个数

4

5 int threshold; //临界值   当实际大小超过临界值时，会进行扩容threshold = 加载因子*容量

6

7 final float loadFactor; //加载因子

8

9 transient int modCount;//被修改的次数

　其中加载因子是表示Hash表中元素的填满的程度.若:加载因子越大,填满的元素越多,好处是,空间利用率高了,但:冲突的机会加大了.反之,加载因子越小,填满的元素越少,
好处是:冲突的机会减小了,但:空间浪费多了.冲突的机会越大,则查找的成本越高.反之,查找的成本越小.因而,查找时间就越小.因此,必须在 "冲突的机会"与"空间利用率"之间寻找一种平衡与折衷. 这种平衡与折衷本质上是数据结构中有名的"时-空"矛盾的平衡与折衷.

　　如果机器内存足够，并且想要提高查询速度的话可以将加载因子设置小一点；相反如果机器内存紧张，并且对查询速度没有什么要求的话可以将加载因子设置大一点。不过一般我们都不用去设置它，让它取默认值0.75就好了。

　　下面看看HashMap的几个构造方法：

 1 public HashMap(int initialCapacity, float loadFactor) {

 2         //确保数字合法

 3         if (initialCapacity < 0)

 4             throw new IllegalArgumentException("Illegal initial capacity: " +

 5                                                initialCapacity);

 6         if (initialCapacity > MAXIMUM_CAPACITY)

 7             initialCapacity = MAXIMUM_CAPACITY;

 8         if (loadFactor <= 0 || Float.isNaN(loadFactor))

 9             throw new IllegalArgumentException("Illegal load factor: " +

10                                                loadFactor);

11

12         // Find a power of 2 >= initialCapacity

13         int capacity = 1;   //初始容量

14         while (capacity < initialCapacity)   //确保容量为2的n次幂，使capacity为大于initialCapacity的最小的2的n次幂

15             capacity <<= 1;

16

17         this.loadFactor = loadFactor;

18         threshold = (int)(capacity * loadFactor);

19         table = new Entry[capacity];

20         init();

21     }

22

23     public HashMap(int initialCapacity) {

24         this(initialCapacity, DEFAULT_LOAD_FACTOR);

25     }

26

27     public HashMap() {

28         this.loadFactor = DEFAULT_LOAD_FACTOR;

29         threshold = (int)(DEFAULT_INITIAL_CAPACITY * DEFAULT_LOAD_FACTOR);

30         table = new Entry[DEFAULT_INITIAL_CAPACITY];

31         init();

32     }

　　我们可以看到在构造HashMap的时候如果我们指定了加载因子和初始容量的话就调用第一个构造方法，否则的话就是用默认的。默认初始容量为16，默认加载因子为0.75。我们可以看到上面代码中13-15行，这段代码的作用是确保容量为2的n次幂，使capacity为大于initialCapacity的最小的2的n次幂，至于为什么要把容量设置为2的n次幂，我们等下再看。

　　下面看看HashMap存储数据的过程是怎样的，首先看看HashMap的put方法：

 1 public V put(K key, V value) {

 2         if (key == null) //如果键为null的话，调用putForNullKey(value)

 3             return putForNullKey(value);

 4         int hash = hash(key.hashCode());//根据键的hashCode计算hash码

 5         int i = indexFor(hash, table.length);

 6         for (Entry<K,V> e = table[i]; e != null; e = e.next) { //处理冲突的，如果hash值相同，则在该位置用链表存储

 7             Object k;

 8             if (e.hash == hash && ((k = e.key) == key || key.equals(k))) { //如果key相同则覆盖并返回旧值

 9                 V oldValue = e.value;

10                 e.value = value;

11                 e.recordAccess(this);

12                 return oldValue;

13             }

14         }

15

16         modCount++;

17         addEntry(hash, key, value, i);

18         return null;

19     }

当我们往hashmap中put元素的时候，先根据key的hash值得到这个元素在数组中的位置（即下标），然后就可以把这个元素放到对应的位置中了。如果这个元素所在的位子上已经存放有其他元素了，那么在同一个位子上的元素将以链表的形式存放，新加入的放在链头，最先加入的放在链尾。从hashmap中get元素时，首先计算key的hashcode，找到数组中对应位置的某一元素，然后通过key的equals方法在对应位置的链表中找到需要的元素。

具体的实现是：

当你的key为null时，会调用putForNullKey,HashMap允许key为null,这样的对像是放在table[0]中。

如果不为空，则调用int hash = hash(key.hashCode());这是hashmap的一个自定义的hash,在key.hashCode()基础上进行二次hash

1 static int hash(int h) {

2         h ^= (h >>> 20) ^ (h >>> 12);

3         return h ^ (h >>> 7) ^ (h >>> 4);

4   }

得到hash码之后就会通过hash码去计算出应该存储在数组中的索引，计算索引的函数如下：

1 static int indexFor(int h, int length) {

2        return h & (length-1);

3    }

　这个方法非常巧妙，它通过 h & (table.length -1) 来得到该对象的保存位，而HashMap底层数组的长度总是 2 的n 次方，这是HashMap在速度上的优化。当length总是 2 的n次方时，h& (length-1)运算等价于对length取模，也就是h%length，但是&比%具有更高的效率。当数组长度为2的n次幂的时候，不同的key算得得index相同的几率较小，那么数据在数组上分布就比较均匀，也就是说碰撞的几率小，相对的，查询的时候就不用遍历某个位置上的链表，这样查询效率也就较高了。

下面我们继续回到put方法里面，前面已经计算出索引的值了，看到第6到14行，如果数组中该索引的位置的链表已经存在key相同的对象，则将其覆盖掉并返回原先的值。如果没有与key相同的键，则调用addEntry方法创建一个Entry对象，addEntry方法如下：

1 void addEntry(int hash, K key, V value, int bucketIndex) {

2         Entry<K,V> e = table[bucketIndex]; //如果要加入的位置有值，将该位置原先的值设置为新entry的next,也就是新entry链表的下一个节点

3         table[bucketIndex] = new Entry<>(hash, key, value, e);

4         if (size++ >= threshold) //如果大于临界值就扩容

5             resize(2 * table.length); //以2的倍数扩容

6     }

参数bucketIndex就是indexFor函数计算出来的索引值，第2行代码是取得数组中索引为bucketIndex的Entry对象，第3行就是用hash、key、value构建一个新的Entry对象放到索引为bucketIndex的位置，并且将该位置原先的对象设置为新对象的next构成链表。

　　第4行和第5行就是判断put后size是否达到了临界值threshold，如果达到了临界值就要进行扩容，HashMap扩容是扩为原来的两倍。resize()方法如下：

 1 void resize(int newCapacity) {

 2         Entry[] oldTable = table;

 3         int oldCapacity = oldTable.length;

 4         if (oldCapacity == MAXIMUM_CAPACITY) {

 5             threshold = Integer.MAX_VALUE;

 6             return;

 7         }

 8

 9         Entry[] newTable = new Entry[newCapacity];

10         transfer(newTable);//用来将原先table的元素全部移到newTable里面

11         table = newTable;  //再将newTable赋值给table

12         threshold = (int)(newCapacity * loadFactor);//重新计算临界值

13     }

扩容是需要进行数组复制的，上面代码中第10行为复制数组，复制数组是非常消耗性能的操作，所以如果我们已经预知HashMap中元素的个数，那么预设元素的个数能够有效的提高HashMap的性能。

HashMap和ConcurrentHashMap的区别，HashMap的底层源码。的更多相关文章

Java泛型底层源码解析-ArrayList,LinkedList,HashSet和HashMap
声明:以下源代码使用的都是基于JDK1.8_112版本 1. ArrayList源码解析 <1. 集合中存放的依然是对象的引用而不是对象本身,且无法放置原生数据类型,我们需要使用原生数据类型的包 ...
List-LinkedList、set集合基础增强底层源码分析
List-LinkedList 作者 : Stanley 罗昊 [转载请注明出处和署名,谢谢!] 继上一章继续讲解,上章内容: List-ArreyLlist集合基础增强底层源码分析:https:// ...
从底层源码浅析Mybatis的SqlSessionFactory初始化过程
目录搭建源码环境 POM依赖测试SQL Mybatis全局配置文件 UserMapper接口 UserMapper配置 User实体 Main方法快速进入Debug跟踪源码分析准备源码分析 ...
总结HashSet以及分析部分底层源码
总结HashSet以及分析部分底层源码 1. HashSet继承的抽象类和实现的接口继承的抽象类:AbstractSet 实现了Set接口实现了Cloneable接口实现了Serializabl ...
全方位深度剖析PHP7底层源码(已完结)
第1章课程介绍本章主要介绍课程要讲的知识点,以及课程要求等. 第2章 PHP7的新特性本章主要介绍PHP7的新特性,做基准测试,与PHP5对比验证PHP7的性能提升程度,引出对PHP7源码学习的必要 ...
Android开发之漫漫长途 Ⅵ——图解Android事件分发机制（深入底层源码）
该文章是一个系列文章,是本人在Android开发的漫漫长途上的一点感想和记录,我会尽量按照先易后难的顺序进行编写该系列.该系列引用了<Android开发艺术探索>以及<深入理解And ...
为什么很多类甚者底层源码要implements Serializable ？
为什么很多类甚者底层源码要implements Serializable ? 在碰到异常类RuntimeException时,发现Throwable实现了 Serializable,还有我们平进的ja ...
List-ArrayList集合基础增强底层源码分析
List集合基础增强底层源码分析作者:Stanley 罗昊 [转载请注明出处和署名,谢谢!] 集合分为三个系列,分别为:List.set.map List系列特点:元素有序可重复有序指的是元素的 ...
2018.11.20 Struts2中对结果处理方式分析&struts2内置的方式底层源码剖析
介绍一下struts2内置帮我们封装好的处理结果方式也就是底层源码分析这是我们的jar包里面找的位置目录打开往下拉看到result-type节点 name那一列就是我们的type类型取值上一篇博 ...
BAT资深工程师由浅入深分析 Tp5&Tp6底层源码 - 分享
BAT资深工程师由浅入深分析Tp5&Tp6底层源码第1章课程简介本章主要让大家知道本套课程的主线, 导学内容,如何学习源码等,看完本章要让小伙伴觉得这个是必须要掌握的,并且对加薪有很大的 ...

随机推荐

linux 配置apache、mysql、php ——20150807
2015年8月7日一部分:mysql mysql 5.5.40安装第二部分:apache(apache要安装在php前面.apache和mysql可以随意顺序) 1. # tar zxvf htt ...
機器學習基石(Machine Learning Foundations) 机器学习基石作业四 Q13-20 MATLAB实现
大家好,我是Mac Jiang,今天和大家分享Coursera-NTU-機器學習基石(Machine Learning Foundations)-作业四 Q13-20的MATLAB实现. 曾经的代码都 ...
阿里云dataworks数据工场用户使用子账号
如果您是第一次使用子账号登录数加平台和使用DataWorks,您需要获知以下内容: 该子账号所属主账号的企业别名. 该子账号的用户名和密码. 该子账号的AccessKey ID和AccessKey S ...
如何在谷歌浏览器中查看Axure做的原型HTML
Axure RP Pro可谓是非常方便.好用的一款软件,因为它不仅能绘制出详细的产品构思,也能生成浏览器格式的产品原型.但如果想把原型拿给客户查看,需要看产品画的原型图时,但是打不开的话就悲剧了.经常 ...
RabbitMQ Performance Testing Tool 性能测试工具
RabbitMQ Performance Testing Tool 介绍:https://www.rabbitmq.com/java-tools.html RabbitMQ Performance T ...
android之ScrollView里嵌套ListView（转）
hi,大家好,研究完ScrollView嵌套ScrollView之后,本人突然又想研究ScrollView里嵌套ListView了. 如果还不知道ScrollView嵌套ScrollView是怎么实现 ...
Rational Rose2007具体安装步骤
学习了UML.那么Rational rose绘图软件当然就是不可缺少的了. 我的电脑是win7 64位的系统.以下的链接是安装软件以及破解方法.该软件是BIN格式的.也就是镜像文件.须要安装一个虚拟驱 ...
mysql select *... where id in (select 字符串 from ... )查询结果问题？
SQL中的写法为 ); 查询结果为: id TypeName 1 新手 2 手机在MYSQL中 ); 查询结果为: id TypeName 1 新手少了一条数据. 其中查询结果为 Newcard ...
Unity3d中使用自带动画系统制作下雨效果(二)
接着昨天的(一),今天上下雨效果的后半部分.在最后附上网盘链接,有使用的素材及本次的工程源文件,想看看的童鞋可以下载~~ 下雨效果分两部分:地上的涟漪和空中的雨滴.那么现在就开始,是使用unity3d ...
MAC与PHY连接的管理接口MDIO
MII Management interface用于MAC层或其他控制芯片(不一定是MAC层芯片,可能是MCU,如高通芯片建构中,1个MAC芯片可以控制2个PHY芯片,然后MCU控制3个网卡(MAC+ ...

HashMap和ConcurrentHashMap的区别，HashMap的底层源码。

HashMap和ConcurrentHashMap的区别，HashMap的底层源码。的更多相关文章

随机推荐

热门专题