[java源码解析]对HashMap源码的分析（二）

上文我们讲了HashMap那骚骚的逻辑结构，这一篇我们来吹吹它的实现思想，也就是算法层面。有兴趣看下或者回顾上一篇HashMap逻辑层面的，可以看下HashMap源码解析（一）。
使用了哈希表得“拉链法”.

我打算按这个顺序来讲HashMap：几个关键属性 -> 构造方法-> 存取元素方法 ->解决hash冲突方法->HashMap扩容问题。

4个关键属性：

  /**

     *HashMap的存储大小

     */

    transient int size;

    /**

     * HashMap的大小临界值，如果达到这个值就需要重新分配大小

     */

    int threshold;

    /**

     * 负载因子(默认值一般是0.75)，哈希表在其容量自动增加之前可以达到多满的一种尺度。

     *当哈希表中的条目数超出了 负载因子与当前容量的乘积时，

     *则要对该哈希表进行 rehash 操作（即重建内部数据结构），从而哈希表将具有大约两倍的桶数。

     *负载因子过高虽然减少了空间开销，但同时也增加了查询成本

     *    static final float DEFAULT_LOAD_FACTOR = 0.75f;

     * @serial

     */

    final float loadFactor;

    /**

     * HashMap修改总数（修改数+删除数）

     */

    transient int modCount;

构造方法：

   /**对四个构造函数的简单描述 **/

    // 默认构造函数

    public HashMap();

    // 指定“容量大小”的构造函数

    public HashMap(int initialCapacity);

    //  指定“容量大小”和“负载因子’‘的构造函数

    public HashMap(int initialCapacity, float loadFactor) ;

    // 包含”子Map的构造函数’

    public HashMap(Map<? extends K, ? extends V> m);

详细描述：

  *默认构造

     *使用默认负载因子DEFAULT_LOAD_FACTOR（0.75）以及

     *默认容量大小  DEFAULT_INITIAL_CAPACITY

     */

    public HashMap() {

        this(DEFAULT_INITIAL_CAPACITY, DEFAULT_LOAD_FACTOR);

    }

    /**

     *指定负载因子以及容量大小构造函数（前三个构造函数以这个构造函数为核心对‘容量大小’和‘负载因子’进行不同的赋值，来达到不同构造函数的效果)

     * @param  initialCapacity the initial capacity 容量大小

     * @param  loadFactor      the load factor 负载因子值

     * @throws IllegalArgumentException if the initial capacity is negative

     * or the load factor is nonpositive

     */

    public HashMap(int initialCapacity, float loadFactor) {

        // 容量大小不能小于0

        if (initialCapacity < 0)

            throw new IllegalArgumentException("Illegal initial capacity: " +

                                               initialCapacity);

        //HashMap最大容量不能超过MAXIMUM_CAPACITY

        if (initialCapacity > MAXIMUM_CAPACITY)

            initialCapacity = MAXIMUM_CAPACITY;

        if (loadFactor <= 0 || Float.isNaN(loadFactor))

            throw new IllegalArgumentException("Illegal load factor: " +

                                               loadFactor);

        this.loadFactor = loadFactor;

        threshold = initialCapacity;

        init();

    }

    /** 包含子Map的构造函数

     * 主要对通过对子Map的容量大小的处理给本HashMap的容量大小赋值

     *以及clone子Map给本HashMap

     */

    public HashMap(Map<? extends K, ? extends V> m) {

        //子Map的条目数/负载因子+1会大致等于子 Map的容量大小，通过比较当前子Map的容量大小和

        //默认容易大小对比，找出最大的那个作为该HashMap的容量大小

        this(Math.max((int) (m.size() / DEFAULT_LOAD_FACTOR) + 1,

                      DEFAULT_INITIAL_CAPACITY), DEFAULT_LOAD_FACTOR);

        //不让容量大小超过MAXIMUM_CAPACITY ，让容量大小一直保持为2的幂次方

        inflateTable(threshold);

        //将子Map的元素全部添加到本HashMap中。

        putAllForCreate(m);

    }

HashMap的存取方法：

　　既然是线性数组，为什么能随机存取？这里HashMap用了一个小算法，大致是这样实现：

　　// 存储时:
　　int hash = key.hashCode(); // 这个hashCode方法这里不详述,只要理解每个key的hash是一个固定的int值
　　int index = hash % Entry[].length;
　　Entry[index] = value;

　　// 取值时:
　　int hash = key.hashCode();
　　int index = hash % Entry[].length;
　　return Entry[index];

一些工具方法的解析：

  /**

     *计算hash值

     */

    final int hash(Object k) {

        //hashSeed表示一个与当前实例关联并且可以减少哈希碰撞概率应用于键的哈希码计算的随机种子。

        int h = hashSeed;

        if (0 != h && k instanceof String) {

            return sun.misc.Hashing.stringHash32((String) k);

        }

        //对h和键的哈希码进行‘异或’并赋值运算

        h ^= k.hashCode();

        //h右移20位 异或 h右移12位  ，下一行同理。运算过程看下图2

        h ^= (h >>> 20) ^ (h >>> 12);

        return h ^ (h >>> 7) ^ (h >>> 4);

    }

    /**返回索引值

     * @param  h 通过hash(Object k)方法计算得来的哈希码

     * @param  length     表示桶的数量（即数组的长度）

     *

     */

    static int indexFor(int h, int length) {

        // assert Integer.bitCount(length) == 1 : "length must be a non-zero power of 2";

        // 将哈希码和length进行按位与运算

        return h & (length-1);

    }

图2：

取元素：

//通过key获取value

public V get(Object key) {

        如果key为null，则返回null键的值

        if (key == null)

            return getForNullKey();

        //获取键为key的实体类

        Entry<K,V> entry = getEntry(key);

        return null == entry ? null : entry.getValue();

    }

    /**

     * 根据键找到对应的实体类

     * 实现思路：①：通过计算key的hash值，用indexFor(key，table.length)获取所在数组位置的下标。

     *          ②：通过寻找处于该下标位置链表”上查找“键值等于key”的元素。

     */

    final Entry<K,V> getEntry(Object key) {

        if (size == 0) {

            return null;

        }

        //计算key的hash值

        int hash = (key == null) ? 0 : hash(key);

        for (Entry<K,V> e = table[indexFor(hash, table.length)];

             e != null;

             e = e.next) {

            Object k;

            if (e.hash == hash &&

                ((k = e.key) == key || (key != null && key.equals(k))))

                return e;

        }

        //找不到则返回null

        return null;

    }

    /**

     * 获取null键的值

     */

    private V getForNullKey() {

        if (size == 0) {

            return null;

        }

        //null键一般在table下标为0的位置

        for (Entry<K,V> e = table[0]; e != null; e = e.next) {

            if (e.key == null)

                return e.value;

        }

        return null;

    }

存元素：

   /**往HashMap存储元素

     *

     * @param key 键

     * @param value 值

     * @return

     *

     */

    public V put(K key, V value) {

        //防止table的容量为0；

        if (table == EMPTY_TABLE) {

            inflateTable(threshold);

        }

        //如果key为null，则判断该hashMap的null键是否有值，

        //如果有，则将这个新value存入覆盖老的value，返回老的value

        if (key == null)

            return putForNullKey(value);

        //计算key的哈希值

        int hash = hash(key);

        //通过key的哈希值以及数组的长度计算索引

        int i = indexFor(hash, table.length);

        找到数组此索引下的链表，一个一个得找，看有没有找到键值==该key的元素

        for (Entry<K,V> e = table[i]; e != null; e = e.next) {

            Object k;

            //如果有，则用新value覆盖老的value  oldValue，并返回oldValue;

            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {

                V oldValue = e.value;

                e.value = value;

                e.recordAccess(this);

                return oldValue;

            }

        }

        //如果没有，则modCount++，并添加新元素

        modCount++;

        //添加新元素，具体实现思路，看下面该函数得定义

        addEntry(hash, key, value, i);

        return null;

    }

    /**

      * 新增Entry

     */

    void addEntry(int hash, K key, V value, int bucketIndex) {

        //如果size比临界值大，而且该下标元素不为空，则对HashMap进行扩容，然后新增一个Entry实例

        if ((size >= threshold) && (null != table[bucketIndex])) {

            resize(2 * table.length);

            hash = (null != key) ? hash(key) : 0;

            bucketIndex = indexFor(hash, table.length);

        }

        createEntry(hash, key, value, bucketIndex);

    }

    /**

     *

     *新增一个Entry实例，并将该实例得next指向原来得table[bucketIndex];

     */

    void createEntry(int hash, K key, V value, int bucketIndex) {

        // 设置“e”为“新Entry的下一个节点”

        Entry<K,V> e = table[bucketIndex];

        table[bucketIndex] = new Entry<>(hash, key, value, e);

        size++;

    }

解决hash冲突方法：下面只具体讲了拉链法，其它有兴趣可自行了解~

开放定址法（线性探测再散列，二次探测再散列，伪随机探测再散列）
再哈希法
链地址法：就是在冲突的位置上简历一个链表，然后将冲突的元素插入到链表尾端。
建立一个公共溢出区

HashMap扩容：resize方法

  /** 重新调整HashMap中桶的数量

     *

     *通过判断新容量大小值，

     *如果 oldCapacity 超过Entty数量的最大值，则将Integer.MAX_VALUE赋给临界值（阀值），

     *直接返回不进行扩容（这样以后都不会扩容）

     *如果 oldCapacity 不超过Entty数量的最大值，则创建一个新的数组，将数据转移到新的数组里

     *并重新修改阀值

     * @param newCapacity the new capacity, 新容量大小值

     */

    void resize(int newCapacity) {

        //引用扩容前的Entry数组

        Entry[] oldTable = table;

        int oldCapacity = oldTable.length;

        // 扩容前的数组大小如果已经达到最大(2^30)了

        if (oldCapacity == MAXIMUM_CAPACITY) {

            //修改阈值为int的最大值(2^31-1)，这样以后就不会扩容了

            threshold = Integer.MAX_VALUE;

            return;

        }

        Entry[] newTable = new Entry[newCapacity];

        //将原有Entry数组的元素拷贝到新的Entry数组里

        transfer(newTable, initHashSeedAsNeeded(newCapacity));

        //HashMap的table属性引用新的Entry数组

        table = newTable;

        //修改阈值

        threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);

    }

    /**

     * 将原有Entry数组的元素拷贝到新的Entry数组里

     */

    void transfer(Entry[] newTable, boolean rehash) {

        int newCapacity = newTable.length;

        for (Entry<K,V> e : table) {

            while(null != e) {

                Entry<K,V> next = e.next;

                if (rehash) {

                    e.hash = null == e.key ? 0 : hash(e.key);

                }

                //重新计算每个元素在数组中的位置

                int i = indexFor(e.hash, newCapacity);

                //标记[1]

                e.next = newTable[i];

                //将元素放在数组上

                newTable[i] = e;

                ////访问下一个Entry链上的元素

                e = next;

            }

        }

    }

这是对HashMap的实现思路的基本分析。HashMap能讲的太多了。比如*线程，遍历迭代，红黑树*......每一部分都能独立开篇来讲。以后有机会出

以上是本人对HashMap的一点理解，有什么理解不当欢迎指出~

[java源码解析]对HashMap源码的分析（二）的更多相关文章

源码解析之HashMap源码
关于HashMap的源码分析,网上已经有很多写的非常好的文章了,虽然多是基于java1.8版本以下的.Java1.8版本的HashMap源码做了些改进,理解起来更复杂点,但也不脱离其桶+链表或树的重心 ...
[java源码解析]对HashMap源码的分析（一）
最近有空的时候研究了下HashMap的源码,平时我用HashMap主要拿来当业务数据整理后的容器,一直觉得它比较灵活和好用, 这样的便利性跟它的组成结构有很大的关系. 直接开门见山,先简要说明一下H ...
springboot源码解析-管中窥豹系列之BeanPostProcessor（十二）
一.前言 Springboot源码解析是一件大工程,逐行逐句的去研究代码,会很枯燥,也不容易坚持下去. 我们不追求大而全,而是试着每次去研究一个小知识点,最终聚沙成塔,这就是我们的springboot ...
Java集合类源码解析：HashMap (基于JDK1.8)
目录前言 HashMap的数据结构深入源码两个参数成员变量四个构造方法插入数据的方法:put() 哈希函数:hash() 动态扩容:resize() 节点树化.红黑树的拆分节点树化红黑 ...
JAVA常用集合源码解析系列-ArrayList源码解析（基于JDK8）
文章系作者原创,如有转载请注明出处,如有雷同,那就雷同吧~(who care!) 一.写在前面这是源码分析计划的第一篇,博主准备把一些常用的集合源码过一遍,比如:ArrayList.HashMap及 ...
深入理解JAVA集合系列一：HashMap源码解读
初认HashMap 基于哈希表(即散列表)的Map接口的实现,此实现提供所有可选的映射操作,并允许使用null值和null键. HashMap继承于AbstractMap,实现了Map.Cloneab ...
转：【Java集合源码剖析】HashMap源码剖析
转载请注明出处:http://blog.csdn.net/ns_code/article/details/36034955 您好,我正在参加CSDN博文大赛,如果您喜欢我的文章,希望您能帮我投一票 ...
【Java集合源码剖析】HashMap源码剖析
转载出处:http://blog.csdn.net/ns_code/article/details/36034955 HashMap简介 HashMap是基于哈希表实现的,每一个元素是一个key-va ...
jdk1.8源码解析：HashMap底层数据结构之链表转红黑树的具体时机
本文从三个部分去探究HashMap的链表转红黑树的具体时机: 一.从HashMap中有关“链表转红黑树”阈值的声明: 二.[重点]解析HashMap.put(K key, V value)的源码: 三 ...

随机推荐

疑难杂症--已停止运行DBCC造成阻塞
场景数据库因非法断电导致出现分配页上不一致,运行完DBCC CHECKDB后出现以下错误: 表错误: 表 't_pc_id' (ID 277576027).数据行在索引 'last_login_dat ...
RobotFramework做接口自动化（post请求）
接口成功时返回: { "reCorde": "SUCCESS", "data": { ", "verify": ...
EF：无法检查模型兼容性，因为数据库不包含模型元数据。
Model compatibility cannot be checked because the database does not contain model metadata. Model ...
“全栈2019”Java第七十一章：外部类访问静态内部类成员详解
难度初级学习时间 10分钟适合人群零基础开发语言 Java 开发环境 JDK v11 IntelliJ IDEA v2018.3 文章原文链接 "全栈2019"Java第 ...
jquery源码解析：proxy，access，swap，isArraylike详解
jQuery的工具方法,其实就是静态方法,源码里面就是通过extend方法,把这些工具方法添加给jQuery构造函数的. jQuery.extend({ ...... guid: 1, //唯一标识符 ...
如何实现 Python 中 selnium 模块的换行
如何实现 Python 中 selnium 模块的换行三种方法: 直接调用 .submit() 方法,常使用在用户密码登录中 # driver.find_element_by_xpath('//*[ ...
基于KMP与Levenshtein模糊匹配算法的银行联行号查询
在人民银行那里,每个银行的每一个营业网点都有自己唯一的银行联行号,根据这个号码能快速定位一间银行具体的分支行,就像根据一个身份证号码能快速确定一个人一样.例如汇款时,汇款单上要求填写收款人开户行,然后 ...
leetcode-788-Rotated Digits（使用vector替代if else的逐个判断）
题目描述: X is a good number if after rotating each digit individually by 180 degrees, we get a valid nu ...
906 AlvinZH的奇幻猜想----整数乘积（背包DP大作战O）
906 AlvinZH的奇幻猜想----整数乘积思路难题.动态规划. 将数字串按字符串输入,处理起来更方便些. dp[i][j]:表示str[0~i]中插入j个乘号时的乘积最大值.状态转移方程为: ...
MySql安装错误代码1045的解决方案
1.MySql安装错误代码1045的解决方案 2.root密码忘记1045的解决方案错误代码 1045 Access denied for user 'root'@'localhost' (usin ...

[java源码解析]对HashMap源码的分析（二）

[java源码解析]对HashMap源码的分析（二）的更多相关文章

随机推荐

热门专题