基于JDK1.7 HashMap源码分析

概述

HashMap是存放键值对的集合，数据结构如下：

table被称为桶，大小（capacity）始终为2的幂，当发生扩容时，map容量扩大为两倍
HashMap采用拉链法解决Hash冲突，发生冲突时，新元素采用头插法插入到对应桶的链表中

HashMap有几个重要字段：

size：HashMap键值对的数量
capacity：桶数量，即table.length，默认16
loadFactor：负载因子，度量负载程度，基于时间和空间的权衡，默认0.75
threshold：阈值，当size>=threshold将发生扩容，threshold=capacity * loadFactor。

JDK1.7 源码分析

属性

    /**

     * 默认初始容量 （必须是2的幂）

     */

    static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16

    /**

     * 最大容量

     */

    static final int MAXIMUM_CAPACITY = 1 << 30;

    /**

     * 默认负载因子

     */

    static final float DEFAULT_LOAD_FACTOR = 0.75f;

    /**

     * 空表

     */

    static final Entry<?,?>[] EMPTY_TABLE = {};

    /**

     * hash table

     */

    transient Entry<K,V>[] table = (Entry<K,V>[]) EMPTY_TABLE;

    /**

     * 键值对数目

     */

    transient int size;

    /**

     * 阈值 (等于capacity * load factor).

     */

    int threshold;

    /**

     * 负载因子

     */

    final float loadFactor;

    /**

     * HashMap 结构性变化次数

     * 用于快速失败

     */

    transient int modCount;

    static final int ALTERNATIVE_HASHING_THRESHOLD_DEFAULT = Integer.MAX_VALUE;

构造函数

    /**

     * 构造函数

     */

    public HashMap(int initialCapacity, float loadFactor) {

        if (initialCapacity < 0)

            throw new IllegalArgumentException("Illegal initial capacity: " +

                    initialCapacity);

        if (initialCapacity > MAXIMUM_CAPACITY)

            initialCapacity = MAXIMUM_CAPACITY;

        if (loadFactor <= 0 || Float.isNaN(loadFactor))

            throw new IllegalArgumentException("Illegal load factor: " +

                    loadFactor);

        this.loadFactor = loadFactor;

        threshold = initialCapacity;

        init();

    }

    /**

     * 构造函数，默认负载因子

     */

    public HashMap(int initialCapacity) {

        this(initialCapacity, DEFAULT_LOAD_FACTOR);

    }

    /**

     * 构造函数，默认初始容量和负载因子

     */

    public HashMap() {

        this(DEFAULT_INITIAL_CAPACITY, DEFAULT_LOAD_FACTOR);

    }

    /**

     * 构造函数，通过map构造

     */

    public HashMap(Map<? extends K, ? extends V> m) {

        this(Math.max((int) (m.size() / DEFAULT_LOAD_FACTOR) + 1,

                DEFAULT_INITIAL_CAPACITY), DEFAULT_LOAD_FACTOR);

        //初始化table

        inflateTable(threshold);

        //赋值到新map

        putAllForCreate(m);

    }

Hash函数

Hash函数是获取对象处理后的hash值，为了让hash值散列更加均匀，减少碰撞，

扰动函数（Hash函数）对hashCode进行一些位运算。

   /**

     * 扰动函数（减少碰撞几率）

     */

    final int hash(Object k) {

        int h = hashSeed;

        if (0 != h && k instanceof String) {

            return sun.misc.Hashing.stringHash32((String) k);

        }

        h ^= k.hashCode();

        // This function ensures that hashCodes that differ only by

        // constant multiples at each bit position have a bounded

        // number of collisions (approximately 8 at default load factor).

        h ^= (h >>> 20) ^ (h >>> 12);

        return h ^ (h >>> 7) ^ (h >>> 4);

    }

确定桶下标

确定桶下标的常用方式：hash % table.length，为了提高运行效率，

用位运算替代模运算。

能够这样做的前提，table.length必须是2的幂，这也是table的长度始终是2的幂的原因之一。

    /**

     * 确定桶下标

     */

    static int indexFor(int h, int length) {

        // length必须是2的幂

        return h & (length-1);

    }

Put操作

put

注意HashMap的值比较方法：e.hash == hash && ((k = e.key) == key || key.equals(k))

 public V put(K key, V value) {

        //空数组，则分配内存空间（延迟初始化）

        if (table == EMPTY_TABLE) {

            inflateTable(threshold);

        }

        //null键处理

        if (key == null)

            return putForNullKey(value);

        int hash = hash(key);

        int i = indexFor(hash, table.length);

        //若key已经存在，则替换

        for (Entry<K,V> e = table[i]; e != null; e = e.next) {

            Object k;

            //比较值是否相同

            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {

                V oldValue = e.value;

                e.value = value;

                e.recordAccess(this);

                return oldValue;

            }

        }

        //key不存在，则新增

        modCount++;

        addEntry(hash, key, value, i);

        return null;

    }

inflateTable

HashMap的空间分配不是在构造函数中完成的，而是采用延迟初始化的方式，当第一个元素put时，才会进行空间分配。

 private void inflateTable(int toSize) {

        // Find a power of 2 >= toSize

        int capacity = roundUpToPowerOf2(toSize);

        threshold = (int) Math.min(capacity * loadFactor, MAXIMUM_CAPACITY + 1);

        //分配空间

        table = new Entry[capacity];

        initHashSeedAsNeeded(capacity);

    }

putForNullKey

HashMap与HashTable的区别其中一点便是，前者key value都可以为null，后者都不能为null。

为null的键存放在table[0]中，即第一个桶。

    /**

     * null键插入

     */

    private V putForNullKey(V value) {

        /**

         * null键存放在table[0]中（table[0]中不全是null键）

         */

        for (Entry<K,V> e = table[0]; e != null; e = e.next) {

            if (e.key == null) {

                V oldValue = e.value;

                e.value = value;

                e.recordAccess(this);

                return oldValue;

            }

        }

        //计数增加

        modCount++;

        //添加Entry

        addEntry(0, null, value, 0);

        return null;

    }

扩容

当向HashMap添加一个不存在的key时（即size将增大），添加之前扩容检查。

扩容触发条件为：数量达到阈值并且发生Hash冲突。

扩容本质上，新建一个数组，使用头插法将旧map的元素拷贝到新map中。

addEntry

添加键值对时，检验是否需要扩容。扩容的条件：数量达到阈值并且发生Hash冲突

    /**

     * 添加Entry

     */

    void addEntry(int hash, K key, V value, int bucketIndex) {

        //扩容条件：size大于阈值并且发生碰撞

        if ((size >= threshold) && (null != table[bucketIndex])) {

            //容量扩为2倍

            resize(2 * table.length);

            hash = (null != key) ? hash(key) : 0;

            //确定新桶下标

            bucketIndex = indexFor(hash, table.length);

        }

        createEntry(hash, key, value, bucketIndex);

    }

resize

当扩容时：

容量已经达到最大值，仅调整阈值
容量未达到最大值，扩大table空间，并将旧map数据添加到新map中

    void resize(int newCapacity) {

        Entry[] oldTable = table;

        int oldCapacity = oldTable.length;

        if (oldCapacity == MAXIMUM_CAPACITY) {

            //当容量达到最大时，仅调整阈值

            threshold = Integer.MAX_VALUE;

            return;

        }

        //扩容

        Entry[] newTable = new Entry[newCapacity];

        //数据复制

        transfer(newTable, initHashSeedAsNeeded(newCapacity));

        table = newTable;

        threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);

    }

transfer

实际上，扩容本质是新建一个数组，然后在把数据复制过去，复制过程中，元素需要重新定位桶标

所以，多次扩容对性能影响很大

    void transfer(Entry[] newTable, boolean rehash) {

        int newCapacity = newTable.length;

        for (Entry<K,V> e : table) {

            while(null != e) {

                Entry<K,V> next = e.next;

                if (rehash) {

                    e.hash = null == e.key ? 0 : hash(e.key);

                }

                int i = indexFor(e.hash, newCapacity);

                e.next = newTable[i];

                newTable[i] = e;

                e = next;

            }

        }

    }

createEntry

从Entry的构造函数中next = n;可以看出元素插入链表使用的头插法。

    void createEntry(int hash, K key, V value, int bucketIndex) {

        //table下标中第一个元素

        Entry<K,V> e = table[bucketIndex];

        /**

         * 构造方法中 next = e; 可见 使用的头插法插入到链表中

         */

        table[bucketIndex] = new Entry<>(hash, key, value, e);

        size++;

    }

    Entry(int h, K k, V v, Entry<K,V> n) {

            value = v;

            next = n;

            key = k;

            hash = h;

        }

get操作

    /**

     * 获取值

     * 返回null有两种可能：1.不存在对应的键值对；2.存在key,但值为null

     * 可以通过 {@link #containsKey containsKey} 进行区分

     */

    public V get(Object key) {

        if (key == null)

            //获取key为null的值

            return getForNullKey();

        Entry<K,V> entry = getEntry(key);

        return null == entry ? null : entry.getValue();

    }

    private V getForNullKey() {

        if (size == 0) {

            return null;

        }

        //可见，null的key存放在table[0]中，即第一个桶中

        for (Entry<K,V> e = table[0]; e != null; e = e.next) {

            if (e.key == null)

                return e.value;

        }

        return null;

    }

     final Entry<K,V> getEntry(Object key) {

        if (size == 0) {

            return null;

        }

        int hash = (key == null) ? 0 : hash(key);

        //确定桶下标后，遍历链表

        for (Entry<K,V> e = table[indexFor(hash, table.length)];

             e != null;

             e = e.next) {

            Object k;

            //判断key是否相等。先比较的hash值，再比较的地址，最后比较equals

            if (e.hash == hash &&

                    ((k = e.key) == key || (key != null && key.equals(k))))

                return e;

        }

        return null;

    }

HashMap源码分析(一)的更多相关文章

【JAVA集合】HashMap源码分析（转载）
原文出处:http://www.cnblogs.com/chenpi/p/5280304.html 以下内容基于jdk1.7.0_79源码: 什么是HashMap 基于哈希表的一个Map接口实现,存储 ...
Java中HashMap源码分析
一.HashMap概述 HashMap基于哈希表的Map接口的实现.此实现提供所有可选的映射操作,并允许使用null值和null键.(除了不同步和允许使用null之外,HashMap类与Hashtab ...
JDK1.8 HashMap源码分析
一.HashMap概述在JDK1.8之前,HashMap采用数组+链表实现,即使用链表处理冲突,同一hash值的节点都存储在一个链表里.但是当位于一个桶中的元素较多,即hash值相等的元素较多时 ...
HashMap源码分析和应用实例的介绍
1.HashMap介绍 HashMap 是一个散列表,它存储的内容是键值对(key-value)映射.HashMap 继承于AbstractMap,实现了Map.Cloneable.java.io.S ...
【Java】HashMap源码分析——常用方法详解
上一篇介绍了HashMap的基本概念,这一篇着重介绍HasHMap中的一些常用方法:put()get()**resize()** 首先介绍resize()这个方法,在我看来这是HashMap中一个非常 ...
【Java】HashMap源码分析——基本概念
在JDK1.8后,对HashMap源码进行了更改,引入了红黑树.在这之前,HashMap实际上就是就是数组+链表的结构,由于HashMap是一张哈希表,其会产生哈希冲突,为了解决哈希冲突,HashMa ...
Java BAT大型公司面试必考技能视频-1.HashMap源码分析与实现
视频通过以下四个方面介绍了HASHMAP的内容一. 什么是HashMap Hash散列将一个任意的长度通过某种算法(Hash函数算法)转换成一个固定的值. MAP:地图 x,y 存储总结:通过HA ...
Java源码解析——集合框架（五）——HashMap源码分析
HashMap源码分析 HashMap的底层实现是面试中问到最多的,其原理也更加复杂,涉及的知识也越多,在项目中的使用也最多.因此清晰分析出其底层源码对于深刻理解其实现有重要的意义,jdk1.8之后其 ...
HashMap源码分析（史上最详细的源码分析）
HashMap简介 HashMap是开发中使用频率最高的用于映射(键值对 key value)处理的数据结构,我们经常把hashMap数据结构叫做散列链表: ObjectI entry<Key, ...
HashMap 源码分析基于jdk1.8分析
HashMap 源码分析基于jdk1.8分析 1:数据结构: transient Node<K,V>[] table; //这里维护了一个 Node的数组结构: 下面看看Node的数 ...

随机推荐

pt-query-digest使用详解
1.语法及重要选项pt-query-digest [OPTIONS] [FILES] [DSN] --create-review-table 当使用--review参数把分析结果输出到表中时,如果没有 ...
MongoDB 初始化数据同步
MongoDB初始化数据同步: 副本集中的成员启动之后,就会检查自身的状态,确定是否可以从某个成员那里进行同步.如果不行的话,尝试从其他成员那里进行完整的数据复制. 这个过程就是初始化同步(initi ...
在远程服务器上执行本地的shell脚本
在远程服务器上执行本地的shell脚本 [root@localhost zzx]# sh echoip.sh 192.168.67.131[root@localhost zzx]# ssh root@ ...
web安全（xss攻击和csrf攻击）
1.CSRF攻击: CSRF(Cross-site request forgery):跨站请求伪造. (1).攻击原理: 如上图,在B网站引诱用户访问A网站(用户之前登录过A网站,浏览器 cookie ...
InvalidOperationException: Cannot create a DbSet for 'IdentityUserClaim<string>' because this type is not included in the model for the context.
An unhandled exception occurred while processing the request. InvalidOperationException: Cannot crea ...
第一部分 JavaScript语言核心（二）
第四章表达式和运算符 P66 运算符优先级,从上到下: p68 属性访问表达式和调用表达式的优先级比运算符优先级都要高,eg: typeof my.functions[x](y) //typeof在 ...
kali下DNS劫持（9.28 第十四天）
DNS劫持环境: windows2008R2 被攻击者 kali 攻击者 1.在攻击者电脑中搭建web服务 2.在/var/www/html 写入html文件 index.htm ...
c++ opencv显示对话框
IplImage *pl = cvLoadImage("e:\\3.bmp", 1); cvNamedWindow("123", 1); cvShowImage ...
安装swoole redis异步 hiredis swoole扩展加载失败或者不显示问题解决办法
当前办法仅供参考贴上报错找了好久根据网上办法也试了没解决最后仔细读问题觉得可能是 hiredis路径问题终于解决了解决办法: 进入你的安装包目录然后执行下面 mkdir /usr/l ...
专题复习--背包问题+例题（HDU 2602 、POJ 2063、 POJ 1787、 UVA 674 、UVA 147）
*注虽然没什么人看我的博客但我还是要认认真真写给自己看背包问题应用场景给定 n 种物品和一个背包.物品 i 的重量是 w i ,其价值为 v i ,背包的容量为C.应该如何选择装入背包中的物品,使 ...

HashMap源码分析(一)