【Java基础】HashMap工作原理

HashMap

Hash table based implementation of the Map interface. This

implementation provides all of the optional map operations, and permits

null values and the null key. (The HashMap class is roughly equivalent

to Hashtable, except that it is unsynchronized and permits nulls.)

This class makes no guarantees as to the order of the map; in particular,

it does not guarantee that the order will remain constant over time.

官方文档描述信息：基于Map接口实现，键值都允许null，非线程同步的，不按插入顺序排，也不保证不随时间变化。

HashMap底层的数据结构实现是数组加链表，数组的每一项都是链。
构造函数

HashMap提供了四个构造函数：
- HashMap(int initialCapacity, float loadFactor)：构造一个带有指定容量和加载因子的空的HashMap。
- HashMap(int initialCapacity)：构造一个指定容量和默认加载因子为0.75的空的HashMap
- HashMap()：构造一个默认容量为16和默认加载因子为0.75的空的HashMap。
- HashMap(Map<? extends K, ? extends V> m)：构造一个匹配所有map中所有的元素并且加载因子是0.75的空HashMap。
初始容量和加载因子是影响HashMap性能的重要参数。
- 初始容量：创建哈希表时的容量(bucket)
- 加载因子：哈希表在其容量自动增加之前可以达到多满的一个尺度。
put()的实现

put()大致的思路：
1. 对key的hashCode()做hash，然后再计算index
2. 如果没碰到直接放到bucket里
3. 如果碰撞了，以链表的形式存在buckets后
4. 如果碰撞导致链表过长(大于等于TREEIFY_THRESHOLD)，就把链接表转换成红黑树
5. 如果节点已经存在就替换old value(保证key的唯一性)
6. 如果bucket满了(超过加载因子 * 当前容量)，就要resize

    public V put(K key, V value) {

        // 对key的hashCode()做hash()

        return putVal(hash(key), key, value, false, true);

    }

    final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) {

        Node<K,V>[] tab; Node<K,V> p; int n, i;

        // table为空则创建

        if ((tab = table) == null || (n = tab.length) == 0)

            n = (tab = resize()).length;

        // 计算index并做特殊处理

        if ((p = tab[i = (n - 1) & hash]) == null)

            tab[i] = newNode(hash, key, value, null);

        else {

            Node<K,V> e; K k;

            // 如果hash和key都相同

            if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k))))

                e = p;

            // 如果该链为树

            else if (p instanceof TreeNode)

                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);

            // 如果该链为链表

            else {

                for (int binCount = 0; ; ++binCount) {

                    if ((e = p.next) == null) {

                        p.next = newNode(hash, key, value, null);

                        // 如果链表的长度超过了这个阈值，

                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st

                            treeifyBin(tab, hash);

                        break;

                    }

                    if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k))))

                        break;

                    p = e;

                }

            }

            // 如果节点存在的话，就替换新值返回旧值

            if (e != null) { // existing mapping for key

                V oldValue = e.value;

                if (!onlyIfAbsent || oldValue == null)

                    e.value = value;

                afterNodeAccess(e);

                return oldValue;

            }

        }

        ++modCount;

        // 如果大小超过了 加载因子*当前容量，就进行扩容

        if (++size > threshold)

            resize();

        afterNodeInsertion(evict);

        return null;

    }

get()的实现

get()的大致思路：
1. bucket里的第一个节点，直接命中；
2. 如果有冲突，则通过key.equals(k)去查找对应的entry
  
  若为树，则在树中通过key.equals(k)查找
  
  若为链表，则在链表中通过key.equals(k)查找

    public V get(Object key) {

        Node<K,V> e;

        return (e = getNode(hash(key), key)) == null ? null : e.value;

    }

    final Node<K,V> getNode(int hash, Object key) {

        Node<K,V>[] tab; Node<K,V> first, e; int n; K k;

        // table不为空才进行以下操作，table为null的话直接返回null

        if ((tab = table) != null && (n = tab.length) > 0 && (first = tab[(n - 1) & hash]) != null) {

            // 直接命中

            if (first.hash == hash && // always check first node ((k = first.key) == key || (key != null && key.equals(k))))

                return first;

            if ((e = first.next) != null) {

                // 在树中命中

                if (first instanceof TreeNode)

                    return ((TreeNode<K,V>)first).getTreeNode(hash, key);

                // 在链表中命中

                do {

                    if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k))))

                        return e;

                } while ((e = e.next) != null);

            }

        }

        return null;

    }

hash()的实现

    static final int hash(Object key) {

        int h;

        // 使用key的hashCode进行hash计算

        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);

    }

这个函数的作用是：高16bit不变，低16bit和高16bit做了一个异或。

在计算下标的时候是这样实现的：

    tab[i = (n - 1) & hash] // 使用&操作，而非%操作

resize()的实现

当put时，当超过限制的时候会resize，然而又因为我们使用的2次幂的扩展(指长度扩展为原来的2倍)，所以，元素的位置要么是在原位置，要么是在原位置再移动2次幂的位置。
面试题
1. HashMap有什么特点？
  
  基于Map接口实现，存储键值对时，他可以接受null的键值，是非同步的，HashMap存储着Entry对象
2. 你知道HashMap的工作原理么？
  
  通过hash的方法，通过put和get存储获取对象。存储时，我们将k/v传给put方法时，通过获取k的hashCode并计算hash值从而获取到bucket的位置，进一步存储，HashMap会根据当前bucket的占用情况自动扩容(当超出加载因子 * 当前容量时扩容到当前容量的两倍)。获取对象时，我们将k传给get方法，通过获取k的hashCode并计算hash值获取到在bucket中的位置，并进一步调用获取equals()获取键值对。如果发生碰撞时，HashMap通过链表将产生碰撞冲突的元素组织起来，在Java8中，当一个bucket的存储容量超过某个限制(默认是8)时就会用红黑树来代替链表，从而提高速度。
3. 你知道get和put的原理么？equals()和hashCode都有什么用？
  
  通过对key的hashCode()进行hashing，通过(n - 1 & hash)计算下标，当发生碰撞时，则利用key.equals()方法去链表或者树中查找对应的键值对。
4. 你知道hash的实现么？为什么要这样的实现？
```
     (h = key.hashCode()) ^ (h >>> 16)
```
  这么做可以在bucket的n比较小的时候，也能保证考虑到高地bit都参与到hash的计算中，同时不会有太大的开销
5. 如果HashMap的大小超过了负载因子(load factor)定义的容量，怎么办？
  
  当超过了负载因子，会重新resize一个原来长度两倍的HashMap，并重新调用hash方法

参考文章：

【Java基础】HashMap工作原理的更多相关文章

Java HashMap工作原理及实现
Java HashMap工作原理及实现 2016/03/20 | 分类: 基础技术 | 0 条评论 | 标签: HASHMAP 分享到:3 原文出处: Yikun 1. 概述从本文你可以学习到: 什 ...
Java基础-hashMap原理剖析
Java基础-hashMap原理剖析作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.什么是哈希(Hash) 答:Hash就是散列,即把对象打散.举个例子,有100000条数 ...
HTTPS那些事用java实现HTTPS工作原理
HTTPS那些事用java实现HTTPS工作原理博客分类: java历险今天被问到关于https原理的问题,结果由于知识掌握不牢靠,停留于表面,很多细节都无法回答清楚,于是决定把https的 ...
详解Java GC的工作原理+Minor GC、FullGC
详解Java GC的工作原理+Minor GC.FullGC 引用地址:http://www.blogjava.net/ldwblog/archive/2013/07/24/401919.html J ...
java gc的工作原理、如何优化GC的性能、如何和GC进行有效的交互
java gc的工作原理.如何优化GC的性能.如何和GC进行有效的交互一个优秀的Java 程序员必须了解GC 的工作原理.如何优化GC的性能.如何和GC进行有效的交互,因为有一些应用程序对性能要求较 ...
Java Web程序工作原理
Web开发的最重要的基本功能是HTTP:Java Web开发的最重要的基本功是Servlet Specification.HTTP和Servlet Specitication对于Web Server和 ...
[翻译]Java HashMap工作原理
大部分Java开发者都在使用Map,特别是HashMap.HashMap是一种简单但强大的方式去存储和获取数据.但有多少开发者知道HashMap内部如何工作呢?几天前,我阅读了java.util.Ha ...
【转】Java HashMap工作原理（好文章）
大部分Java开发者都在使用Map,特别是HashMap.HashMap是一种简单但强大的方式去存储和获取数据.但有多少开发者知道HashMap内部如何工作呢?几天前,我阅读了java.util.Ha ...
Java HashMap工作原理及实现[转]
原文:http://yikun.github.io/2015/04/01/Java-HashMap%E5%B7%A5%E4%BD%9C%E5%8E%9F%E7%90%86%E5%8F%8A%E5%AE ...

随机推荐

HNU 13073 Ternarian Weights 解题报告
本题大意: 用天平对一物品进行称重,现有重量不同的砝码,砝码的重量分别为:1,3,9,27,..,3^n.(n<20) 天平的右侧放砝码,左侧放物品或物品和砝码,使得左右两边的重量相等. 现有一 ...
spark中数据的读取与保存
1.文本文件 (1)读取文本文件 JavaRDD<String> input =sc.textFile(dir) (2)保存文本文件 result.saveAsTextFile(dir)) ...
$(function(){})和$(document).ready(function(){}) 的区别
document.ready和onload的区别——JavaScript文档加载完成事件页面加载完成有两种事件一是ready,表示文档结构已经加载完成(不包含图片等非文字媒体文件) 二是onloa ...
PHP 一致性哈希算法的一种简单实现
在分布式系统中,如果某业务可以由多个相同的节点处理,很容易想到用HASH的方式将业务请求分散到这些节点处理,比如memecache缓存等分布式集群应用,如果只是简单的使用,不涉及用户用户状态等信息, ...
Promise基础
前言: ES2015将Promise引入语言规范,包括fetch等在内的API也构建在Promise之上.作为让js摆脱“回调地狱”的重要一环和众多框架中的重要基础设施之一,学习如何自己实现一个Pro ...
easyUI panel组件
easyUI panel组件: 属性的使用: <!DOCTYPE html> <html lang="en"> <head> <meta ...
loadrunner controller：设置多个load generator
下面讲一下如何使用多台电脑进行负载测试. 1) 打开load generator,如图所示默认已添加了我们本地的Generator: 2) 点击"Add. ...
python中关于发邮件的示例
发送邮件示例代码如下: from WebUtils import ProperitiesLoad from email.mime.text import MIMEText from email.mim ...
[转载] ping和telnet的区别
转载自:http://www.cnblogs.com/Jtianlin/p/4045021.html windown7下打开telnet功能: 控制面板 --- > 程序(小图标下直接到[程序和 ...
SpringBoot 入门教程：集成mybatis，redis
SrpingBoot相较于传统的项目具有配置简单,能快速进行开发的特点,花更少的时间在各类配置文件上,更多时间在具体业务逻辑上. SPringBoot采用纯注解方式进行配置,不喜欢xml配置的同学得仔 ...

【Java基础】HashMap工作原理

【Java基础】HashMap工作原理的更多相关文章

随机推荐

热门专题