java读源码之 map源码分析（HashMap，图解）一

开篇之前，先说几句题外话，写博客也一年多了，一直没找到一种好的输出方式，博客质量其实也不高，很多时候都是赶着写出来的，最近也思考了很多，以后的博客也会更注重质量，同时也尽量写的不那么生硬，能让大家在轻松的氛围中学习到知识才是最好的

好了，闲话不再多说，进入我们今天的主题，HashMap能说的东西太多了，不管是其数据接口，算法，还是单纯的源码分析，不过我们还是直接从源码入手，进而分析其数据结构及算法

通过本篇，你将了解以下问题：

1.HashMap的结构是什么？

2.HashMap的存储数据的逻辑是什么？

在分析之前，我们先要对HashMap的接口有一个大概的了解，这要可以帮我们更好的理解源码，然后通过源码的学习，我们又能对它所持有的数据接口有更深的理解，嗯？是不是很有道理？

HashMap实际上是一个散列表的数据结构，即数组和链表的结合体。这样的结构结合了链表在增删方面的高效和数组在寻址上的优势

如上所示，当我们添加一个元素到HashMap中时，首先经过一定算法，计算出该元素应该放到数组中哪个位置，如果在该位置上已经有元素了，就将其链接到元素的尾部，这样就形成了一个链表的结构。

HashMap的源码体积比较大，如果还按之前我们分析其他容易那种方法的话，实在不知道从何写起，所以这篇文章，我们从实际的例子出发，一步步深入进去了解HashMap

public class HashMain {

    public static void main(String[] args) {

        Map<String, String> map = new HashMap<>();

        map.put("1", "java");

        map.put("2", "c++");

        map.put("3", "c#");

        map.put("4", "python");

        map.put("5", "php");

        map.put("6", "js");

        System.out.println(map);

    }

}

我们打个断点看下：

可以看到，HashMap中存储元素的是它的一个内部类Node,我们一起来看下这到底是个什么玩意儿？

static class Node<K,V> implements Map.Entry<K,V> {

        // key对应的hash值

        final int hash;

        final K key;

        V value;

        // 通过next指针，保存了下个节点的元素，看到这个我们也能知道，

    	// 不同于LinkedList,这是个单向链表

        Node<K,V> next;

        Node(int hash, K key, V value, Node<K,V> next) {

            this.hash = hash;

            this.key = key;

            this.value = value;

            this.next = next;

        }

        public final K getKey()        { return key; }

        public final V getValue()      { return value; }

        public final String toString() { return key + "=" + value; }

    	// 通过键值的hash值进行异或操作得到这个Node的hashCode

        public final int hashCode() {

            return Objects.hashCode(key) ^ Objects.hashCode(value);

        }

        public final V setValue(V newValue) {

            V oldValue = value;

            value = newValue;

            return oldValue;

        }

    	// 必须要为 Map.Entry 且 key跟value都相等的时候才会返回true

        public final boolean equals(Object o) {

            if (o == this)

                return true;

            if (o instanceof Map.Entry) {

                Map.Entry<?,?> e = (Map.Entry<?,?>)o;

                if (Objects.equals(key, e.getKey()) &&

                    Objects.equals(value, e.getValue()))

                    return true;

            }

            return false;

        }

    }

我们可以看到Node接口实现， Map接口中的一个内部类Entry，我们继续看看Entry又是个什么东西呢？

interface Entry<K,V> {

        /**

         * 返回了这个Entry对应的key

         */

        K getKey();

        /**

         * 返回对应的value

         */

        V getValue();

        /**

         * 覆盖老的value值

         */

        V setValue(V value);

        boolean equals(Object o);

        int hashCode();

        /**

		 * 1.8新增的方法，返回一个采用自然排序比较key的比较器

         */

        public static <K extends Comparable<? super K>, V> Comparator<Map.Entry<K,V>> comparingByKey() {

            // 这个与操作代表了返回的这个比较器实现了Serializable接口，是可序列化的

            return (Comparator<Map.Entry<K, V>> & Serializable)

                (c1, c2) -> c1.getKey().compareTo(c2.getKey());

        }

      	/**

		 * 1.8新增的方法，返回一个采用自然排序比较value的比较器

         */

        public static <K, V extends Comparable<? super V>> Comparator<Map.Entry<K,V>> comparingByValue() {

            // 这个与操作代表了返回的这个比较器实现了Serializable接口，是可序列化的

            return (Comparator<Map.Entry<K, V>> & Serializable)

                (c1, c2) -> c1.getValue().compareTo(c2.getValue());

        }

        /**

		 * 1.8新增的方法，返回一个采用给定比较器比较key的比较器

         */

        public static <K, V> Comparator<Map.Entry<K, V>> comparingByKey(Comparator<? super K> cmp) {

            Objects.requireNonNull(cmp);

            return (Comparator<Map.Entry<K, V>> & Serializable)

                (c1, c2) -> cmp.compare(c1.getKey(), c2.getKey());

        }

       /**

		 * 1.8新增的方法，返回一个采用给定比较器比较value的比较器

         */

        public static <K, V> Comparator<Map.Entry<K, V>> comparingByValue(Comparator<? super V> cmp) {

            Objects.requireNonNull(cmp);

            return (Comparator<Map.Entry<K, V>> & Serializable)

                (c1, c2) -> cmp.compare(c1.getValue(), c2.getValue());

        }

    }

分析完Node之后，我们可以知道，Node就是我们之前所说的数组+链表中的“链表”，并且它还是一个单向的链表。

OK，为了更好的理解其数据结构，我们现在来分析它存入数据的方法，也就是put方法，看看一次数据的存储到底经过了什么？

// 将KV键值对存入map中，如果map中已经包含了这个key，那么value会被替换

public V put(K key, V value) {

    return putVal(hash(key), key, value, false, true);

}

	/**

     * @param key的hash值

     * @param key

     * @param value

     * @param onlyIfAbsent 如果为true的话，不去改变已经存在的value

     * @param evict 在HashMap中这个值没什么用，我们分析LinkedHashMap时会用到它

     * @return

     */

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,

                   boolean evict) {

        Node<K,V>[] tab; Node<K,V> p; int n, i;

    // 如果HashMap中的table尚未初始化或者长度为0，则将其进行扩容到初始长度

        if ((tab = table) == null || (n = tab.length) == 0)

            n = (tab = resize()).length;

    // 如果计算出新增节点的将要放入的位置上还没有被占用，就直接创建一个新的节点放入

        if ((p = tab[i = (n - 1) & hash]) == null)

            tab[i] = newNode(hash, key, value, null);

        else {

            Node<K,V> e; K k;

            // 如果位置已经被占用，但将要放入的元素key跟原本的元素相等

            if (p.hash == hash &&

                ((k = p.key) == key || (key != null && key.equals(k))))

                // 之后会根据onlyIfAbsent进行判断，如果为false的话，会对原节点的value直接进行覆盖

                e = p;

            else if (p instanceof TreeNode)

                // 如果是一个TreeNode，调用对应的方法，这个在之后的文章中再分析

                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);

            else {

                // 说明是一个Node

                for (int binCount = 0; ; ++binCount) {

                    if ((e = p.next) == null) {

                        // 链接到当前节点的尾部

                        p.next = newNode(hash, key, value, null);

                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st

                            // 如果长度过长，进行树化，这个在之后的文章分析，比较复杂

                            treeifyBin(tab, hash);

                        break;

                    }

                    // 在遍历过程中发现了跟已经存在的key相等的话，就直接break

                    if (e.hash == hash &&

                        ((k = e.key) == key || (key != null && key.equals(k))))

                        break;

                    p = e;

                }

            }

            if (e != null) { // existing mapping for key

                V oldValue = e.value;

                // 如果onlyIfAbsent为false，或者旧值为null的话，进行替换

                if (!onlyIfAbsent || oldValue == null)

                    e.value = value;

                afterNodeAccess(e);

                return oldValue;

            }

        }

        ++modCount;

        if (++size > threshold)

            resize();

        afterNodeInsertion(evict);

        return null;

    }

分析完后，我们总结下它的逻辑：

对key的hashCode()做一次散列（hash函数，具体内容下一篇讲解），然后根据这个散列值计算index（i = (n - 1) & hash）这个表达式我们再ArrayDequeue中已经介绍过了，相当于模运算
如果没有发生碰撞（哈希冲突），则直接放到数组中；
如果碰撞了，以链表的形式挂在数组对应的元素后；
如果因为碰撞导致链表过长(大于等于TREEIFY_THRESHOLD)，就把链表转换成红黑树；
如果节点已经存在就替换old value(保证key的唯一性)
如果数组中存储的元素达到了阈值(超过负载因子*当前容量)，就要resize（重新调整大小并重新散列）。

接下来，我们来分析它的get方法

public V get(Object key) {

    Node<K,V> e;

    // 通过key的hash值找到对应的Node节点，如果没有的话返回null,存在的话返回node节点的value

    return (e = getNode(hash(key), key)) == null ? null : e.value;

}

final Node<K,V> getNode(int hash, Object key) {

    Node<K,V>[] tab; Node<K,V> first, e; int n; K k;

    if ((tab = table) != null && (n = tab.length) > 0 &&

        (first = tab[(n - 1) & hash]) != null) {

        // 如果table已经完成了初始化，并且经过散列后的位置上的元素不为null的话

        if (first.hash == hash &&

            ((k = first.key) == key || (key != null && key.equals(k))))

            // 正好key的值跟散列后数组上对应位置的节点的key相等，直接返回这个节点

            return first;

        if ((e = first.next) != null) {

            // 如果是TreeNode，去树中查找

            if (first instanceof TreeNode)

                return ((TreeNode<K,V>)first).getTreeNode(hash, key);

            do {

                // 否则，遍历链接查找

                if (e.hash == hash &&

                    ((k = e.key) == key || (key != null && key.equals(k))))

                    return e;

            } while ((e = e.next) != null);

        }

    }

    return null;

}

我们也分析下获取元素时的逻辑：

根据传入key进行hash运算，将运算后的值跟数组长度进行模运算，得出这个key对应数组的位置
如果key的hash值正好等于数组上这个元素的key的hash值的话，直接返回数组上这个位置的元素
如果不相等，就在这个节点下挂的树或者链表中查询对应的key（有树或链表的情况下）
都不符合，返回null

这篇文章到这里就暂时结束啦~，HashMap比较难讲清楚，这篇文章也只是做一个开篇，能让大家对其大概有一个认设就是再好不过了，后续还会继续写HashMap，希望大家多多指教，动动小手点个赞啦

java读源码之 map源码分析（HashMap，图解）一的更多相关文章

Java 数据类型：集合接口Map：HashTable；HashMap；IdentityHashMap；LinkedHashMap；Properties类读取配置文件；SortedMap接口和TreeMap实现类：【线程安全的ConcurrentHashMap】
Map集合java.util.Map Map用于保存具有映射关系的数据,因此Map集合里保存着两个值,一个是用于保存Map里的key,另外一组值用于保存Map里的value.key和value都可以是 ...
java读源码之 map源码分析（HashMap）二
在上篇文章中,我已经向大家介绍了HashMap的一些基础结构,相信看过文章的同学们,应该对其有一个大致了了解了,这篇文章我们继续探究它的一些内部机制,包括构造函数,字段等等~ 字段分析: // 默 ...
Java并发指南10：Java 读写锁 ReentrantReadWriteLock 源码分析
Java 读写锁 ReentrantReadWriteLock 源码分析转自:https://www.javadoop.com/post/reentrant-read-write-lock#toc5 ...
Java读源码之ReentrantLock
前言 ReentrantLock 可重入锁,应该是除了 synchronized 关键字外用的最多的线程同步手段了,虽然JVM维护者疯狂优化 synchronized 使其已经拥有了很好的性能.但 R ...
Java读源码之ReentrantLock（2）
前言本文是 ReentrantLock 源码的第二篇,第一篇主要介绍了公平锁非公平锁正常的加锁解锁流程,虽然表达能力有限不知道有没有讲清楚,本着不太监的原则,本文填补下第一篇中挖的坑. Java读源 ...
Java读源码之CountDownLatch
前言相信大家都挺熟悉 CountDownLatch 的,顾名思义就是一个栅栏,其主要作用是多线程环境下,让多个线程在栅栏门口等待,所有线程到齐后,栅栏打开程序继续执行. 案例用一个最简单的案例引出 ...
源码分析— java读写锁ReentrantReadWriteLock
前言今天看Jraft的时候发现了很多地方都用到了读写锁,所以心血来潮想要分析以下读写锁是怎么实现的. 先上一个doc里面的例子: class CachedData { Object data; vo ...
给jdk写注释系列之jdk1.6容器(6)-HashSet源码解析&Map迭代器
今天的主角是HashSet,Set是什么东东,当然也是一种java容器了. 现在再看到Hash心底里有没有会心一笑呢,这里不再赘述hash的概念原理等一大堆东西了(不懂得需要先回去看下Has ...
转：微信开发之使用java获取签名signature（贴源码，附工程）
微信开发之使用java获取签名signature(贴源码,附工程) 标签: 微信signature获取签名 2015-12-29 22:15 6954人阅读评论(3) 收藏举报分类: 微信开发 ...

随机推荐

web中拖拽排序与java后台交互实现
一.业务需求 1,在后台的管理界面通过排序功能直接进入排序界面 2,在排序界面能够人工的手动拖动需要排序的标题,完成对应的排序之后提交 3,在app或者是前端就有对应的排序实现了二.页面展示将整体 ...
SpringBoot系列（六）集成thymeleaf详解版
SpringBoot系列(六)集成thymeleaf详解版 1. thymeleaf简介 1. Thymeleaf是适用于Web和独立环境的现代服务器端Java模板引擎. 2. Thymeleaf ...
Java创建线程的三种形式的区别以及优缺点
1.实现Runnable,Callable Callable接口里定义的方法有返回值,可以声明抛出异常. 继承Callable接口实现线程 class ThreadCall implements Ca ...
【Java】FlowControl 流程控制
FlowControl 流程控制什么是流程控制? 控制流程(也称为流程控制)是计算机运算领域的用语,意指在程序运行时,个别的指令(或是陈述.子程序)运行或求值的顺序. 不论是在声明式编程语言或是函数 ...
stand up meeting 1-4
放假归来第一天,组内成员全员到齐,满血复活. 今天主要对下边最后半个月的任务做了规划和分配. UI的优化部分在假期前静雯已经完成在了UI分支上,国庆会在这两天把UI设计的更新merge到master分 ...
漫画：工作这么多年，你居然不知道 Maven 中 Optional 和 Exclusions 的区别？
欢迎关注笔者的公众号: 小哈学Java, 专注于推送 Java 领域优质干货文章!! Maven 依赖排除(Exclusions) 因为 Maven 构建项目具有依赖可传递的特性,当你在 pom.xm ...
Laravel 上手增删改查
拿到一个框架,除了解框架,还要能实现基本的CURD操作. 添加 1.配置路由,指定添加页面: // routes/web.php 中增加如下: // 添加页面.存放路径 Laravel7/resour ...
8. react 常用组件
griddle-react react-bootstrap react-cropper core-js Material UI superagent restful-error-es6 browser ...
[git] github上传项目（使用git）、删除项目、添加协作者
来源:http://www.cnblogs.com/sakurayeah/p/5800424.html (怕链接失败,所以直接就就复制过来啦,感谢作者) 一.注册github账号 github网址ht ...
python 进阶篇迭代器和生成器深入理解
列表/元组/字典/集合都是容器.对于容器,可以很直观地想象成多个元素在一起的单元:而不同容器的区别,正是在于内部数据结构的实现方法. 所有的容器都是可迭代的(iterable).另外字符串也可以被迭代 ...

java读源码 之 map源码分析（HashMap，图解）一

java读源码 之 map源码分析（HashMap，图解）一的更多相关文章

随机推荐

热门专题

java读源码之 map源码分析（HashMap，图解）一

java读源码之 map源码分析（HashMap，图解）一的更多相关文章