HashMap扩容死循环问题

原文：https://blog.csdn.net/Leon_cx/article/details/81911223

下面我们来模拟一下多线程场景下扩容会出现的问题：

假设在扩容过程中旧hash桶中有一个单链表，单链表中只有一个节点A，也就是e引用的对象。新hash桶中有一个单链表，单链表中的节点是B->C，也就是newTable[i]引用的对象。

单线程扩容
如果只有一个线程在执行扩容：
- 执行到第 3 行next = e.next的时候next == null
- 从第 5 行到第 9 行会将A节点按照头插法插入到newTable[i]所引用的单链表中，此时newTable[i]所引用的单链表中的节点是A->B->C
- 第 11 行e = next会将next赋值给e，所以e == null
- 这时候循环就结束了，整个扩容过程中毫无问题

多线程扩容
如果是多个线程同时在扩容，我们以T1线程的扩容过程为主视角，T2和T3线程只是会在T1线程扩容过程中捣乱的：
- T1线程执行到第 7 行e.next = newTable[i]的时候会使得 e.next == B
- 此时T2线程过来捣乱了，执行到第 3 行next = e.next，那么会使得next == B，此时T2线程的使命结束了，下面不去考虑T2线程了
- T1线程执行到第 9 行newTable[i] = e的时候，使用头插法将A插入到newTable[i]所引用的单链表中，此时newTable[i]所引用的单链表中的节点是A->B->C
- T1线程继续执行到 11 行e = next，将使得e == B，由于e != null，所以循环将继续
- T1线程开启新的一轮循环，执行到第 3 行next = e.next的时候因为B.next == C，所以next == C
- 由于e == B，newTable[i] == A，当T1线程执行到第 7 行e.next = newTable[i]的时候，将导致A.next == B， B.next == A

当执行到这一步的时候，大家会发现好像看见了一个环，离真相越来越近了，下面我们两种情况来继续执行下去：

没有T3线程介入，导致get请求死循环
T1线程继续向下执行到第 11 行e = next，将使得e == C，将继续进行下一轮循环
T1在这一轮新的循环中没有其他线程介入，这一轮执行完毕之后将跳出循环，而此时newTable[i]所引用的单链表会形成一个闭环

这时候如果用户发送一个get(A)的请求，将导致get请求发生死循环
有T3线程介入，导致T1线程扩容过程发生死循环
当T1线程执行到第 7 行e.next = newTable[i]的时候会使得 e.next == A
此时T3线程过来捣乱了，执行到第 3 行next = e.next，那么会使得next == A，此时T3线程的使命结束了，下面不去考虑T2线程了
此时A.next == B， B.next == A， next == A，T1线程继续往下执行next指针会在A和B之间无线循环，导致T1扩容过程中发生死循环

扩容死循环代码示例

import java.util.HashMap;

import java.util.Map;

import java.util.UUID;

public class HashMapTest {

    public static void main(String[] args) throws Exception {

        HashMap<String,String> map = new HashMap<String, String>();

        TestDeadLock t1 = new TestDeadLock(map);

        t1.start();

        TestDeadLock t2 = new TestDeadLock(map);

        t2.start();

        TestDeadLock t3 = new TestDeadLock(map);

        t3.start();

    }

}

class TestDeadLock extends Thread {

    private HashMap<String,String> map;

    public TestDeadLock(HashMap<String, String> map) {

        super();

        this.map = map;

    }

    @Override

    public void run() {

        for (int i = 0; i<500000; i++) {

            map.put(UUID.randomUUID().toString(), UUID.randomUUID().toString());

            System.out.println("Running ~~");

        }

    }

}

main方法执行到一半后不会再打印”Running ~~”，并且方法不会执行结束，所以判断扩容过程造成死循环了。

JDK 1.7 HashMap扩容导致死循环的主要原因
HashMap扩容导致死循环的主要原因在于扩容后链表中的节点在新的hash桶使用头插法插入。

新的hash桶会倒置原hash桶中的单链表，那么在多个线程同时扩容的情况下就可能导致产生一个存在闭环的单链表，从而导致死循环。

JDK 1.8 HashMap扩容不会造成死循环的原因
在JDK 1.8中执行上面的扩容死循环代码示例就不会发生死循环，我们可以理解为在JDK 1.8 HashMap扩容不会造成死循环，但还是需要理论依据才有信服力。

首先通过上面的分析我们知道JDK 1.7中HashMap扩容发生死循环的主要原因在于扩容后链表倒置以及链表过长。

那么在JDK 1.8中HashMap扩容不会造成死循环的主要原因就从这两个角度去分析一下。

由于扩容是按两倍进行扩，即 N 扩为 N + N，因此就会存在低位部分 0 - (N-1)，以及高位部分 N - (2N-1)，所以在扩容时分为 loHead (low Head) 和 hiHead (high head)。

然后将原hash桶中单链表上的节点按照尾插法插入到loHead和hiHead所引用的单链表中。

由于使用的是尾插法，不会导致单链表的倒置，所以扩容的时候不会导致死循环。

通过上面的分析，不难发现循环的产生是因为新链表的顺序跟旧的链表是完全相反的，所以只要保证建新链时还是按照原来的顺序的话就不会产生循环。

如果单链表的长度达到 8 ，就会自动转成红黑树，而转成红黑树之前产生的单链表的逻辑也是借助loHead (low Head) 和 hiHead (high head)，采用尾插法。然后再根据单链表生成红黑树，也不会导致发生死循环。

这里虽然JDK 1.8 中HashMap扩容的时候不会造成死循环，但是如果多个线程同时执行put操作，可能会导致同时向一个单链表中插入数据，从而导致数据丢失的。

所以不论是JDK 1.7 还是 1.8，HashMap线程都是不安全的，要使用线程安全的Map可以考虑ConcurrentHashMap。

HashMap扩容死循环问题的更多相关文章

图解集合5：不正确地使用HashMap引发死循环及元素丢失
问题引出前一篇文章讲解了HashMap的实现原理,讲到了HashMap不是线程安全的.那么HashMap在多线程环境下又会有什么问题呢? 几个月前,公司项目的一个模块在线上运行的时候出现了死循环,死 ...
集合（五）不正确地使用HashMap引发死循环及元素丢失
前一篇文章讲解了HashMap的实现原理,讲到了HashMap不是线程安全的.那么HashMap在多线程环境下又会有什么问题呢? 几个月前,公司项目的一个模块在线上运行的时候出现了死循环,死循环的代码 ...
JDK（九）JDK1.7源码分析【集合】HashMap的死循环
前言在JDK1.7&1.8源码对比分析[集合]HashMap中我们遗留了一个问题:为什么HashMap在调用resize() 方法时会出现死循环?这篇文章就通过JDK1.7的源码来分析并解释 ...
面试突击17：HashMap除了死循环还有什么问题？
面试合集:https://gitee.com/mydb/interview 本篇的这个问题是一个开放性问题,HashMap 除了死循环之外,还有其他什么问题?总体来说 HashMap 的所有" ...
多线程下HashMap的死循环问题
多线程下[HashMap]的问题: 1.多线程put操作后,get操作导致死循环.2.多线程put非NULL元素后,get操作得到NULL值.3.多线程put操作,导致元素丢失. 本次主要关注[Has ...
HashMap的原理与实无锁队列的实现Java HashMap的死循环 red black tree
http://www.cnblogs.com/fornever/archive/2011/12/02/2270692.html https://zh.wikipedia.org/wiki/%E7%BA ...
HashMap陷入死循环的例子
//使用这个例子可以模拟HashMap陷入死循环的效果,可能需要执行多次才会出现. 1 package com.hanzi; import java.util.HashMap; public clas ...
面试笔记--HashMap扩容机制
转载请注明出处 http://www.cnblogs.com/yanzige/p/8392142.html 扩容必须满足两个条件: 1. 存放新值的时候当前已有元素的个数必须大于等于阈值 2. 存放新 ...
【转】Java HashMap的死循环
问题的症状从前我们的Java代码因为一些原因使用了HashMap这个东西,但是当时的程序是单线程的,一切都没有问题.后来,我们的程序性能有问题,所以需要变成多线程的,于是,变成多线程后到了线上,发现 ...

随机推荐

【翻译】Flink Table Api & SQL — Hive —— Hive 函数
本文翻译自官网:Hive Functions https://ci.apache.org/projects/flink/flink-docs-release-1.9/dev/table/hive/h ...
Android studio配置国内镜像源
Android studio配置国内镜像源不使用镜像也是可以的,据说谷歌在中国搭建了服务器如果直接使用有问题,不妨使用镜像试试.有自动探测代理配置和手动代理配置. https://blog.csd ...
Oracle Spatial分区应用研究之八：不同分区粒度在1.5亿要素量级下的查询性能
以土地调查地类图斑层作为测试数据,共计约1.5亿条要素.随机生成90次各比例尺的查询范围,在ORACLE 11gr2数据库中进行空间查询,记录查询耗时.最后计算平均值和第90百分位数,结果如下图所示: ...
Tomcat 的端口被占用的解决办法
在dos下,输入 netstat -ano|findstr 8080 //说明:查看占用8080端口的进程显示占用端口的进程 taskkill /pid 6856 /f //说明,运行 ...
node-sass 报错
2019-7-16 import / from...import... 模块的调用
模块调用的总结:如果你是pycharm打开文件,会自动帮你把文件根目录加到system.path中,你要调用模块直接以根目录为基准开始找.1.假如你要调用和文件根目录为同级的文件,你直接import ...
STM32 EV1527无线通信（433）
EV1527无线通信先说一下这个通信协议的数据格式,这个图片是我在手册里截的. 大家按照单片机类型计算周期,我的是STM32f103vb (4CLK大致等于350um) 发送时按照先发同步码后发D ...
Django使用distinct报错：DISTINCT ON fields is not supported by this database backend
具体错误提示是:django.db.utils.NotSupportedError: DISTINCT ON fields is not supported by this database back ...
Spark实战电影点评系统(二)
二.通过DataFrame实战电影点评系统 DataFrameAPI是从Spark 1.3开始就有的,它是一种以RDD为基础的分布式无类型数据集,它的出现大幅度降低了普通Spark用户的学习门槛. D ...
CF241E Flights 差分约束
传送门差分约束永远是Itst最烂的图论知识点没有之一qwq 先用dfs把在\(1\)到\(N\)的路径上的所有点都拿出来,其他的点和边状态任意都不会影响答案. 然后考虑设\(dis_i\)表示从\( ...

HashMap扩容死循环问题

扩容死循环代码示例

HashMap扩容死循环问题的更多相关文章

随机推荐

热门专题