原文:https://blog.csdn.net/Leon_cx/article/details/81911223

下面我们来模拟一下多线程场景下扩容会出现的问题:

假设在扩容过程中旧hash桶中有一个单链表,单链表中只有一个节点A,也就是e引用的对象。新hash桶中有一个单链表,单链表中的节点是B->C,也就是newTable[i]引用的对象。

单线程扩容
如果只有一个线程在执行扩容:
- 执行到第 3 行next = e.next的时候next == null
- 从第 5 行到第 9 行会将A节点按照头插法插入到newTable[i]所引用的单链表中,此时newTable[i]所引用的单链表中的节点是A->B->C
- 第 11 行e = next会将next赋值给e,所以e == null
- 这时候循环就结束了,整个扩容过程中毫无问题

多线程扩容
如果是多个线程同时在扩容,我们以T1线程的扩容过程为主视角,T2和T3线程只是会在T1线程扩容过程中捣乱的:
- T1线程执行到第 7 行e.next = newTable[i]的时候会使得 e.next == B
- 此时T2线程过来捣乱了,执行到第 3 行next = e.next,那么会使得next == B,此时T2线程的使命结束了,下面不去考虑T2线程了
- T1线程执行到第 9 行newTable[i] = e的时候,使用头插法将A插入到newTable[i]所引用的单链表中,此时newTable[i]所引用的单链表中的节点是A->B->C
- T1线程继续执行到 11 行e = next,将使得e == B,由于e != null,所以循环将继续
- T1线程开启新的一轮循环,执行到第 3 行next = e.next的时候因为B.next == C,所以next == C
- 由于e == B,newTable[i] == A,当T1线程执行到第 7 行e.next = newTable[i]的时候,将导致A.next == B, B.next == A

当执行到这一步的时候,大家会发现好像看见了一个环,离真相越来越近了,下面我们两种情况来继续执行下去:

没有T3线程介入,导致get请求死循环
T1线程继续向下执行到第 11 行e = next,将使得e == C,将继续进行下一轮循环
T1在这一轮新的循环中没有其他线程介入,这一轮执行完毕之后将跳出循环,而此时newTable[i]所引用的单链表会形成一个闭环

这时候如果用户发送一个get(A)的请求,将导致get请求发生死循环
有T3线程介入,导致T1线程扩容过程发生死循环
当T1线程执行到第 7 行e.next = newTable[i]的时候会使得 e.next == A
此时T3线程过来捣乱了,执行到第 3 行next = e.next,那么会使得next == A,此时T3线程的使命结束了,下面不去考虑T2线程了
此时A.next == B, B.next == A, next == A,T1线程继续往下执行next指针会在A和B之间无线循环,导致T1扩容过程中发生死循环

扩容死循环代码示例

import java.util.HashMap;
import java.util.Map;
import java.util.UUID; public class HashMapTest { public static void main(String[] args) throws Exception {
HashMap<String,String> map = new HashMap<String, String>();
TestDeadLock t1 = new TestDeadLock(map);
t1.start();
TestDeadLock t2 = new TestDeadLock(map);
t2.start();
TestDeadLock t3 = new TestDeadLock(map);
t3.start();
}
} class TestDeadLock extends Thread { private HashMap<String,String> map; public TestDeadLock(HashMap<String, String> map) {
super();
this.map = map;
} @Override
public void run() {
for (int i = 0; i<500000; i++) {
map.put(UUID.randomUUID().toString(), UUID.randomUUID().toString());
System.out.println("Running ~~");
}
}
}

main方法执行到一半后不会再打印”Running ~~”,并且方法不会执行结束,所以判断扩容过程造成死循环了。

JDK 1.7 HashMap扩容导致死循环的主要原因
HashMap扩容导致死循环的主要原因在于扩容后链表中的节点在新的hash桶使用头插法插入。

新的hash桶会倒置原hash桶中的单链表,那么在多个线程同时扩容的情况下就可能导致产生一个存在闭环的单链表,从而导致死循环。

JDK 1.8 HashMap扩容不会造成死循环的原因
在JDK 1.8中执行上面的扩容死循环代码示例就不会发生死循环,我们可以理解为在JDK 1.8 HashMap扩容不会造成死循环,但还是需要理论依据才有信服力。

首先通过上面的分析我们知道JDK 1.7中HashMap扩容发生死循环的主要原因在于扩容后链表倒置以及链表过长。

那么在JDK 1.8中HashMap扩容不会造成死循环的主要原因就从这两个角度去分析一下。

由于扩容是按两倍进行扩,即 N 扩为 N + N,因此就会存在低位部分 0 - (N-1),以及高位部分 N - (2N-1), 所以在扩容时分为 loHead (low Head) 和 hiHead (high head)。

然后将原hash桶中单链表上的节点按照尾插法插入到loHead和hiHead所引用的单链表中。

由于使用的是尾插法,不会导致单链表的倒置,所以扩容的时候不会导致死循环。

通过上面的分析,不难发现循环的产生是因为新链表的顺序跟旧的链表是完全相反的,所以只要保证建新链时还是按照原来的顺序的话就不会产生循环。

如果单链表的长度达到 8 ,就会自动转成红黑树,而转成红黑树之前产生的单链表的逻辑也是借助loHead (low Head) 和 hiHead (high head),采用尾插法。然后再根据单链表生成红黑树,也不会导致发生死循环。

这里虽然JDK 1.8 中HashMap扩容的时候不会造成死循环,但是如果多个线程同时执行put操作,可能会导致同时向一个单链表中插入数据,从而导致数据丢失的。

所以不论是JDK 1.7 还是 1.8,HashMap线程都是不安全的,要使用线程安全的Map可以考虑ConcurrentHashMap。

HashMap扩容死循环问题的更多相关文章

  1. 图解集合5:不正确地使用HashMap引发死循环及元素丢失

    问题引出 前一篇文章讲解了HashMap的实现原理,讲到了HashMap不是线程安全的.那么HashMap在多线程环境下又会有什么问题呢? 几个月前,公司项目的一个模块在线上运行的时候出现了死循环,死 ...

  2. 集合(五)不正确地使用HashMap引发死循环及元素丢失

    前一篇文章讲解了HashMap的实现原理,讲到了HashMap不是线程安全的.那么HashMap在多线程环境下又会有什么问题呢? 几个月前,公司项目的一个模块在线上运行的时候出现了死循环,死循环的代码 ...

  3. JDK(九)JDK1.7源码分析【集合】HashMap的死循环

    前言 在JDK1.7&1.8源码对比分析[集合]HashMap中我们遗留了一个问题:为什么HashMap在调用resize() 方法时会出现死循环?这篇文章就通过JDK1.7的源码来分析并解释 ...

  4. 面试突击17:HashMap除了死循环还有什么问题?

    面试合集:https://gitee.com/mydb/interview 本篇的这个问题是一个开放性问题,HashMap 除了死循环之外,还有其他什么问题?总体来说 HashMap 的所有" ...

  5. 多线程下HashMap的死循环问题

    多线程下[HashMap]的问题: 1.多线程put操作后,get操作导致死循环.2.多线程put非NULL元素后,get操作得到NULL值.3.多线程put操作,导致元素丢失. 本次主要关注[Has ...

  6. HashMap的原理与实 无锁队列的实现Java HashMap的死循环 red black tree

    http://www.cnblogs.com/fornever/archive/2011/12/02/2270692.html https://zh.wikipedia.org/wiki/%E7%BA ...

  7. HashMap陷入死循环的例子

    //使用这个例子可以模拟HashMap陷入死循环的效果,可能需要执行多次才会出现. 1 package com.hanzi; import java.util.HashMap; public clas ...

  8. 面试笔记--HashMap扩容机制

    转载请注明出处 http://www.cnblogs.com/yanzige/p/8392142.html 扩容必须满足两个条件: 1. 存放新值的时候当前已有元素的个数必须大于等于阈值 2. 存放新 ...

  9. 【转】Java HashMap的死循环

    问题的症状 从前我们的Java代码因为一些原因使用了HashMap这个东西,但是当时的程序是单线程的,一切都没有问题.后来,我们的程序性能有问题,所以需要变成多线程的,于是,变成多线程后到了线上,发现 ...

随机推荐

  1. Clojure 哲学

    简单性.专心编程不受打扰(freedom to focus).给力(empowerment).一致性和明确性:Closure编程语言中几乎每一个元素的设计思想都是为了促成这些目标的实现. 学习一门新的 ...

  2. 本地win下JConsole监控远程linux下的JVM

    环境:服务器端: Linux + jdk1.7.0_75 + tomcat 7本地: Win + jdk1.7.0_55 一.修改/etc/hosts文件 hostname -i 如果显示127.0. ...

  3. composer安装FOSUserBundle内存溢出

    内存溢出异常: Fatal error: Allowed memory size of 2147483648 bytes exhausted (tried to allocate 4096 bytes ...

  4. DS 图解快排

    快速排序是交换排序,是冒泡排序的改进版. 快排过程: 1.选定一个分界值     2.分成三个部分(小于分界部分,分界值,大于分界值部分)                       3.对于分开的两 ...

  5. Python开发【源码剖析】 Dict对象

    static void ShowDictObject(PyDictObject* dictObject) { PyDictEntry* entry = dictObject->ma_table; ...

  6. 【LEETCODE】67、分治递归,medium&hard级别,题目:215、312

    我被这些题整哭了,你呢??? 日了狗啊...... 好难啊.... 按照这个样子搞,不用找工作了,回家放牛去....... package y2019.Algorithm.divideandconqu ...

  7. Window中C++进行精确计时的方法

    嗯,程序员一个永恒的追求就是性能吧? 为了衡量性能,自然需要计时. 奈何无论C标准库还是C++标准库,因为通用性的考虑,其time API精度都不高.基本都是毫秒级的. 所以如果要真正精确地衡量程序的 ...

  8. Scala 系列(一)—— Scala 简介及开发环境配置

    一.Scala简介 1.1 概念 Scala 全称为 Scalable Language,即"可伸缩的语言",之所以这样命名,是因为它的设计目标是希望伴随着用户的需求一起成长.Sc ...

  9. node-red inject节点 debug节点 switch节点

    inject节点: https://blog.csdn.net/geek_monkey/article/details/80737818 debug节点: https://blog.csdn.net/ ...

  10. Visual Studio 使用 Parallel Builds Monitor 插件迅速找出编译速度慢的瓶颈,优化编译速度

    原文:Visual Studio 使用 Parallel Builds Monitor 插件迅速找出编译速度慢的瓶颈,优化编译速度 嫌项目编译太慢?不一定是 Visual Studio 的问题,有可能 ...