多线程下HashMap的死循环是如何产生的

前言

　　HashMap不是线程安全的，如果需要在多线程环境中使用Map，那么我们可以使用ConcurrentHashmap。

1.举例说明：

package com.test;

import java.util.HashMap;

import java.util.UUID;

public class Test {

	public static void main(String[] args) throws InterruptedException {

		final HashMap<String, String> map = new HashMap<String, String>(2);

		for (int i = 0; i < 10000; i++) {

			new Thread(new Runnable() {

				@Override

				public void run() {

					System.out.println(UUID.randomUUID().toString());

					map.put(UUID.randomUUID().toString(), "");

				}

			}, "线程Thread-" + i).start();

		}

	}

}

　　执行结果：

　　通过运行该段代码，过一段时间之后就会显示CPU使用率100%。

2.分析原因：

　　毫无疑问，因为陷入了死循环所以才会出现CPU使用达到100%的情况。可是为什么会出现死循环呢？知己知彼百战百胜，所以我们需要知道HashMap的原理所在，看源码。

　　2.1 HashMap结构

　　HashMap通常会用一个指针数组（假设为table[]）来做分散所有的key，当一个key被加入时，会通过Hash算法通过key算出这个数组的下标i，然后就把这个<key, value>插到table[i]中，如果有两个不同的key被算在了同一个i，那么就叫冲突，又叫碰撞，那么在同一个位子上的元素将以链表的形式存放，新加入的放在链头，而先前加入的放在链尾，这样会在table[i]上形成一个链表。最坏的情况下，所有的key都映射到同一个桶中，这样hashmap就退化成了一个链表——查找时间从O(1)到O(n)。Hash表这个容器当有数据要插入时，都会检查容量有没有超过设定的thredhold，如果超过，需要增大Hash表的尺寸，但是这样一来，整个Hash表里的无素都需要被重算一遍。这叫rehash，这个成本相当的大。

如代码所示：

void addEntry(int hash, K key, V value, int bucketIndex)

{

    Entry<K,V> e = table[bucketIndex];

    table[bucketIndex] = new Entry<K,V>(hash, key, value, e);

    //查看当前的size是否超过了我们设定的阈值threshold，如果超过，需要resize

    if (size++ >= threshold)

        resize(2 * table.length);

}

　　2.2 resieze() 操作

　　如代码所示，如果现在size已经超过了threshold，那么就要进行resize操作,新建一个更大尺寸的hash表，然后把数据从老的Hash表中迁移到新的Hash表中：

resize(newCapacity)：

void resize(int newCapacity)

{

    Entry[] oldTable = table;

    int oldCapacity = oldTable.length;

    ......

    //创建一个新的Hash Table

    Entry[] newTable = new Entry[newCapacity];

    //将Old Hash Table上的数据迁移到New Hash Table上

    transfer(newTable);

    table = newTable;

    threshold = (int)(newCapacity * loadFactor);

}

transfer(Entry[] newTable)：

void transfer(Entry[] newTable)

{

    Entry[] src = table;

    int newCapacity = newTable.length;

    //  从OldTable里摘一个元素出来，然后放到NewTable中

    for (int j = 0; j < src.length; j++) {

        Entry<K,V> e = src[j];

        if (e != null) {

            src[j] = null;

            do {

                Entry<K,V> next = e.next;

                int i = indexFor(e.hash, newCapacity);

                e.next = newTable[i];

                newTable[i] = e;

                e = next;

            } while (e != null);

        }

    }

}

　　2.3冲突产生

　　注意代码：

 do {

                Entry<K,V> next = e.next;

                int i = indexFor(e.hash, newCapacity);

                e.next = newTable[i];

                newTable[i] = e;

                e = next;

            } while (e != null);

　　如果有两个线程同时访问到这个循环操作，也就是说两个线程同时触发了rehash()操作之后：(对于这个例子假设初始容量为2，使用的Hash算法是取摸计算)

　　首先需要说明的是线程T1和线程T2同时访问到上面的代码，T1指向当前对象e,然后被挂起所以T2指向了Next对象，这也是为什么扩容后看到链表的顺序被反转。在第三i部就会形成一个局部链表，但我们在这个Map中放入元素11的时候会寻找到table[3]这个位置，然后就会陷入无休止的死循环中，这样，就不难解释CPU达到100%的原因了。（PS:图画的很丑）

3.其他扩展

　　　　针对HashMap退化成单链表的问题，在JDK8中有所改善。如果某个桶中的记录过大的话（当前是TREEIFY_THRESHOLD = 8），HashMap会动态的使用一个专门的treemap实现来替换掉它。这样做的结果会更好，查取元素时的花费是O(logn)，而不是糟糕的O(n)。它是如何工作的？前面产生冲突的那些KEY对应的记录只是简单的追加到一个链表后面，这些记录只能通过遍历来进行查找。但是超过这个阈值后HashMap开始将列表升级成一个二叉树，使用哈希值作为树的分支变量，如果两个哈希值不等，但指向同一个桶的话，较大的那个会插入到右子树里。如果哈希值相等，HashMap希望key值最好是实现了Comparable接口的，这样它可以按照顺序来进行插入。这对HashMap的key来说并不是必须的，不过如果实现了当然最好。

多线程下HashMap的死循环是如何产生的的更多相关文章

多线程下HashMap的死循环问题
多线程下[HashMap]的问题: 1.多线程put操作后,get操作导致死循环.2.多线程put非NULL元素后,get操作得到NULL值.3.多线程put操作,导致元素丢失. 本次主要关注[Has ...
【JAVA】HashMap的原理及多线程下死循环的原因
再次翻到以前工作中遇到的一个问题,HashMap在多线程下会出现死循环的问题,以前只是知道会死循环,导致CPU100%把机器拖跨,今天来彻底看看首先来看下,HashMap的原理:HashMap是一个 ...
HashMap闭环(死循环)的详细原因(转)
为何出现死循环简要说明 HashMap是非线程安全的,在并发场景中如果不保持足够的同步,就有可能在执行HashMap.get时进入死循环,将CPU的消耗到100%. HashMap采用链表解决Hash ...
hashmap，hashtable，concurrenthashmap多线程下的比较（持续更新）
1.hashMap 多线程下put会造成死循环,主要是扩容时transfer方法会造成死循环. http://blog.csdn.net/zhuqiuhui/article/details/51849 ...
HashMap为什么在多线程下会让cpu100%
首先HashMap并不是sun公司多线程提供的集合,很多时候我们的程序是一个主线程,用了hashmap并没有什么问题,但是在多线程下会出现问题. hashmap是一个哈希表,存储的数据结构也可以是一个 ...
并发场景下HashMap死循环导致CPU100%的问题
参考链接:并发场景下HashMap死循环导致CPU100%的问题
图解集合5：不正确地使用HashMap引发死循环及元素丢失
问题引出前一篇文章讲解了HashMap的实现原理,讲到了HashMap不是线程安全的.那么HashMap在多线程环境下又会有什么问题呢? 几个月前,公司项目的一个模块在线上运行的时候出现了死循环,死 ...
【转】Java HashMap的死循环
问题的症状从前我们的Java代码因为一些原因使用了HashMap这个东西,但是当时的程序是单线程的,一切都没有问题.后来,我们的程序性能有问题,所以需要变成多线程的,于是,变成多线程后到了线上,发现 ...
集合（五）不正确地使用HashMap引发死循环及元素丢失
前一篇文章讲解了HashMap的实现原理,讲到了HashMap不是线程安全的.那么HashMap在多线程环境下又会有什么问题呢? 几个月前,公司项目的一个模块在线上运行的时候出现了死循环,死循环的代码 ...

随机推荐

nginx 提供静态内容
Serving Static Content 提供静态内容原文地址:http://nginx.com/resources/admin-guide/serving-static-content/ Th ...
[python]自问自答：python -m参数？（转）
python -m xxx.py 作用是:把xxx.py文件当做模块启动但是我一直不明白当做模块启动到底有什么用.python xxx.py和python -m xxx.py有什么区别! 自问自答: ...
谈到一些传统的企业网站SEO问题领域
在网络营销中的时间越长,有时候,企业网站还是有一些传统做法不解.也许,这是它的思想的局限.比如,我最近来到了一个新的工作环境中发现,虽然公司是专业从事传统渠道已经很不错了,但对于网络营销渠道还有改进的 ...
SVD奇异值分解的几何物理意义资料汇总
学习SVD奇异值分解的网上资料汇总: 1. 关于svd的一篇概念文,这篇文章也是后续几篇文章的鼻祖~ http://www.ams.org/samplings/feature-column/fcarc ...
iOS6和iOS7适应代码(6) —— NSLocalizedString
我们的应用程序都需要国际化,字符串的重要组成部分.一般来说.我们是通过一个string资源文件来达到这个目的,我们需要支持多国语言,有多少次把这个文档本地化.需要使用的代码NSLocalizedStr ...
设计模式 - 迭代模式(iterator pattern) Java 迭代器(Iterator) 详细解释
迭代模式(iterator pattern) Java 迭代器(Iterator) 详细解释本文地址: http://blog.csdn.net/caroline_wendy 參考迭代器模式(ite ...
《C++ Primer Plus》学习笔记6
<C++ Primer Plus>学习笔记6 第11章使用类 <<<<<<<<<<<<<<<&l ...
组合数处理(逆元求解)...Orz
网上发现了不错的博客讲解... 熊猫的板子:http://blog.csdn.net/qq_32734731/article/details/51484729 组合数的预处理(费马小定理|杨辉三角|卢 ...
我的MYSQL学习心得（六）
原文:我的MYSQL学习心得(六) 我的MYSQL学习心得(六) 我的MYSQL学习心得(一) 我的MYSQL学习心得(二) 我的MYSQL学习心得(三) 我的MYSQL学习心得(四) 我的MYSQL ...
博客测试：博客系统i94web beta1.0 申请测试
如何做了最近的博客更新,因为已经在线路和代码,我写了一个小博客系统:i94web,草草宣布beta1.0,请求您测试各种漏洞. 先看几张截图. 首页: watermark/2/text/aHR0cDo ...

多线程下HashMap的死循环是如何产生的

多线程下HashMap的死循环是如何产生的的更多相关文章

随机推荐

热门专题