Java基础知识强化之集合框架笔记77：ConcurrentHashMap之 ConcurrentHashMap的基本操作

1. ConcurrentHashMap的初始化：

下面我们来结合源代码来具体分析一下ConcurrentHashMap的实现，先看下初始化方法：

 public ConcurrentHashMap(int initialCapacity,

                          float loadFactor, int concurrencyLevel) {

     if (!(loadFactor > 0) || initialCapacity < 0 || concurrencyLevel <= 0)

         throw new IllegalArgumentException();

     if (concurrencyLevel > MAX_SEGMENTS)

         concurrencyLevel = MAX_SEGMENTS;

     // Find power-of-two sizes best matching arguments

     int sshift = 0;

     int ssize = 1;

     while (ssize < concurrencyLevel) {

         ++sshift;

         ssize <<= 1;

     }

     segmentShift = 32 - sshift;

     segmentMask = ssize - 1;

     this.segments = Segment.newArray(ssize);

     if (initialCapacity > MAXIMUM_CAPACITY)

         initialCapacity = MAXIMUM_CAPACITY;

     int c = initialCapacity / ssize;

     if (c * ssize < initialCapacity)

         ++c;

     int cap = 1;

     while (cap < c)

         cap <<= 1;

     for (int i = 0; i < this.segments.length; ++i)

         this.segments[i] = new Segment<K,V>(cap, loadFactor);

 }

CurrentHashMap的初始化一共有三个参数：

一个initialCapacity，表示初始的容量；

一个loadFactor，表示负载参数；

最后一个是concurrentLevel，代表ConcurrentHashMap内部的Segment的数量。

ConcurrentLevel一经指定，不可改变，后续如果ConcurrentHashMap的元素数量增加导致ConrruentHashMap需要扩容，ConcurrentHashMap不会增加Segment的数量，而只会增加Segment中链表数组的容量大小，这样的好处是扩容过程不需要对整个ConcurrentHashMap做rehash，而只需要对Segment里面的元素做一次rehash就可以了。

整个ConcurrentHashMap的初始化方法还是非常简单的：

先是根据concurrentLevel来new出Segment，这里Segment的数量是不大于concurrentLevel的最大的2的指数，就是说Segment的数量永远是2的指数个，这样的好处是方便采用移位操作来进行hash，加快hash的过程。接下来就是根据intialCapacity确定Segment的容量的大小，每一个Segment的容量大小也是2的指数，同样使为了加快hash的过程。

这边需要特别注意一下两个变量，分别是segmentShift和segmentMask，这两个变量在后面将会起到很大的作用，假设构造函数确定了Segment的数量是2的n次方，那么segmentShift就等于32减去n，而segmentMask就等于2的n次方减一。

2. ConcurrentHashMap的get操作：

前面提到过ConcurrentHashMap的get操作是不用加锁的，我们这里看一下其实现：

 public V get(Object key) {

     int hash = hash(key.hashCode());

     return segmentFor(hash).get(key, hash);

 }

看第三行，segmentFor这个函数用于确定操作应该在哪一个segment中进行，几乎对ConcurrentHashMap的所有操作都需要用到这个函数，我们看下这个函数的实现：

 final Segment<K,V> segmentFor(int hash) {

     return segments[(hash >>> segmentShift) & segmentMask];

 }

这个函数用了位操作来确定Segment，根据传入的hash值向右无符号右移segmentShift位，然后和segmentMask进行与操作，结合我们之前说的segmentShift和segmentMask的值，就可以得出以下结论：假设Segment的数量是2的n次方，根据元素的hash值的高n位就可以确定元素到底在哪一个Segment中。

在确定了需要在哪一个segment中进行操作以后，接下来的事情就是调用对应的Segment的get方法：

 V get(Object key, int hash) {

     if (count != 0) { // read-volatile

         HashEntry<K,V> e = getFirst(hash);

         while (e != null) {

             if (e.hash == hash && key.equals(e.key)) {

                 V v = e.value;

                 if (v != null)

                     return v;

                 return readValueUnderLock(e); // recheck

             }

             e = e.next;

         }

     }

     return null;

 }

先看第二行代码，这里对count进行了一次判断，其中count表示Segment中元素的数量，我们可以来看一下count的定义：

 transient volatile int count;

可以看到count是volatile的，实际上这里里面利用了volatile的语义：

因为实际上put、remove等操作也会更新count的值，所以当竞争发生的时候，volatile的语义可以保证写操作在读操作之前，也就保证了写操作对后续的读操作都是可见的，这样后面get的后续操作就可以拿到完整的元素内容。

然后，在第三行，调用了getFirst()来取得链表的头部：

 HashEntry<K,V> getFirst(int hash) {

     HashEntry<K,V>[] tab = table;

     return tab[hash & (tab.length - 1)];

 }

同样，这里也是用位操作来确定链表的头部，hash值和HashTable的长度减一做与操作，最后的结果就是hash值的低n位，其中n是HashTable的长度以2为底的结果。

在确定了链表的头部以后，就可以对整个链表进行遍历，看第4行，取出key对应的value的值，如果拿出的value的值是null，则可能这个key，value对正在put的过程中，如果出现这种情况，那么就加锁来保证取出的value是完整的，如果不是null，则直接返回value。

3. ConcurrentHashMap的put操作：

看完了get操作，再看下put操作，put操作的前面也是确定Segment的过程，这里不再赘述，直接看关键的segment的put方法：

 V put(K key, int hash, V value, boolean onlyIfAbsent) {

     lock();

     try {

         int c = count;

         if (c++ > threshold) // ensure capacity

             rehash();

         HashEntry<K,V>[] tab = table;

         int index = hash & (tab.length - 1);

         HashEntry<K,V> first = tab[index];

         HashEntry<K,V> e = first;

         while (e != null && (e.hash != hash || !key.equals(e.key)))

             e = e.next;

         V oldValue;

         if (e != null) {

             oldValue = e.value;

             if (!onlyIfAbsent)

                 e.value = value;

         }

         else {

             oldValue = null;

             ++modCount;

             tab[index] = new HashEntry<K,V>(key, hash, first, value);

             count = c; // write-volatile

         }

         return oldValue;

     } finally {

         unlock();

     }

 }

首先对Segment的put操作是加锁完成的，然后在第五行，如果Segment中元素的数量超过了阈值（由构造函数中的loadFactor算出）这需要进行对Segment扩容，并且要进行rehash，关于rehash的过程大家可以自己去了解，这里不详细讲了。

第8和第9行的操作就是getFirst的过程，确定链表头部的位置。

第11行这里的这个while循环是在链表中寻找和要put的元素相同key的元素。如果找到，就直接更新更新key的value，如果没有找到，则进入21行这里，生成一个新的HashEntry并且把它加到整个Segment的头部，然后再更新count的值。

4. ConcurrentHashMap的remove操作：

Remove操作的前面一部分和前面的get和put操作一样，都是定位Segment的过程，然后再调用Segment的remove方法：

 V remove(Object key, int hash, Object value) {

     lock();

     try {

         int c = count - 1;

         HashEntry<K,V>[] tab = table;

         int index = hash & (tab.length - 1);

         HashEntry<K,V> first = tab[index];

         HashEntry<K,V> e = first;

         while (e != null && (e.hash != hash || !key.equals(e.key)))

             e = e.next;

         V oldValue = null;

         if (e != null) {

             V v = e.value;

             if (value == null || value.equals(v)) {

                 oldValue = v;

                 // All entries following removed node can stay

                 // in list, but all preceding ones need to be

                 // cloned.

                 ++modCount;

                 HashEntry<K,V> newFirst = e.next;

                 for (HashEntry<K,V> p = first; p != e; p = p.next)

                     newFirst = new HashEntry<K,V>(p.key, p.hash,

                                                   newFirst, p.value);

                 tab[index] = newFirst;

                 count = c; // write-volatile

             }

         }

         return oldValue;

     } finally {

         unlock();

     }

 }

首先remove操作也是确定需要删除的元素的位置，不过这里删除元素的方法不是简单地把待删除元素的前面的一个元素的next指向后面一个就完事了，我们之前已经说过HashEntry中的next是final的，一经赋值以后就不可修改，在定位到待删除元素的位置以后，程序就将待删除元素前面的那一些元素全部复制一遍，然后再一个一个重新接到链表上去，看一下下面这一幅图来了解这个过程：

假设链表中原来的元素如上图所示，现在要删除元素3，那么删除元素3以后的链表就如下图所示：

5. ConcurrentHashMap的size操作：

（1）size操作简介：

在前面的章节中，我们涉及到的操作都是在单个Segment中进行的，但是ConcurrentHashMap有一些操作是在多个Segment中进行，比如size操作，ConcurrentHashMap的size操作也采用了一种比较巧的方式，来尽量避免对所有的Segment都加锁。

（2）size操作分析：

如果我们要统计整个ConcurrentHashMap里元素的大小，就必须统计所有Segment里元素的大小后求和。

Segment里的全局变量count是一个volatile变量，那么在多线程场景下，我们是不是直接把所有Segment的count相加就可以得到整个ConcurrentHashMap大小了呢？不是的，虽然相加时可以获取每个Segment的count的最新值，但是拿到之后可能累加前使用的count发生了变化，那么统计结果就不准了。所以最安全的做法，是在统计size的时候把所有Segment的put，remove和clean方法全部锁住，但是这种做法显然非常低效。

因为在累加count操作过程中，之前累加过的count发生变化的几率非常小，所以ConcurrentHashMap的做法是先尝试2次通过不锁住Segment的方式来统计各个Segment大小，如果统计的过程中，容器的count发生了变化，则再采用加锁的方式来统计所有Segment的大小。

　那么ConcurrentHashMap是如何判断在统计的时候容器是否发生了变化呢？使用modCount变量，在put , remove和clean方法里操作元素前都会将变量modCount进行加1，那么在统计size前后比较modCount是否发生变化，从而得知容器的大小是否发生变化。

前面我们提到了一个Segment中的有一个modCount变量，代表的是对Segment中元素的数量造成影响的操作的次数，这个值只增不减，size操作就是遍历了两次Segment，每次记录Segment的modCount值，然后将两次的modCount进行比较，如果相同，则表示期间没有发生过写入操作，就将原先遍历的结果返回，如果不相同，则把这个过程再重复做一次，如果再不相同，则就需要将所有的Segment都锁住，然后一个一个遍历了，具体的实现大家可以看ConcurrentHashMap的源码，这里就不贴了。

Java基础知识强化之集合框架笔记77：ConcurrentHashMap之 ConcurrentHashMap的基本操作的更多相关文章

Java基础知识强化之集合框架笔记76：ConcurrentHashMap之 ConcurrentHashMap简介
1. ConcurrentHashMap简介: ConcurrentHashMap是一个线程安全的Hash Table,它的主要功能是提供了一组和Hashtable功能相同但是线程安全的方法.Conc ...
Java基础知识强化之集合框架笔记39：Set集合之HashSet存储字符串并遍历
1. HashSet类的概述: (1)不保证set的迭代顺序 (2)特别是它不保证该顺序恒久不变 HashSet底层数据结构是哈希表,哈希表依赖于哈希值存储,通过哈希值来确定元素的位置, 而保证元素 ...
Java基础知识强化之集合框架笔记27：ArrayList集合练习之去除ArrayList集合中的重复字符串元素
1. 去除ArrayList集合中的重复字符串元素(字符串内容相同) 分析: (1)创建集合对象 (2)添加多个字符串元素(包含重复的) (3)创建新的集合 (4)遍历旧集合,获取得到每一个元素 (5 ...
Java基础知识强化之集合框架笔记07：Collection集合的遍历之迭代器遍历
1. Collection的迭代器: Iterator iterator():迭代器,集合的专用遍历方式 2. 代码示例: package cn.itcast_03; import java.util ...
Java基础知识强化之集合框架笔记05：Collection集合的遍历
1.Collection集合的遍历 Collection集合直接是不能遍历的,所以我们要间接方式才能遍历,我们知道数组Array方便实现变量,我们可以这样: 使用Object[] toArray() ...
Java基础知识强化之集合框架笔记65：Map集合之集合多层嵌套的数据分析
1. 为了更符合要求: 这次的数据就看成是学生对象. 传智播客 bj 北京校区 jc 基础班林青霞 27 风清扬 30 jy 就业班赵雅芝 28 武鑫 29 sh 上海 ...
Java基础知识强化之集合框架笔记62：Map集合之HashMap嵌套HashMap
1. HashMap嵌套HashMap 传智播客 jc 基础班陈玉楼 20 高跃 ...
Java基础知识强化之集合框架笔记04：Collection集合的基本功能测试
1. Collection集合的基本功能测试: package cn.itcast_01; import java.util.ArrayList; import java.util.Collectio ...
Java基础知识强化之集合框架笔记01：集合的由来与数组的区别
1. 集合的由来: 我们学习的是面向对象语言,而面向对象语言对事物的描述是通过对象体现的,为了方便对多个对象进行操作,我们就必须把这多个对象进行存储.而要想存储多个对象,就不能是一个基本的变量,而应该 ...

随机推荐

SQL Server学习3
SQL Server服务的管理 SQL Server服务可以提供数据的存储,处理,受控访问,是SQL Server系统最基本的服务 SQL Server Analysis Server服务为商业智 ...
java 基础 --- volatile
问题 : volatile 解决的是什么问题有什么应用场景概述某些共享变量的时候我们使用volatile 修饰,它会保证修改的值立即被更新到主存,或是从主存中获取最新的值.它的底层是如何实现的 ...
[FORWARD]ODBC 各种数据库连接串
Overview Generally, one of the first steps when you are trying to work with databases is open it. Yo ...
一图解析 React组件生命周期 (React Component Lifecycle)
React LifeCycle v1 参考官方文档作成可放大参考:https://reactjs.org/docs/react-component.html 数字补丁数字补丁数字补丁数字补丁数 ...
sql: Oracle simple example table
--Oracle 9i 实例数据脚本地址:$oracle_home/rdbms/admin/utlsampl.sql CREATE TABLE DEPT (DEPTNO NUMBER(2) CONST ...
python保存字典和读取字典pickle
import pickle import numpy as np def save_obj(obj, name): with open(name + '.pkl', 'wb') as f: pickl ...
iframe在移动端的缩放
工作中碰到个奇怪的问题,折腾了大半天,终于算是解决了,这里把分析思路和解决办法记录下. 项目是做响应式的公司官网,前期的静态图页面切完后就提交给后台作为模板使用了,我也就基本退出项目. 在后端落地时发 ...
(C# Window Service) Verify that you have sufficient privileges to start system services
写了个Windows Service, 用Wix 写了个Installer,编译通过,生成了msi 安装文件,但是安装的时候总是提示: Product: KingPro Service -- Erro ...
Change SSH Welcome Banner on Ubuntu
One of the easiest way to protect and secure SSH logins by displaying warming message to UN-authoriz ...
一步一步pwn路由器之环境搭建
前言本文由本人首发于先知安全技术社区: https://xianzhi.aliyun.com/forum/user/5274 正式进入路由器的世界了.感觉路由器这块就是固件提取,运行环境修复比 ...

Java基础知识强化之集合框架笔记77：ConcurrentHashMap之 ConcurrentHashMap的基本操作

Java基础知识强化之集合框架笔记77：ConcurrentHashMap之 ConcurrentHashMap的基本操作的更多相关文章

随机推荐

热门专题