剖析 CopyOnWriteArrayList
原文链接:https://www.changxuan.top/?p=1252
CopyOnWriteArrayList 是 JUC 中唯一一个支持并发的 List。
CopyOnWriteArrayList 的修改操作都是在底层的一个复制的数组上进行,即写时复制策略,从而实现了线程安全。其实原理和数据库的读写分离十分相似。
基本构成
底层使用数组 private transient volatile Object[] array; 来存储元素,使用 ReentrantLock 独占锁保证相关操作的安全性。
构造函数
public CopyOnWriteArrayList() {
setArray(new Object[0]);
}
// 将集合 c 内的元素复制到 list 中
public CopyOnWriteArrayList(Collection<? extends E> c) {
Object[] elements;
if (c.getClass() == CopyOnWriteArrayList.class)
elements = ((CopyOnWriteArrayList<?>)c).getArray();
else {
elements = c.toArray();
// c.toArray might (incorrectly) not return Object[] (see 6260652)
if (elements.getClass() != Object[].class)
elements = Arrays.copyOf(elements, elements.length, Object[].class);
}
setArray(elements);
}
// 创建一个内部元素是 toCopyIn 副本的 list
public CopyOnWriteArrayList(E[] toCopyIn) {
setArray(Arrays.copyOf(toCopyIn, toCopyIn.length, Object[].class));
}
添加元素
CopyOnWriteArrayList 中与添加元素相关的方法有以下几种:
- add(E e)
- add(int index, E element)
- addAll(Collection<? extends E> c)
- addAll(int index, Collection<? extends E> c)
- addIfAbsent(E e)
- addAllAbsent(Collection<? extends E> c)
鉴于原理基本相似,下面只分析 add(E e) 和 addIfAbsent(E e) 方法做为例子。
add(E e)
源码
public boolean add(E e) {
// 获取非公平的独占锁
final ReentrantLock lock = this.lock;
lock.lock();
try {
// 获取当前数组
Object[] elements = getArray();
int len = elements.length;
// 将当前数组元素拷贝至新数组
Object[] newElements = Arrays.copyOf(elements, len + 1);
newElements[len] = e;
// 使用新数组替换原有数组
setArray(newElements);
return true;
} finally {
// 释放独占锁
lock.unlock();
}
}
进入 add 方法的线程首先会去尝试获取独占锁,成功获取的线程会继续执行后续添加元素逻辑,而未获取独占锁的线程在没有异常的情况下则会阻塞挂起。等待独占锁被释放后,再次尝试获取。(ps. 在 CopyOnWriteArrayList 中使用的是 ReentrantLock 的非公平锁模式)
这样就能保证,同一时间只有一个线程进行添加元素。
addIfAbsent(E e)
源码
public boolean addIfAbsent(E e) {
// 获取当前数组
Object[] snapshot = getArray();
// 调用 indexOf 判断元素是否已存在 (遍历)
return indexOf(e, snapshot, 0, snapshot.length) >= 0 ? false :
addIfAbsent(e, snapshot);
}
private boolean addIfAbsent(E e, Object[] snapshot) {
// 获取独占锁
final ReentrantLock lock = this.lock;
lock.lock();
try {
// 再次获取当前数组
Object[] current = getArray();
int len = current.length;
// 此处判断是检查在当前线程判断元素不存在和获取独占锁之间的这段时间内是否有其它线程对数组进行了更改操作
if (snapshot != current) {
// Optimize for lost race to another addXXX operation
int common = Math.min(snapshot.length, len);
for (int i = 0; i < common; i++)
if (current[i] != snapshot[i] && eq(e, current[i]))
return false;
if (indexOf(e, current, common, len) >= 0)
return false;
}
// 与 add 方法的逻辑相同
Object[] newElements = Arrays.copyOf(current, len + 1);
newElements[len] = e;
setArray(newElements);
return true;
} finally {
lock.unlock();
}
}
如果当前数组中不存在元素 e,addIfAbsent 则会将 e 添加至数组中返回 true;如果当前数组中存在待添加元素,则会返回 false。
在 addIfAbsent 方法中为了提高性能,设计者把判断“当前数组是否存在待添加元素”和“添加元素”的操作分开了。由于前一个操作不必要获取独占锁,在遇到每次待添加的元素都已经存在于数组的情况时可以高效的返回 false 。
因为上面提到的两步操作是非原子性的,所以再第二步操作中还需要再次进行确认之前用来判断不存在元素 e 的数组是否被“掉包”了。如果被“掉包”,那么也不要“嫌弃”。就需要再判断一下“掉包”后的数组还能不能接着用。如果不能用直接返回 false,如果发现能用就继续向下执行,成功后返回 true 。
这种设计思路,在自己的业务系统中还是比较值的借鉴的。当然上述场景下“坏”的设计,就是会先尝试获取独占锁,在获取独占锁后再进行“判断元素是否存在和决定是否添加元素的操作”。这样则会导致大大增加线程阻塞挂起几率。相信大多数同学还是能写出漂亮的代码的,不至于犯这种小错误。
获取元素
获取元素一共涉及到三个方法,源码如下:
public E get(int index) {
return get(getArray(), index);
}
// 步骤一
final Object[] getArray() {
return array;
}
// 步骤二
private E get(Object[] a, int index) {
return (E) a[index];
}
我们看到获取元素的操作,全程没有加锁。并且获取元素是由两步操作组合而成的,一获取当前数组,二从当前数据中取出所指定的下标位置的元素。一旦在这两步操作之间,有其它线程更改了 index 下标位置的元素。此时,获取元素的线程所使用的数组则是被废弃掉的,它接收到的值也不是最新的值。这是写时复制策略产生的弱一致性问题。
修改元素
可以使用 set(int index, E element) 方法修改指定位置的元素。
源码
public E set(int index, E element) {
// 获取独占锁
final ReentrantLock lock = this.lock;
lock.lock();
try {
// 获取当前数组
Object[] elements = getArray();
// 获取要修改位置的元素
E oldValue = get(elements, index);
// 新值与老值是否一样
if (oldValue != element) {
int len = elements.length;
Object[] newElements = Arrays.copyOf(elements, len);
newElements[index] = element;
setArray(newElements);
} else {
// Not quite a no-op; ensures volatile write semantics
setArray(elements);
}
return oldValue;
} finally {
lock.unlock();
}
}
可以看到,在代码中并没有显示的判断 index 是否合法,如果不合法则会抛出 IndexOutOfBoundsException 异常。
主要逻辑也是先尝试获取独占锁,符合条件则进行修改。需要注意的一点是,如果指定索引处的元素值与新值相等,也会调用 setArray(Object[] a) 一次方法,这主要是为了保证 volatile 语义。(线程在写入 volatile 变量时,不会把值缓存在寄存器或者其它地方,而是会把值刷回到主内存,确保内存可见性)
删除元素
删除元素的方法包括:
- E remove(int index)
- boolean remove(Object o)
- boolean removeAll(Collection<?> c)
我们来看下 remove(int index) 的实现,
源码
public E remove(int index) {
// 获取独占锁
final ReentrantLock lock = this.lock;
lock.lock();
try {
// 获取当前数据
Object[] elements = getArray();
int len = elements.length;
// 获取要被删除的元素
E oldValue = get(elements, index);
// 计算要移动的位置
int numMoved = len - index - 1;
if (numMoved == 0)
// 删除最后一个元素
setArray(Arrays.copyOf(elements, len - 1));
else {
Object[] newElements = new Object[len - 1];
// 复制被删除元素之前的所有元素到新数组
System.arraycopy(elements, 0, newElements, 0, index);
// 复制被删除元素之后的所有元素到新数组
System.arraycopy(elements, index + 1, newElements, index,
numMoved);
// 设置新数组
setArray(newElements);
}
return oldValue;
} finally {
lock.unlock();
}
}
其实代码逻辑很清楚,获取锁后根据情况复制老数组中的未删除数据到新数组即可。
迭代器
不知道大家有没有在遍历 ArrayList 变量的过程中想没想过删除其中的某个元素?反正我曾经这么写过,然后就出现了问题 ... 后来使用了 ArrayList 的迭代器之后就没有错误了。
在 CopyOnWriteArrayList 中也有迭代器,但是也存在着弱一致性问题
源码
public Iterator<E> iterator() {
return new COWIterator<E>(getArray(), 0);
}
static final class COWIterator<E> implements ListIterator<E> {
/** Snapshot of the array 数组的快照版本 */
private final Object[] snapshot;
/** Index of element to be returned by subsequent call to next. */
private int cursor;
// 构造函数
private COWIterator(Object[] elements, int initialCursor) {
cursor = initialCursor;
snapshot = elements;
}
// 是否结束
public boolean hasNext() {
return cursor < snapshot.length;
}
public boolean hasPrevious() {
return cursor > 0;
}
// 获取元素
public E next() {
if (! hasNext())
throw new NoSuchElementException();
return (E) snapshot[cursor++];
}
... ...
public int nextIndex() {
return cursor;
}
public int previousIndex() {
return cursor-1;
}
public void remove() {
throw new UnsupportedOperationException();
}
public void set(E e) {
throw new UnsupportedOperationException();
}
public void add(E e) {
throw new UnsupportedOperationException();
}
... ...
}
可以看到,CopyOnWriteArrayList 的迭代器并不支持 remove 操作。在调用 iterator() 方法时获取了一份当前数组的快照,如果在遍历期间并没有其它线程对数据做更改操作就不会出现一致性的问题。一旦有其它线程对数据更改后,将 CopyOnWriteArrayList 中的数组更改为了新数组,此时迭代器所持有的数据就相当于快照了,同时也出现了弱一致性问题。
拓展延申
还记得刚刚提到的 addIfAbsent 方法吗?看到它你有没有联想到什么东西呢?集合 set?
对的,通过 addIfAbsent 方法也能实现集合的功能,CopyOnWriteArraySet 的底层就是使用 CopyOnWriteArrayList 实现的。(PS. HasSet 的底层依赖 HashMap 。)
剖析 CopyOnWriteArrayList的更多相关文章
- 并发编程之 CopyOnWriteArrayList 源码剖析
前言 ArrayList 是一个不安全的容器,在多线程调用 add 方法的时候会出现 ArrayIndexOutOfBoundsException 异常,而 Vector 虽然安全,但由于其 add ...
- MapReduce剖析笔记之二:Job提交的过程
上一节以WordCount分析了MapReduce的基本执行流程,但并没有从框架上进行分析,这一部分工作在后续慢慢补充.这一节,先剖析一下作业提交过程. 在分析之前,我们先进行一下粗略的思考,如果要我 ...
- ArrayList源码剖析
ArrayList简介 ArrayList是基于数组实现的,是一个动态数组,其容量能自动增长,类似于C语言中的动态申请内存,动态增长内存. ArrayList不是线程安全的,只能用在单线程环境下,多线 ...
- 转:【Java集合源码剖析】ArrayList源码剖析
转载请注明出处:http://blog.csdn.net/ns_code/article/details/35568011 本篇博文参加了CSDN博文大赛,如果您觉得这篇博文不错,希望您能帮我投一 ...
- CopyOnWriteArrayList你都不知道,怎么拿offer?
前言 只有光头才能变强 前一阵子写过一篇COW(Copy On Write)文章,结果阅读量很低啊...COW奶牛!Copy On Write机制了解一下 可能大家对这个技术比较陌生吧,但这项技术是挺 ...
- Spark源码剖析 - SparkContext的初始化(三)_创建并初始化Spark UI
3. 创建并初始化Spark UI 任何系统都需要提供监控功能,用浏览器能访问具有样式及布局并提供丰富监控数据的页面无疑是一种简单.高效的方式.SparkUI就是这样的服务. 在大型分布式系统中,采用 ...
- 并发编程之 ConcurrentLinkedQueue 源码剖析
前言 今天我们继续分析 java 并发包的源码,今天的主角是谁呢?ConcurrentLinkedQueue,上次我们分析了并发下 ArrayList 的替代 CopyOnWriteArrayList ...
- 【Java集合源代码剖析】ArrayList源代码剖析
版权声明:本文为博主原创文章,未经博主同意不得转载. https://blog.csdn.net/mmc_maodun/article/details/35568011 转载请注明出处:http:// ...
- 性能测试工具 nGrinder 项目剖析及二次开发
转:https://testerhome.com/topics/4225 0.背景 组内需要一款轻量级的性能测试工具,之前考虑过LR(太笨重,单实例,当然它的地位是不容置疑的),阿里云的PTS(htt ...
随机推荐
- [leetcode]64Minimum Path Sum 动态规划
/** * Given a m x n grid filled with non-negative numbers, * find a path from top left to bottom rig ...
- [leetcode350]Intersection of Two Arrays II求数组交集
List<Integer> res = new ArrayList<>(); Arrays.sort(nums1); Arrays.sort(nums2); int i1 = ...
- 循序渐进VUE+Element 前端应用开发(31)--- 系统的日志管理,包括登录日志、接口访问日志、实体变化历史日志
在一个系统的权限管理模块中,一般都需要跟踪一些具体的日志,ABP框架的系统的日志管理,包括登录日志.接口访问日志.实体变化历史日志,本篇随笔介绍ABP框架中这些日志的管理和界面处理. 1.系统登录日志 ...
- (转) MySQL常用Json函数
原文:http://www.cnblogs.com/waterystone/p/5626098.html 官方文档:JSON Functions Name Description JSON_APPEN ...
- GitHub上的开源复刻:暗黑破坏神2
现在的00后少年可能已经不太了解<暗黑破坏神2>这款由暴雪打造的经典游戏. 该游戏上市的时候,国内个人家用电脑还没有那么普及,网络游戏也没有那么风靡,现在的孩子可能无法想象,那时候网吧里的 ...
- cornerstoneTools 作用,用法,api使用心得
一.cornerstoneTools的用途 1.作用可以响应一些事件,例如鼠标按下的事件,鼠标滚轮的事件或按键或触摸事件 2.可以对视口进行缩放平移 3.可以在图像上绘制图形 4.可以在图像上绘制文本 ...
- i5 11300H 怎么样 相当于什么水平
i5-11300H 为 4 核 8 线程,主频 3.1GHz,睿频 4.4GHz,三级缓存 8MBi5-11300H 怎么样看完你就知道了 https://list.jd.com/list.html?
- Netty学习之IO模型
目录 1.1 同步.异步.阻塞.非阻塞 同步 VS 异步 同步 异步 阻塞 VS 非阻塞 阻塞 非阻塞 举例 ...
- NOIP初赛篇——06数制转换
进位计数制的基本概念 将数字符号按顺序排列成数位,并遵照某种由低到高的进位方式计数表示数值的方法,称作为计数制. 十进制 十进制计数制由0.1.2.3.4.5.6.7.8.9共10个数字符号组成. ...
- mysql 应用 持续更新
1.安装方法 贴出,my.ini # MySQL Server Instance Configuration File # -------------------------------------- ...