并发容器

一、写时复制的List和Set

CopyOnWrite即写时复制,或称写时拷贝,是解决并发问题的一种重要思路。

一)CopyOnWriteArrayList

该类实现了List接口,它的用法与其他List基本一样。其特点如下:

1)它是线程安全的

2)它的迭代器不支持修改操作,但也不会抛出ConcurrentModificationException

3)它以原子方式支持一些复合操作,该类支持的两个原子方法:

//不存在才添加,添加成功返回true,否则返回false
public boolean addIfAbsent(E e)
//批量添加c集合中的非重复元素,不存在才添加,返回实际添加个数
public int addAllAbsent(Collection<? extends E> c)

CopyOnWriteArrayList的内部也是一个数组,但这个数组是以原子方式被整体更新的。

每次修改操作,都会新键一个数组,复制原数组的内容到新数组,在新数组上进行需要

的修改,然后以原子的方式设置内部数组的引用,这就是写时复制。

所有的读操作,都是先拿到当前引用的数组,然后直接访问该数组,在读的过程中可能

内部数组的引用已经被修改,但这不会影响读操作,它依旧访问原数组内容。

换句话说,数组内容都是只读的,写操作都是通过新键数组,然后原子性地修改数组

引用来实现的。内部数组声明为:

//声明为volatile保证内存可见性
private volatile transient Object[] array;

访问/设置该数组的方法:

final Object[] getArray() {
return array;
}
final void setArray(Object[] a) {
array = a;
}

读不需要锁,可以并行,但写需要锁。CopyOnWriteArrayList内部使用ReentrantLock:

transient final ReentrantLock lock = new ReentrantLock();

默认构造方法:

public CopyOnWriteArrayList() {
setArray(new Object[0]);
}
//add方法:
public boolean add(E e) {
final ReentrantLock lock = this.lock;
lock.lock();
try {
Object[] elements = getArray();
int len = elements.length;
Object[] newElements = Arrays.copyOf(elements, len + 1);
newElements[len] = e;
setArray(newElements);
return true;
} finally {
lock.unlock();
}
}

每次修改都要创建一个新的数组,然后复制所有的内容,这听上去是一个难以让人接受的方案,

如果数组较大,修改操作又比较频繁,可以想象,CopyOnWriteArrayList性能是很低的。事实

确实如此,CopyOnWriteArrayList不适用于数组很大且修改频繁的场景。它是以优化读为目标

的,读不需要同步性能很高,但这牺牲了写的性能。

之前介绍了保证线程安全的两种思路:一种是锁,使用synchronized或ReentrantLock;

另一种是循环CAS。写时复制是不同与这两种的另一种思路:写时复制通过复制资源减少

冲突。对于读远远多于写的场景,是一种很好的解决方案。

写时复制是一种重要的思维,用于各种计算机程序中,比如操作系统内部的进程管理和内存管理。

二)CopyOnWriteSet

该类内部是通过CopyOnWriteArrayList实现的:

private final CopyOnWriteArrayList<E> al;

在构造方法中被初始化:

public CopyOnWriteArraySet() {
al = new CopyOnWriteArrayList<E>();
}

其add方法为:

public boolean add(E e) {
return al.addIfAbsent(e);
}

其适用场景类似于CopyOnWriteArrayList

二、ConcurrentHashMap

与HashMap相比,它有如下特点:

1)并发安全

2)直接支持一些原子复合操作

3)支持高并发,读操作完全并行,写操作支持一定程度并行

4)迭代不用加锁,不会抛出异常

5)弱一致性

一)并发安全

HashMap不是并发安全的,在并发更新的情况下,HashMap可能会出现死循环,占满CPU。

public static void unsafeConcurrentUpdate() {
final Map<Integer, Integer> map = new HashMap<Integer, Integer>();
for(int i = 0; i < 1000; i++) {
Thread t = new Thread() {
Random rnd = new Random();
@Override
public void run() {
for(int i = 0; i < 1000; i++) {
map.put(rnd.nextInt(), 1);
}
}
};
t.start();
}
}

解决办法:使用ConcurrentHashMap

二)原子复合操作

除了map接口,ConcurrentHashMap还实现了一个接口ConcurrentMap接口:

public interface ConcurrentMap<K, V> extends Map<K, V> {
//条件更新,如果没有key,更新。
V putIfAbsent(K key, V value);
//条件删除:如果map中有key且对应的值为value,则删除,删除成功返回true.
boolean remove(Object key, Object value);
//条件替换
boolean replace(K key, V oldValue, V newValue);
//条件替换
V replace(K key, V value);
}

三)高并发的基本机制

在Java7中,主要使用了

1.分段锁 

将数据分为多个段,而每个段都有独立的锁。每一个段相当于一个独立的哈希表,

分段依据也是哈希值,无论是保存键值对还是根据键查找,都先根据键的哈希值

映射到段,再在对应的段上进行操作。

采用分段锁技术可以大大地提高并发度,多个段之间可以并行读写。

//concurrencyLevel表示估计更新的线程数
public ConcurrentHashMap(int initialCapacity, float loadFactor, int concurrencyLevel)

2.读不需要锁 

多个读可以并行,写的同时也可以读。

三)迭代安全

ConcurrentHashMap,在迭代过程中,如果另一个线程对容器进行了修改,迭代会继续,不会抛异常。

public static void test() {
final ConcurrentHashMap<String, String> map = new ConcurrentHashMap<>();
map.put("a", "apple");
map.put("b", "banana");
Thread t1 = new Thread() {
@Override
public void run() {
for (Map.Entry<String, String> entry : map.entrySet()) {
try {
Thread.sleep(1000);
} catch (Exception e) {
e.printStackTrace();
}
System.out.println(entry.getKey() + " : " + entry.getValue());
/*a : apple
b : banana
c : cee*/
}
}
};
t1.start();
//确保t1启动
try {
Thread.sleep(100);
} catch (Exception e) {
e.printStackTrace();
}
map.put("c", "cee");
}
public static void test() {
final ConcurrentHashMap<String, String> map = new ConcurrentHashMap<>();
map.put("a", "apple");
map.put("b", "banana");
Thread t1 = new Thread() {
@Override
public void run() {
for (Map.Entry<String, String> entry : map.entrySet()) {
try {
Thread.sleep(1000);
} catch (Exception e) {
e.printStackTrace();
}
System.out.println(entry.getKey() + " : " + entry.getValue());
/*a : apple
b : banana
c : cee*/
}
}
};
t1.start();
//确保t1启动
try {
Thread.sleep(100);
} catch (Exception e) {
e.printStackTrace();
}
map.put("c", "cee");
//如果将语句改为;输出为:
/*a : apple
b : banana*/
//这叫弱一致性
}

四)弱一致性

如果在遍历的过程中,内部元素发生变化,如果变化发生在已经遍历的部分,

迭代器就不会反应出来,变化发生在未遍历的部分,迭代器就会发现并反应

出来,这就是弱一致性。这种情况还出现在ConcurrentHashMap另外一个方法:

public void putAll(Map<? extends K, ? extends V> m)

该方法并非原子操作,而是调用put方法逐个元素进行添加。

三)基于跳表的Map和Set

Java并发包中的TreeMap/TreeSet对应的版本是ConcurrentSkipListMap和ConcurrentSkipListSet

一)基本概念

ConcurrentSkipListSet是基于ConcurrentSkipListMap实现的。

ConcurrentSkipListMap特点:

1)没有使用锁,所以操作都是无阻塞的,所以操作都可以并行,包括写,多线程可以同时写。

2)迭代器不会抛出异常,是弱一致性的

3)支持一些原子复合操作

4)可排序,默认按键的自然顺序,可传递比较器自定义。

示例代码:

Map<String, String> map = new ConcurrentSkipListMap<>();
map.put("c", "call");
map.put("a", "apple");
map.put("b", "banana");
System.out.println(map.toString()); //{a=apple, b=banana, c=call}

需要说明的是ConcurrentSkipListMap的size方法,与大多数容器实现不同,这个方法不是常量操作,

它需要遍历所有元素,复杂度为O(N),而且遍历结束后,元素个数已经改变。一般而言,在并发应用

中,这个方法用处不大。

二)基本实现原理

跳表是基于链表的,在链表的基础上加了多层索引结构。

例如,假如容器中包含如下元素:3, 6, 7, 9, 12, 17, 19, 21, 25, 26

对于一个Map来说,这些值可以视为键。ConcurrentSkipListMap会构造类似

下图的跳表结构:

这个链表是有序的,但与数组不同,链表不能根据索引直接定位,不能进行

二分查找。

在该结构中,高层的索引节点一定同时是底层的索引节点。

大致上第一层是基本链表的1/2,第二层是第一层的1/2。

每个索引节点有两个指针一个向右,一个向下。

有了这个结构,就可以实现类似二分查找了。查找元素总是从最高层

开始,将待查值与下一个索引节点的值进行比较,如果大于索引节点

就向右移动,继续比较,如果小于节点则移入下一层进行比较。如图

展示了查找19和8的过程:

这个结构是有序的,查找性能与二叉树类似。这个结构是在更新的过程中保持的,

保存元素的基本思路是:

1)先在基本链表找到插入位置,插入基本链表;

2)更新索引层

对于索引的更新:随机计算一个数,表示为该元素最高建几层的索引,一层的概率为1/2,二层为1/4,以此类推。

然后从最高层到最低层,在每一层为该元素建立索引节点,建立索引的位置也是先查找位置再插入。

对于删除元素,ConcurrentSkipListMap不是直接进行真正的删除,而是为了避免冲突,有一个复杂的标记过程,

在内部遍历元素的过程中进行真正的删除。

总结:ConcurrentSkipListMap/ConcurrentSkipListSet基于跳表实现,

有序,无锁,非阻塞,完全并行,主要操作复杂度为0(log(N))。

三、并发队列

Java并发包提供了丰富的队列,可以简单地分为如下几种:

1.无锁非阻塞并发队列:ConcurrentLinkedQueue和ConcurrentLinkedDueue. 

它们适用于多个线程并发使用一个队列的的场合,都是基于链表实现,都没有大小

限制,是无解的。size方法不是一个常量运算。这两个类最基础的原理是循环CAS。

2.普通阻塞队列:基于数组的ArrayBlockingQueue,基于链表的LinkedBlockingQueue和LinkedBlockingDeque. 

它们都实现了BlockingQueue接口:

//入队,如果队列满,等待直到队列有空间
void put(E e) throws InterruptedException;
//出队,如果队列空,等待直到队列不为空,返回头部元素
E take() throws InterruptedException;
//入队,如果队列满,最多等待指定时间,如果超时还是满,返回false
boolean offer(E e, long timeout, TimeUnit unit) throws InterruptedException;
//出队
E poll(long timeout, TimeUnit unit) throws InterruptedException;

特别需要注意的是,ArrayBlockingQueue是有界的,创建时指定大小,且在运行的过程中不会改变,这与ArrayDeque不同。

在内部它们都是通过显式锁和显式条件实现的。

3.优先级阻塞队列:PriorityBlockingQueue. 

基本实现原理与PriorityQueue类似,基于堆。但它实现了BlockingQueue接口,是阻塞的。

4.延时阻塞队列:DelayQueue 

它要求每个元素都实现Delayed接口,接口声明为:

public interface Delayed extends Comparable<Delayed> {
//返回一个给定的时间单位unit整数,表示再延长多长时间,小等于0表示不再延长
long getDelay(TimeUnit unit);
}

该类用于实现定时任务,它按元素的延时时间出队,只有当元素的延时过期之后才能被队列拿走,

也就是说take方法总是返回第一个过期的元素,如果没有则阻塞等待。  

5.其他阻塞队列SynchronousQueue 和 LinkedTransferQueue

Java笔记(十六)并发容器的更多相关文章

  1. Java笔记(十六)……内部类

    内部类概述 内部类是将一个类定义在另一个类里面,对里面那个类就成为内部类(内部类,嵌套类). 当描述事物时,事物的内部还有事物,该事物用内部类来描述,因为内部事物在使用外部事物的内容 访问特点 内部类 ...

  2. python3.4学习笔记(十六) windows下面安装easy_install和pip教程

    python3.4学习笔记(十六) windows下面安装easy_install和pip教程 easy_install和pip都是用来下载安装Python一个公共资源库PyPI的相关资源包的 首先安 ...

  3. “全栈2019”Java第九十六章:抽象局部内部类详解

    难度 初级 学习时间 10分钟 适合人群 零基础 开发语言 Java 开发环境 JDK v11 IntelliJ IDEA v2018.3 文章原文链接 "全栈2019"Java第 ...

  4. “全栈2019”Java第二十六章:流程控制语句中循环语句do-while

    难度 初级 学习时间 10分钟 适合人群 零基础 开发语言 Java 开发环境 JDK v11 IntelliJ IDEA v2018.3 文章原文链接 "全栈2019"Java第 ...

  5. “全栈2019”Java第十六章:下划线在数字中的意义

    难度 初级 学习时间 10分钟 适合人群 零基础 开发语言 Java 开发环境 JDK v11 IntelliJ IDEA v2018.3 文章原文链接 "全栈2019"Java第 ...

  6. Java进阶知识点:并发容器背后的设计理念

    一.背景 容器是Java编程中使用频率很高的组件,但Java默认提供的基本容器(ArrayList,HashMap等)均不是线程安全的.当容器和多线程并发编程相遇时,程序员又该何去何从呢? 通常有两种 ...

  7. (C/C++学习笔记) 十六. 预处理

    十六. 预处理 ● 关键字typeof 作用: 为一个已有的数据类型起一个或多个别名(alias), 从而增加了代码的可读性. typedef known_type_name new_type_nam ...

  8. Java基础学习笔记十六 集合框架(二)

    List List接口的特点: 它是一个元素存取有序的集合.例如,存元素的顺序是11.22.33.那么集合中,元素的存储就是按照11.22.33的顺序完成的. 它是一个带有索引的集合,通过索引就可以精 ...

  9. Java编程思想学习(十六) 并发编程

    线程是进程中一个任务控制流序列,由于进程的创建和销毁需要销毁大量的资源,而多个线程之间可以共享进程数据,因此多线程是并发编程的基础. 多核心CPU可以真正实现多个任务并行执行,单核心CPU程序其实不是 ...

  10. Java并发编程的艺术(十二)——并发容器和框架

    ConcurrentHashMap 为什么需要ConcurrentHashMap HashMap线程不安全,因为HashMap的Entry是以链表的形式存储的,如果多线程操作可能会形成环,那样就会死循 ...

随机推荐

  1. hdu4009最小树形图板子题

    /*调了一下午的最小树形图,昨天刚刚看懂模板..最小树形图,就是有向图的最小生成树,很神奇==*/ #include<iostream> #include<cstring> # ...

  2. python+selenium十五:CSS与Jquery

    在css中,id用#表示,class用.表示,要定位标签直接写标签名,其他属性就用[xxx='xxx'] 一.css定位 1.属性定位:可以通过任意属性定位,不局限于id.class.name.tag ...

  3. Linux系统下inode满了导致无法写文件的解决思路

    解决思路1:删除无用的临时文件,释放inode 进入/tmp目录,执行find -exec命令 find  /tmp  -type  f  -exec  rm  {}  \; 遍历寻找0字节的文件,并 ...

  4. 关于如何在Listener中注入service和ServletContextListener源码分析

      今天在做项目时突然发现我该如何向listener中注入service对象,因为监听器无法使用注解注入. 此时有人会想用以下代码通过xml的方式注入: ApplicationContext cont ...

  5. java编译通过,为什么运行却提示找不到或无法加载主类?

    java编译通过,为什么运行却提示找不到或无法加载主类? https://www.zhihu.com/question/36537093 这边提供一个关于程序中含有package关键字,使用“终端”运 ...

  6. vim设置Tab键和显示行号

    vim ~/.vimrc set nu 这样设置方便写python代码.

  7. Go之viper配置

    这个模块功能强大,读取配置,命令行,监听配置改变. 堪称多面手,在k8s,docker中,都多有应用. 这套应用,主要包括cobra,pflag,viper三件套. 了解得差不多啦...:) pack ...

  8. 一起学Hive——详解四种导入数据的方式

    在使用Hive的过程中,导入数据是必不可少的步骤,不同的数据导入方式效率也不一样,本文总结Hive四种不同的数据导入方式: 从本地文件系统导入数据 从HDFS中导入数据 从其他的Hive表中导入数据 ...

  9. nethogs命令执行报异常的解决方法

  10. 027 ResourceBundle.getBundle方法

    在程序中遇到这个,感觉会比较重要,就学习一番. 一:静态读取配置文件的Demo 1.新建工程 2.新建properties 3.新建Java的demo程序 注意不要写properties. packa ...