ArrayList和LinkedList学习
摘要
ArrayList和LinkedList是对List接口的不同数据结构的实现。它们都是线程不安全的,线程不安全往往出现在数组的扩容、数据添加的时候。
一、ArrayList和LinkedList是什么?
ArrayList:ArrayList是List接口的可变数组的实现。
LinkedList:LinkedList是List接口的(双向)链表实现。
二、两个List的数据结构
1、ArrayList的数据结构
ArrayList的类继承图如下:

(1-1:ArrayList的类继承图)
存储
ArrayList使用数组(elememntData)存储数据,默认构造方法创建ArrayList时,会初始化一个空数组。
扩容
ArrayList使用数组存储数据,因此在添加数据的时候需要做容量检查,如果容量不足则需要进行扩容。
其新容量大小公式为:新容量=旧容量+旧容量/2
扩容过程请看下面源码:
public boolean add(E e) {
    // 容量检查
    ensureCapacityInternal(size + 1);  // Increments modCount!!
    elementData[size++] = e;
    return true;
}
// 计算数组需要的最小容量
private void ensureCapacityInternal(int minCapacity) {
    if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
        minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
    }
    ensureExplicitCapacity(minCapacity);
}
// 判断是否需要扩容,如果需要则扩容
private void ensureExplicitCapacity(int minCapacity) {
    // modCount表示List结构修改的次数,快速失败机制会用到,快速失败机制在后面会详细说明。
    modCount++;
    // overflow-conscious code
    if (minCapacity - elementData.length > 0)
        grow(minCapacity);
}
private void grow(int minCapacity) {
    // overflow-conscious code
    int oldCapacity = elementData.length;
    // 新容量=旧容量+旧容量/2
    int newCapacity = oldCapacity + (oldCapacity >> 1);
    if (newCapacity - minCapacity < 0)
        newCapacity = minCapacity;
    if (newCapacity - MAX_ARRAY_SIZE > 0)
        newCapacity = hugeCapacity(minCapacity);
    // minCapacity is usually close to size, so this is a win:
    elementData = Arrays.copyOf(elementData, newCapacity);
}
(1-2:ArrayList数组扩容源码)
2、LinkedList的数据结构
LinkedList的类继承图如下:

(2-1:LinkedList的类继承图)
存储
LinkedList使用双向链表来存储数据。其中链表结点定义如下:
private static class Node<E> {
    E item;
    Node<E> next;
    Node<E> prev;
    Node(Node<E> prev, E element, Node<E> next) {
        this.item = element;
        this.next = next;
        this.prev = prev;
    }
}
(2-2:LinkedList的存储结点定义)
添加/删除元素操作
LinkedList添加删除元素,实际上就是对链表进行结点添加/删除,下面给出实现细节,以供后面的线程安全讨论使用(注意modCount发生了变化)。
// 添加元素
public boolean add(E e) {
    // 往链表末尾添加元素
    linkLast(e);
    return true;
}
// 添加结点
void linkLast(E e) {
    final Node<E> l = last;
    final Node<E> newNode = new Node<>(l, e, null);
    // 新结点作为尾结点
    last = newNode;
    if (l == null)
        first = newNode;
    else
        l.next = newNode; // 连接结点
    size++;
    modCount++;
}
// 删除元素(删除第一个匹配的元素)
public boolean remove(Object o) {
    if (o == null) {
        for (Node<E> x = first; x != null; x = x.next) {
            if (x.item == null) {
                unlink(x);
                return true;
            }
        }
    } else {
        for (Node<E> x = first; x != null; x = x.next) {
            if (o.equals(x.item)) {
                unlink(x);
                return true;
            }
        }
    }
    return false;
}
// 删除结点
E unlink(Node<E> x) {
    // assert x != null;
    final E element = x.item;
    final Node<E> next = x.next;
    final Node<E> prev = x.prev;
    if (prev == null) {
        first = next;
    } else {
        prev.next = next;
        x.prev = null;
    }
    if (next == null) {
        last = prev;
    } else {
        next.prev = prev;
        x.next = null;
    }
    x.item = null;
    size--;
    modCount++;
    return element;
}
(2-3:LinkedList添加/删除结点关键代码)
三、线程安全讨论
首先确认一点的是,ArrayList和LinkedList均是线程不安全的,下面将分析多线程情况下会出现的一些问题。
1、快速失败(fail-fast)
快速失败,指的是使用遍历器对List进行遍历时,如果在遍历过程中,对List进行了修改,则会触发快速失败机制,抛出java.util.ConcurrentModificationException异常。
快速失败触发机制
前文谈到modCount的作用用于记录List的修改次数,在遍历器进行遍历时,代码正是通过这个值触发快速失败的。
相关核心代码如下:
int expectedModCount = modCount;
public E next() {
    checkForComodification();
    try {
        int i = cursor;
        E next = get(i);
        lastRet = i;
        cursor = i + 1;
        return next;
    } catch (IndexOutOfBoundsException e) {
        checkForComodification();
        throw new NoSuchElementException();
    }
}
// 检查修改次数,该方法在类中多次会被调用
final void checkForComodification() {
    if (modCount != expectedModCount)
        throw new ConcurrentModificationException();
}
(1-1:java.util.AbstractList内部类Itr代码片段)
2、ArrayList添加元素时的数组越界问题
添加元素时的数组越界问题发生在扩容判断上,当当前数组容量还差一个元素达到数组扩容的临界值时。并发插入元素时对数组大小的判断均是无需扩容,但是当前数组实际上仅有一个空闲位置,因此数组越界异常就发生了。
3、添加元素被覆盖
这种异常出现情况如下面代码注释所示:
多个线程对数组同一个位置进行赋值,导致元素被覆盖。
elementData[size++] = e;
// elementData[size] = e;  --- thread1
// elementData[size] = e;  --- thread2
// size++; --- thread1
// size++; --- thread2
(3-1:ArrayList添加元素被覆盖)
类似的分析,LinkedList添加元素时也会出现这种情况。
4、线程安全的List
同步方法
全部使用同步方法,如:Vector、Collections.synchronizedList(list)
其它加锁
其它加锁实现线程安全,如:ConcurrentLinkedDeque(自旋+CAS)、CopyOnWriteArrayList(读写锁)
参考资料
ArrayList和LinkedList学习的更多相关文章
- JDK源代码学习-ArrayList、LinkedList、HashMap
		
ArrayList.LinkedList.HashMap是Java开发中非常常见的数据类型.它们的区别也非常明显的,在Java中也非常具有代表性.在Java中,常见的数据结构是:数组.链表,其他数据结 ...
 - java集合框架05——ArrayList和LinkedList的区别
		
前面已经学习完了List部分的源码,主要是ArrayList和LinkedList两部分内容,这一节主要总结下List部分的内容. List概括 先来回顾一下List在Collection中的的框架图 ...
 - 数组Array和列表集合ArrayList、LinkedList和Vector的区别
		
一.ArrayList和Vector的区别 ArrayList与Vector主要从以下方面来说. 1.同步性: Vector是线程安全的,也就是说是同步的,而ArrayList是线程序不安全的,不是同 ...
 - 27、ArrayList和LinkedList的区别
		
在Java的List类型集合中,ArrayList和LinkedList大概是最常用到的2个了,细看了一下它们的实现,发现区别还是很大的,这里简单的列一下个人比较关心的区别. 类声明 ArrayLis ...
 - java集合(ArrayList,Vector,LinkedList,HashSet,TreeSet的功能详解)
		
说起集合,我们会潜意识里想到另外一个与之相近的名词——数组,OK!两者确实有相似之处,但也正是这点才是我们应该注意的地方,下面简单列出了两者的区别(具体功能的不同学习这篇文章后就会明白了): 数组 长 ...
 - Java集合(六)--ArrayList、LinkedList和Vector对比
		
在前两篇博客,学习了ArrayList和LinkedList的源码,地址在这: Java集合(五)--LinkedList源码解读 Java集合(四)--基于JDK1.8的ArrayList源码解读 ...
 - Java集合源代码剖析(一)【集合框架概述、ArrayList、LinkedList、Vector】
		
Java集合框架概述 Java集合工具包位于Java.util包下.包括了非常多经常使用的数据结构,如数组.链表.栈.队列.集合.哈希表等.学习Java集合框架下大致能够分为例如以下五个部分:List ...
 - [从今天开始修炼数据结构]线性表及其实现以及实现有Itertor的ArrayList和LinkedList
		
一.线性表 1,什么是线性表 线性表就是零个或多个数据元素的有限序列.线性表中的每个元素只能有零个或一个前驱元素,零个或一个后继元素.在较复杂的线性表中,一个数据元素可以由若干个数据项组成.比如牵手排 ...
 - Java基础之 集合体系结构(Collection、List、ArrayList、LinkedList、Vector)
		
Java基础之 集合体系结构详细笔记(Collection.List.ArrayList.LinkedList.Vector) 集合是JavaSE的重要组成部分,其与数据结构的知识密切相联,集合体系就 ...
 
随机推荐
- leetcode-5-basic
			
解题思路: 设两个变量land和sink,land的值是1的数量,sink表示内部的边.result = land*4-sink*2.按行扫描得到land, 同时得到同一行中内部边的数目:然后按列扫描 ...
 - nrf开发笔记一开发软件
			
nrf52810 的开发环境,比较主流的可以使用keil,iar亦可.sdk中,使用的是pca10040e,s112.虽然开发板共用一个型号(pca10040) keil5中,cmsis 需要4.5. ...
 - 2018 Multi-University Training Contest 1 Distinct Values(set)
			
题意: t组数据,每组数据给定n,m, 表示有m个约束,每个约束包含 x,y ,代表区间 [x, y] 里的数字不能相同. 让你用所有的正整数构成一个长度为 n 的区间,使得这个区间元素顺序的字典序最 ...
 - 动态规划:Codeforces Round #427 (Div. 2) C Star sky
			
C. Star sky time limit per test2 seconds memory limit per test256 megabytes inputstandard input outp ...
 - bash函数定义/使用/传参…
			
函数:function, 功能 过程式编程,代码重用 模块化编程 简洁 语法: function f_name { ...
 - Windows下新建多级文件夹
			
使用system函数调用系统命令"md" 注意:字符串变量的话赋值时要使用双斜杠"\\": system("md C:\\newfolder\\&qu ...
 - NPM包的安装及卸载
			
NPM全名:node package manager,是node包管理工具,负责安装.卸载.更新等.新版的NodeJS已经集成了npm.所以装好NodeJS的同时,npm也已经装好了! 可以用cmd命 ...
 - 哪里是Maven的中央存储库?
			
当你建立了一个Maven工程,Maven会检查你的pom.xml文件,确定要下载的依赖.首先,Maven将从您的本地库Maven查找,如果没有找到,Maven会从中央存储库-http://repo1. ...
 - Python学习-day5 常用模块
			
day5主要是各种常用模块的学习 time &datetime模块 random os sys shutil json & picle shelve xml处理 yaml处理 conf ...
 - 九度oj 题目1085:求root(N, k)  清华2010年机试题目
			
题目描述: N<k时,root(N,k) = N,否则,root(N,k) = root(N',k).N'为N的k进制表示的各位数字之和.输入x,y,k,输出root(x^y,k)的值 (这里^ ...