列表对于日常开发来说实在是太常见了,以至于很多开发者习惯性的用到数组,就来一个ArrayList,根本不做过多的思考。其实列表里面还是有很多玩法的,有时候玩不好,搞出来bug还得定位半天。所以这里就再啰嗦一下,整理下相关的内容。

基础知识

一般计算机相关的专业都应该学过数据结构,而很多的集合都是应用了经典的数据结构设计的。比如数组、栈、队列、链表、树等等,里面也会用到很多常见的查找或者排序算法,所以就先简单的回顾下。

数组

数组在c语言里面用的很广泛,刚开始学习的时候,整天的空指针和数组越界。后来使用java,开始使用一些集合框架,基本都不用担心这个问题了。

简单的说,数组就是内存中的一段连续的空间,它对于随机访问或者针对某个索引的修改特别快,因为直接可以根据下标索引访问。不过针对于在指定位置插入节点或者删除指定位置的元素,会很慢,因为它会导致后面所有的元素都要移动一次空间。

栈是一种先进后出,或者叫做后进先出的数据结构。比如我们在做数学公式计算的时候,就可以用栈保存,并进行相关的计算。另外,在java中栈的应用也很广,比如程序栈就是通过栈的方式存储的。

public void a(){ b();}
public void b(){ c();}
public void c(){}

那么在代码执行的时候,程序栈里面会记录:

a,b,c

这也是为什么一个方法出错,错误堆栈会打印出一大串的类名和方法名。如果了解这个知识点,对于看懂错误日志就很轻松了。

队列

队列一般都是特定的业务场景才需要使用,比如某个网站的排队功能或者是一些叫号功能,都是队列的机制。

链表

链表有很多种,有单向链表、双向链表、循环链表...每个都有不同的使用场景。在java中有一些复杂的集合类,就用到了链表,比如HashMap、HashTable、LinkedList等等,这个后面慢慢再说。

Java中的列表

ArrayList

这个是日常开发应用最广泛的List集合类了,如果不是有特殊要求,基本上这个类就能满足大部分的需求。不过它还是有很多需要注意的点,比如:

  • 非线程安全
  • 自动扩容
  • 适合场景

非线程安全

这个在javadoc上很明显的强调过,如果想要线程安全,可以使用Collections.synchronizedList进行包装,这个synchronizedList其实就是外面套了一层方法,具体的可以参考下面的简约代码:

static class SynchronizedList<E> ... {
final Collection<E> c;
final Object mutex;
public boolean add(E e) {
synchronized (mutex) {return c.add(e);}
}
...
}

看到这里应该就了解它的线程安全方法了。

另外也可以使用Vector代替ArrayList,Vector是在方法上做的同步,相对来说要比上面更乐观一点。

最后还有一些高级的集合,比如CopyOnWriteArrayList,这个就更乐观了,之后再详细说。

自动扩容

在添加元素的时候,list会检查当前的容量是否已经满:

public boolean add(E e) {
ensureCapacityInternal(size + 1); // Increments modCount!!
elementData[size++] = e;
return true;
}
private void ensureCapacityInternal(int minCapacity) {
if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
} ensureExplicitCapacity(minCapacity);
}
private void ensureExplicitCapacity(int minCapacity) {
modCount++; // overflow-conscious code
if (minCapacity - elementData.length > 0)
grow(minCapacity);
}
private void grow(int minCapacity) {
// overflow-conscious code
int oldCapacity = elementData.length;
int newCapacity = oldCapacity + (oldCapacity >> 1);
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
// minCapacity is usually close to size, so this is a win:
elementData = Arrays.copyOf(elementData, newCapacity);
}

大致的流程是:

  1. 先判断当前容量和插入后的容量大小
  2. 如果容量不够,则增加当前容量*50%,即一半的大小
  3. 最后把数据增加到末尾

删除的时候,是直接移动删除位置以及后面的元素,然后把最后一个元素赋空:

public E remove(int index) {
rangeCheck(index); modCount++;
E oldValue = elementData(index); int numMoved = size - index - 1;
if (numMoved > 0)
System.arraycopy(elementData, index+1, elementData, index,numMoved);
elementData[--size] = null; // clear to let GC do its work return oldValue;
}

modCount

很多的集合类都有一个modCount,在很多新增、修改、删除的方法中,都会对这个变量modCount++,他有什么作用?

因为很多集合都可以通过iterable来访问,这时候相当于list的快照,此时是不能修改列表元素的,不然会报错。这个modCount就是用来判断是否有修改的。

大概看下代码:

public Iterator<E> iterator() {
return new Itr();
}
private class Itr implements Iterator<E> {
...
int expectedModCount = modCount;
...
@SuppressWarnings("unchecked")
public E next() {
checkForComodification();
...
}
final void checkForComodification() {
if (modCount != expectedModCount)
throw new ConcurrentModificationException();
}
}

适用的场景

因此,ArrayList适合大量随机读取和修改的场景,不太适合频繁删除和指定位置插入的场景。

LinkedList

LinkedList是基于链表的列表,因此具有删除节点新增节点很快的特性。可以简单看下它的内部结构:

public class LinkedList<E>
extends AbstractSequentialList<E>
implements List<E>, Deque<E>, Cloneable, java.io.Serializable{
transient int size = 0;
transient Node<E> first;
transient Node<E> last; ...
private static class Node<E> {
E item;
Node<E> next;
Node<E> prev; Node(Node<E> prev, E element, Node<E> next) {
this.item = element;
this.next = next;
this.prev = prev;
}
}
}

通过接口的声明,可以看出它的几个特性:

  1. 可以当作队列使用Deque,提供push,pop,offer,peek,poll等方法
  2. 支持序列化,内部使用transient修饰,自定义了序列化和反序列化的方法,节省空间
  3. 内部是一个静态内部类的Node节点

静态内部类和非静态内部类,有什么不同?1 静态内部类不需要外部的引用;非静态内部类需要。2 静态内部类只能访问外部类的静态成员,非静态内部类则没有限制。3 静态内部类可以独立创建,非静态内部类总不能。

它的新增和删除就是简单的列表操作了,没什么太要强调的:

public boolean add(E e) {
linkLast(e);
return true;
}
void linkLast(E e) {
final Node<E> l = last;
final Node<E> newNode = new Node<>(l, e, null);
last = newNode;
if (l == null)
first = newNode;
else
l.next = newNode;
size++;
modCount++;
}

注意双向链表,在更新的时候是要考虑三个节点的关联关系的。

删除的时候比较复杂,如果直接删除某个对象,则是对比数值进行删除:

public boolean remove(Object o) {
if (o == null) {
for (Node<E> x = first; x != null; x = x.next) {
if (x.item == null) {
unlink(x);
return true;
}
}
} else {
for (Node<E> x = first; x != null; x = x.next) {
if (o.equals(x.item)) {
unlink(x);
return true;
}
}
}
return false;
}

如果是删除指定的位置,则需要判断改位置是离first最近,还是last最近,然后分别进行扫描:

public E remove(int index) {
checkElementIndex(index);
return unlink(node(index));
}

查询指定位置的元素:

Node<E> node(int index) {
// assert isElementIndex(index); if (index < (size >> 1)) {
Node<E> x = first;
for (int i = 0; i < index; i++)
x = x.next;
return x;
} else {
Node<E> x = last;
for (int i = size - 1; i > index; i--)
x = x.prev;
return x;
}
}

移除对应的元素:

E unlink(Node<E> x) {
// assert x != null;
final E element = x.item;
final Node<E> next = x.next;
final Node<E> prev = x.prev; if (prev == null) {
first = next;
} else {
prev.next = next;
x.prev = null;
} if (next == null) {
last = prev;
} else {
next.prev = prev;
x.next = null;
} x.item = null;
size--;
modCount++;
return element;
}

Vector

Vector根ArrayList很像,只不过他是线程安全的

public synchronized boolean add(E e) {}
public synchronized boolean removeElement(Object obj) {}
...

并且扩容的时候,如果没有自己设置扩容的步长,就会扩大一倍

private void grow(int minCapacity) {
// overflow-conscious code
int oldCapacity = elementData.length;
int newCapacity = oldCapacity + ((capacityIncrement > 0) ?
capacityIncrement : oldCapacity);
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
elementData = Arrays.copyOf(elementData, newCapacity);
}

Stack

这个是继承于Vector的方法,提供了基本的堆栈功能。同时他也是线程安全的。

程序猿的日常——Java中的集合列表的更多相关文章

  1. 程序猿的日常——Java基础之clone、序列化、字符串、数组

    其实Java还有很多其他的基础知识,在日常工作技术撕逼中也是经常被讨论的问题. 深克隆与浅克隆 在Java中创建对象有两种方式: 一种是new操作符,它创建了一个新的对象,并把对应的各个字段初始化成默 ...

  2. 程序猿的日常——Java基础之equals与hashCode

    equals和hashCode是我们日常开发最常使用的方法,但是因为一般都使用默认的规则,因此也很少会引起关注.不过了解他们的用途和设计的原则,还是会帮助我们更好的设计代码. equals equal ...

  3. 程序猿的日常——Java基础之抽象类与接口、枚举、泛型

    再次回顾这些基础内容,发现自己理解的又多了一点.对于一些之前很模糊的概念,渐渐的清晰起来. 抽象类与接口 抽象类通常是描述一些对象的通用方法和属性,并且默认实现一些功能,它不能被实例化.接口仅仅是描述 ...

  4. 程序猿的日常——工作中常用的Shell脚本

    工作当中总是会有很多常用的linux或者命令,这里就做一个总结 文件远程拷贝 如果想把文件从本机拷贝到远程,或者从远程下载文件到本地. # 把本地的jar拷贝到远程机器xxxip的/home/sour ...

  5. Java中的集合(七)双列集合顶层接口------Map接口架构

    Java中的集合(七)双列集合顶层接口------Map接口 一.Map接口的简介 通过List接口,我们知道List接口下的集合是单列集合,数据存储是单列的结构.Map接口下是一个键值对(key-v ...

  6. JAVA中的集合容器操作类

    目录 JAVA中的集合容器操作类 List集合 ArrayList的操作方法说明 LinkedList Stack Set Map Queue 总结 JAVA中的集合容器操作类 Java容器类库总共分 ...

  7. Java中的集合框架-Map

    前两篇<Java中的集合框架-Commection(一)>和<Java中的集合框架-Commection(二)>把集合框架中的Collection开发常用知识点作了一下记录,从 ...

  8. Java中的集合框架-Collection(二)

    上一篇<Java中的集合框架-Collection(一)>把Java集合框架中的Collection与List及其常用实现类的功能大致记录了一下,本篇接着记录Collection的另一个子 ...

  9. Java中的集合和常用类

    Java中的常用类: ▪ Object类 ▪ Math类 ▪ String类和StringBuffer类(字符串) ▪ 8种基本类型所对应的包装类 ▪ java.util包中的类——Date类 Obj ...

随机推荐

  1. Jfinal启动原理及源码简析

    以下所有源码只截取了部分代码,标题即为类名 1.Web.xml <filter-name>jfinal</filter-name> <filter-class>co ...

  2. 使用SSH快速下载Git项目

    文章首发于[博客园-陈树义],点击跳转到原文使用SSH快速下载Git项目. Git下载项目的几种方式 Git是常用的代码版本技术,而GitLab则是开源的Git版本管理软件,GitLab是最受欢迎的版 ...

  3. PHP面向对象-----魔术方法

    PHP面向对象-----魔术方法 __get($name)--触发时机:当调用一个不访问的成员属性的时候,会自动触发,可以利用这个方法来完成对不可调用的属性进行调用,但是不能设置值 ___set($n ...

  4. 怎么配置Jupyter Notebook默认启动目录?

    前言 系统环境:win10 x64:跟环境也没啥关系,在LInux下也一样... 前段时间重换了系统后,发现Jupyter Notebook的默认启动目录不太对呀,所以,就翻到了以前的笔记,还是记在这 ...

  5. oralce11g导出dmp然后导入Oracle10g

    一次Oracle11g数据库导入 Oracle10g数据库操作笔记 11g备份导入10g的时候会抛错直接阻止导入. 但是有时候还必须得把11g的数据库导入到10g我今天就遇到了这种情况. 一开始 ...

  6. Zookeeper 集群安装

    负载均衡(Load Balance)是分布式系统架构设计中必须考虑的因素之一,它通常是指,将请求/数据[均匀]分摊到多个操作单元上执行,负载均衡的关键在于[均匀].常见互联网分布式架构如上,分为客户端 ...

  7. 基于跳跃表的 ConcurrentSkipListMap 内部实现(Java 8)

    我们知道 HashMap 是一种键值对形式的数据存储容器,但是它有一个缺点是,元素内部无序.由于它内部根据键的 hash 值取模表容量来得到元素的存储位置,所以整体上说 HashMap 是无序的一种容 ...

  8. 《Deep Learning》译文 第一章 前言(中) 神经网络的变迁与称谓的更迭

    转载请注明出处. 第一章 前言(中) 1.1 本书适合哪些人阅读? 能够说本书的受众目标比較广泛,可是本书可能更适合于例如以下的两类人群.一类是学习过与机器学习相关课程的大学生们(本科生或者研究生). ...

  9. xml概述(1)

    本节要点: 标记语言的定义 XML简介 XML与HTML 比较 XML与数据库比较 XML的特点 XML结构 1 标记语言的定义 "XML.SGML.HTML"中的"ML ...

  10. 腾讯云数据库团队:MySQL语句复制(SBR)的缺陷列举

    作者介绍: 赵伟 腾讯云TDSQL数据库开发者 MySQL (这里的MySQL是指广义的mysql,包括oracle,mysql,percona,mariadb等)的Statement Based R ...