业内经常说的一句话是不要重复造轮子,但是有时候,只有自己造一个轮子了,才会深刻明白什么样的轮子适合山路,什么样的轮子适合平地!

我将会持续更新java基础知识,欢迎关注。

往期章节:

JAVA基础第一章-初识java

JAVA基础第二章-java三大特性:封装、继承、多态

JAVA基础第三章-类与对象、抽象类、接口


说起集合框架,很多面试官在面试初级javaer的时候也是很喜欢问的一个知识点

我们先上一张图看看

从上面的关系图中,我们可以看到从上往下分呢~最上面的是接口,中间是抽象类,最下面就是各个具体的实现类,这个在我们上一章节中说到的抽象类与接口之间的关系的时候有提到过。

再从左往右看呢,也是大致分三块,Iterator,Collection,Map 三个最顶级的接口,但是最主要的部分还是Collection,Map 2个接口,而Iterator更多的像是附加产品。

Collection

我们先看看Collection接口,从这个接口往下,他的子接口有List、Set、Queue。

List

List的具体实现类有 ArrayList、LinkedList,Vector。

ArrayList

顾名思义,是一个“数组型”的集合,对于数组,我们应该知道的是,数组在定义的时候就确定了大小,不可更改。那优点就是数组的元素是通过索引访问的,效率较高,因为数组是一块连续的存储空间。

所以呢,ArrayList 就是在数组的基础上,增加了可以改变大小的接口(方法),如 add 、remove 等方法,方便我们去操作修改当前集合中的数据元素,当集合中新添加的数据超过了当前的存储空间大小时

会申请一个新的存储空间,然后将这些已有的数据拷贝过去,再添加新的数据 ,扩容后的集合的大小等于扩容前集合的1.5倍。

当我们删除一个元素的时候,会将当前被删除元素之后的元素统一向前移动一位,然后将最后的一位元素置为null,以便于gc回收。

所以,如果我们对一个ArrayList 有频繁的增删操作,这样对性能是一个极大的损耗。

ArrayList 的数据存储结构示意图如下:

假设上图中每一个黄色的格子都代表一个ArrayList 的存储空间

步骤1:在我们第一次调用add方法增加一个元素1的时候,那么list会直接扩容为默认的大小10,我们也可以在调用ArrayList 构造函数的时候传入参数,指定初始化空间大小;

步骤2:我们再继续添加数据,直到添加到11时,会判断当前的存储空间放不下要增加的数据了,这个时候会继续扩容,之后再放入数据11;

步骤3:在这一步,我们决定删除数据2,2的下标为1(数组的下标都是从0开始),也就是调用remove方法;

注意:当我们调用size方法获取到的是实际的存储的数据大小,而不是整个ArrayList 获得的存储空间大小,例如 ,步骤2中调用size方法返回的会是11,而不是15。

LinkedList

从这个名字上,我们也可以大概知道,link是关联的意思。LinkedList 和ArrayList 不同的一点是,他实现了Deque接口 这是一个双向链表的接口。

我们先看下存储结构示意图:

如上图中所示,每一个节点都是一个Node对象,其中每个Node都有三个属性,item 实际存储的数据元素,如上图中的绿色格子,next和prev,这样就构成了一个链表结构。

而要注意的是next 和prev 也是一个Node对象,而Node是LinkedList 中的静态内部类。如下图中代码所示:

在这个链表中还存在2个属性 first 和 last,分别用于存放整个集合链表中的头和尾,如果只有一个元素,那么first 和last就指向同一个元素。

数据的添加

当我们在链表中添加一个元素的时候,最后一个元素的null位置会设置引用新的Node节点,然后新添加的节点的prev会指向前一个元素的位置

我们从LinkedList 源码中做一些简单的分析

     /**
* Appends the specified element to the end of this list.
*
* <p>This method is equivalent to {@link #addLast}.
*
* @param e element to be appended to this list
* @return {@code true} (as specified by {@link Collection#add})
*/
public boolean add(E e) {
linkLast(e);
return true;
}

如上所示,从 “Appends the specified element to the end of this list.” 这句注释中,我们就大致可以明白其意,当我们调用add方法增加元素的时候,默认是在末尾追加数据。

这个时候add方法中会调用linkLast方法,具体代码如下:

   /**
* Links e as last element.
*/
void linkLast(E e) {
final Node<E> l = last;
final Node<E> newNode = new Node<>(l, e, null);
last = newNode;
if (l == null)
first = newNode;
else
l.next = newNode;
size++;
modCount++;
}

上述代码中,首先会将当前的last赋给l,然后新建一个Node对象,传入新添加的数据,以及将当前集合中的last赋值给新添加节点的prev属性。

然后将新建的对象赋值给last,之后再判断最开始的last,也就是当前的l是否为null,如果是null,也就代表集合是空的,这是第一个元素,那么就把它赋给frist,否则,那么就说明已经有元素存在了,让上一个元素的next指向当前新建的对象。

最后再进行调整大小等操作。

数据添加的操作示意图如下:

数据的删除

下面我们再来看一下,LinkedList 的删除操作,也就是我们默认调用remove方法。

源码如下所示:

  /**
* Retrieves and removes the head (first element) of this list.
*
* @return the head of this list
* @throws NoSuchElementException if this list is empty
* @since 1.5
*/
public E remove() {
return removeFirst();
}

同样,从“Retrieves and removes the head (first element) of this list.”注释中,我们大致可以明白,大意是检索并移除list头部的元素。

在这个方法中直接调用了removeFirst方法,下面我们看一下removeFirst代码:

    /**
* Removes and returns the first element from this list.
*
* @return the first element from this list
* @throws NoSuchElementException if this list is empty
*/
public E removeFirst() {
final Node<E> f = first;
if (f == null)
throw new NoSuchElementException();
return unlinkFirst(f);
}

如上所示,在这个代码中,直接判断是不是存在first,也就是集合是不是空的,不是那就继续调用unlinkFirst方法,

unlinkFirst代码如下所示:

   /**
* Unlinks non-null first node f.
*/
private E unlinkFirst(Node<E> f) {
// assert f == first && f != null;
final E element = f.item;
final Node<E> next = f.next;
f.item = null;
f.next = null; // help GC
first = next;
if (next == null)
last = null;
else
next.prev = null;
size--;
modCount++;
return element;
}

如上所示,从“Unlinks non-null first node f”注释中,可知,解开非空的第一个节点的关联。首先将first节点的f.item 以及f.next设置为null,以便于gc回收。在将f.next置为null之前赋值给了临时的next。

然后判断next是否为null,如果是,则说明后面没有元素了,这是集合中的唯一一个元素,将last也设置为null;否则,将next中的prev设置为null。

数据删除操作示意图如下:

所以呢,当我们对linkedList进行增删操作的时候只需要对2个节点进行修改,而对其他节点没有任何影响。

Vector

这个类和ArrayList基本相似,不同的点在于他是线程安全的,也就是在同一个时刻,只能有一个线程访问Vector;另外Vector扩容不同于ArrayList,他每次扩容默认都是按2倍,而ArrayList是1.5倍。

ArrayList、LinkedList、 Vector三者之间的异同

ArrayList与LinkedList相比查询速度快,增删速度慢。

所以如果只是查询,建议用前者,反之建议用后者,因为后者再增删的时候,只需要修改2个节点的 prev和next ,而不存在复制当前已有的元素到新的存储空间。

Vecor和ArrayList基本相似,区别是前者是线程安全的,后者不是。但是2个底层实现都是数组,LinkedList底层实现是链表。

集合的遍历

经常用到有三种方式,代码示意如下:

    /* 第一种遍历方式
for循环的遍历方式
*/
for (int i = 0; i < lists.size(); i++) {
System.out.print(lists.get(i));
} /* 第二种遍历方式
foreach的遍历方式
*/
for (Integer list : lists) {
System.out.print(list);
} /* 第三种遍历方式
Iterator的遍历方式
*/
for (Iterator<Integer> list = lists.iterator(); list.hasNext();) {
System.out.print(list.next());
}

for循环效率高于Iterator循环,高于foreach循环,因为我们都知道他们的底层实现都是数组,而for循环是通过下标查询是最适合的遍历方式; 而foreach循环是在Iterator基础上进行的,所以最慢。

另外,迭代器遍历方式, 适用于连续内存存储方式,比如数组、 ArrayList,Vector。 缺点是只能从头开始遍历, 优点是可以一边遍历一边删除。

for循环这种方式遍历比较灵活,可以指定位置开始遍历。性能最高,但有一个缺点就是遍历过程中不允许删除元素,否则会抛ConcurrentModificationException。

(注:但是曾经发现在删除倒数第2个元素的时候,并不会抛出异常,详见 记一次list循环删除元素的突发事件!

Set

Set不允许包含相同的元素,如果试图把两个值相同元素加入同一个集合中,add方法返回false。

Set判断两个对象相同不是使用==运算符,而是根据equals方法。也就是说,只要两个对象用equals方法比较返回true,Set就不会再存储第二个元素。

set的实现类有HashSet、TreeSet、LinkedHashSet

HashSet

不能保证元素的排列顺序;不是线程安全的;集合元素可以是null,但只能放入一个null,其他相同数据也只能有一份存在;

对于HashSet我们要知道的是,他是依靠HashMap中的key去维护存放的数据,所以HashSet的这些特性都是和HashMap的key相关的。

hashSet默认构造函数代码如下:

    /**
* Constructs a new, empty set; the backing <tt>HashMap</tt> instance has
* default initial capacity (16) and load factor (0.75).
*/
public HashSet() {
map = new HashMap<>();
}

如上代码所示,他是调用了HashMap的默认构造函数。

LinkedHashSet

LinkedHashSet和HashSet的区别是前者是有序的,也就是当你插入数据的时候会按顺序排放,这样我们遍历时就可以按照之前插入的顺序获取数据。

和HashSet相似也是在构造函数中调用了LinkedHashMap构造方法,代码如下所示:

   /**
* Constructs a new, empty linked hash set with the default initial
* capacity (16) and load factor (0.75).
*/
public LinkedHashSet() {
super(16, .75f, true);
}

因为LinkedHashSet继承了HashSet,所以他调用super,就是调用的HashSet的构造器,在HashSet中再调用了LinkedHashMap,代码如下所示:

  /**
* Constructs a new, empty linked hash set. (This package private
* constructor is only used by LinkedHashSet.) The backing
* HashMap instance is a LinkedHashMap with the specified initial
* capacity and the specified load factor.
*
* @param initialCapacity the initial capacity of the hash map
* @param loadFactor the load factor of the hash map
* @param dummy ignored (distinguishes this
* constructor from other int, float constructor.)
* @throws IllegalArgumentException if the initial capacity is less
* than zero, or if the load factor is nonpositive
*/
HashSet(int initialCapacity, float loadFactor, boolean dummy) {
map = new LinkedHashMap<>(initialCapacity, loadFactor);
}

TreeSet

TreeSet是SortedSet接口的唯一实现类,TreeSet可以确保集合元素处于排序状态。

TreeSet支持两种排序方式,自然排序 和定制排序,其中自然排序为默认的排序方式。向TreeSet中加入的应该是同一个类的对象。

自然排序不用多说,那定制排序的意思就是,我们可以自己通过实现Comparator接口覆写其中比较方法,然后按照我们意愿进行排序,比如自然排序是升序,我们通过覆写这个排序方法,可以修改成降序。

TreeSet带比较器的构造函数代码如下:

  /**
* Constructs a new, empty tree set, sorted according to the specified
* comparator. All elements inserted into the set must be <i>mutually
* comparable</i> by the specified comparator: {@code comparator.compare(e1,
* e2)} must not throw a {@code ClassCastException} for any elements
* {@code e1} and {@code e2} in the set. If the user attempts to add
* an element to the set that violates this constraint, the
* {@code add} call will throw a {@code ClassCastException}.
*
* @param comparator the comparator that will be used to order this set.
* If {@code null}, the {@linkplain Comparable natural
* ordering} of the elements will be used.
*/
public TreeSet(Comparator<? super E> comparator) {
this(new TreeMap<>(comparator));
}

TreeSet默认构造函数代码如下:

   /**
* Constructs a new, empty tree set, sorted according to the
* natural ordering of its elements. All elements inserted into
* the set must implement the {@link Comparable} interface.
* Furthermore, all such elements must be <i>mutually
* comparable</i>: {@code e1.compareTo(e2)} must not throw a
* {@code ClassCastException} for any elements {@code e1} and
* {@code e2} in the set. If the user attempts to add an element
* to the set that violates this constraint (for example, the user
* attempts to add a string element to a set whose elements are
* integers), the {@code add} call will throw a
* {@code ClassCastException}.
*/
public TreeSet() {
this(new TreeMap<E,Object>());
}

从上面的源码注释中,我们大致可以明白,其意是构造一个新的空的树形set,排序按照元素的自然顺序排序,所有要插入到set中的元素必须实现Comparable接口,同时,这些元素还必须是互相可以比较的。

如果使用者尝试添加一个string类型的数据到integer类型的set中,那么会抛出ClassCastException 异常。

关于Map接口,我们将在下一章节中做一个详细的分析


文中若有不正之处,欢迎批评指正!

JAVA基础第四章-集合框架Collection篇的更多相关文章

  1. JAVA基础第五章-集合框架Map篇

    业内经常说的一句话是不要重复造轮子,但是有时候,只有自己造一个轮子了,才会深刻明白什么样的轮子适合山路,什么样的轮子适合平地! 我将会持续更新java基础知识,欢迎关注. 往期章节: JAVA基础第一 ...

  2. Java基础-引用数据类型之集合(Collection)

    Java基础-引用数据类型之集合(Collection) 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.为什么出现集合类 面向对象语言对事物的体现都是以对象的形式,所以为了方便 ...

  3. Java基础知识强化之集合框架笔记76:ConcurrentHashMap之 ConcurrentHashMap简介

    1. ConcurrentHashMap简介: ConcurrentHashMap是一个线程安全的Hash Table,它的主要功能是提供了一组和Hashtable功能相同但是线程安全的方法.Conc ...

  4. Java基础知识强化之集合框架笔记13:Collection集合存储学生对象并遍历

    1. Collection集合存储学生对象并遍历: 需求:存储自定义对象并遍历Student(name,age) 分析: (1)创建学生类 (2)创建集合对象 (3)创建学生对象 (4)把学生对象添加 ...

  5. Java基础知识强化之集合框架笔记12:Collection集合存储字符串并遍历

    1.  Collection集合存储字符串并遍历 分析: (1)创建集合对象 (2)创建字符串对象 (3)把字符串对象添加到集合中 (4)遍历集合 2. 代码示例: package cn.itcast ...

  6. Java基础知识强化之集合框架笔记09:Collection集合迭代器使用的问题探讨

    1.Collection集合迭代器使用的问题探讨: (1)问题1:能用while循环写这个程序,我能不能用for循环呢?                  可以使用for循环替代. (2)问题2:不要 ...

  7. Java基础知识强化之集合框架笔记08:Collection集合自定义对象并遍历案例(使用迭代器)

    1. Collection集合自定义对象并遍历案例(使用迭代器) (1)首先定义一个Student.java,如下: package com.himi.collectionIterator; publ ...

  8. Java基础知识强化之集合框架笔记07:Collection集合的遍历之迭代器遍历

    1. Collection的迭代器: Iterator iterator():迭代器,集合的专用遍历方式 2. 代码示例: package cn.itcast_03; import java.util ...

  9. Java基础知识强化之集合框架笔记06:Collection集合存储自定义对象并遍历的案例

    1.练习:用集合存储5个学生对象,并把学生对象进行遍历. 分析: (1)创建学生类(2)创建集合对象(3)创建学生对象(4)把学生添加到集合(5)把集合转成数组(6)遍历数组 2. 代码示例: Stu ...

随机推荐

  1. svn Server sent unexpected return value (403 Forbidden) in response to CHECKOUT

    今天,提交資料到公司svn服務器,但是一直提示 Server sent unexpected return value (403 Forbidden) in response to CHECKOUT ...

  2. 从零开始的H5生活

    作为一个新手,要从头学习Html编程语言,需要从最基础的开始.有耐心慢慢来,很容易就看懂了.我所使用的编程软件是Hbuilder. 1.Html文档结构 包括head和body两部分 <!DOC ...

  3. java基本数据类型及其包装类

    1.String类 String s1 = "hello world"; String s2 = "hello world"; String s3 = s1 + ...

  4. 基于Cloudera Search设计数据灾备方案

    当实际项目上线到生产环境中,难以避免一些意外情况,如数据丢失.服务器停机等.对于系统的搜索服务来说,当遇到停机的情况意味着在停机这段时间内,用户都不能通过搜索的相关功能进行访问数据,停机意味着将这一段 ...

  5. 浅谈面试中的OOD面向对象设计问题

    转载自:http://baozitraining.org/blog/Object-oriented-design-question/ OO设计问题是电面或者onsite中常考的问题,尤其对以Java为 ...

  6. eclipse 安装svn和gradle

    公司项目用的eclispe  svn和gradle 所以需要配置 SVN教程:https://blog.csdn.net/jieshaowang1229/article/details/5159499 ...

  7. 设计模式的征途—13.代理(Proxy)模式

    所谓代购,简单说来就是找人帮忙购买所需要的商品.代购分为两种类型,一种是因为在当地买不到某件商品,又或者是因为当地这件商品的价格比其他地区的贵,因此托人在其他地区甚至国外购买该商品,然后通过快递发货或 ...

  8. MicroService 微服务架构模式简述

    开源地址: https://github.com/TheCodeCleaner/MicroService4Net 本文内容 微服务 微服务风格的特性 组件化(Componentization )与服务 ...

  9. SpringBoot拦截器中Bean无法注入(转)

    问题 这两天遇到SpringBoot拦截器中Bean无法注入问题.下面介绍我的思考过程和解决过程: 1.由于其他bean在service,controller层注入一点问题也没有,开始根本没意识到Be ...

  10. Codeforces Round #483 (Div. 2)

    题目链接: https://cn.vjudge.net/contest/229761 A题: n个数字,两个人轮流去数字,直到剩下最后一个数字为止,第一个人希望剩下的数字最小,第二个人希望数字最大,最 ...