JAVA经常使用数据结构及原理分析

前不久面试官让我说一下怎么理解java数据结构框架，之前也看过部分源代码，balabala讲了一堆，如今总结一下。

java.util包中三个重要的接口及特点：List（列表）、Set（保证集合中元素唯一）、Map（维护多个key-value键值对，保证key唯一）。其不同子类的实现各有差异，如是否同步（线程安全）、是否有序。

经常使用类继承树：

下面结合源代码解说经常使用类实现原理及相互之间的差异。

Collection （全部集合类的接口）

List、Set都继承自Collection接口。查看JDK API，操作集合经常使用的方法大部分在该接口中定义了。

Collections （操作集合的工具类）

对于集合类的操作不得不提到工具类Collections，它提供了很多方便的方法，如求两个集合的差集、并集、拷贝、排序等等。

由于大部分的集合接口实现类都是不同步的。能够使用Collections.synchronized*方法创建同步的集合类对象。

如创建一个同步的List：

List synList = Collections.synchronizedList(new ArrayList());

事实上现原理就是又一次封装new出来的对象，操作对象时用关键字synchronized同步。

看源代码非常easy理解。

Collections部分源代码：

//Collections.synchronizedList返回的是静态类SynchronizedCollection的实例，终于将new出来的ArrayList对象赋值给了Collection<E> c。

static class SynchronizedCollection<E> implements Collection<E>, Serializable {

        final Collection<E> c;  // Backing Collection

        final Object mutex;     // Object on which to synchronize

        SynchronizedCollection(Collection<E> c) {

            if (c==null)

                throw new NullPointerException();

            this.c = c;

            mutex = this;

        }

        //...

        public boolean add(E e) {

            //操作集合时简单调用原本的ArrayList对象，仅仅是做了同步

            synchronized (mutex) {return c.add(e);}

        }

        //...

}

List （列表）

ArrayList、Vector是线性表。使用Object数组作为容器去存储数据的，加入了非常多方法维护这个数组。使其容量能够动态增长。极大地提升了开发效率。它们明显的差别是ArrayList是非同步的。Vector是同步的。不用考虑多线程时应使用ArrayList来提升效率。

ArrayList、Vector 部分源代码：

//ArrayList.add

public boolean add(E e) {

    ensureCapacityInternal(size + 1);  // Increments modCount!!

    //能够看出加入的对象放到elementData数组中去了

    elementData[size++] = e;

    return true;

}

//ArrayList.remove

public E remove(int index) {

    rangeCheck(index);

    modCount++;

    E oldValue = elementData(index);

    int numMoved = size - index - 1;

    if (numMoved > 0)

        //移除元素时数组产生的空位由System.arraycopy方法将其后的全部元素往前移一位，System.arraycopy调用虚拟机提供的本地方法来提升效率

        System.arraycopy(elementData, index+1, elementData, index,

                         numMoved);

    elementData[--size] = null; // Let gc do its work

    return oldValue;

}

//Vector add方法上多了synchronized关键字

public synchronized boolean add(E e) {

    modCount++;

    ensureCapacityHelper(elementCount + 1);

    elementData[elementCount++] = e;

    return true;

}

LinkedList是链表，略懂数据结构就知道事实上现原理了。链表随机位置插入、删除数据时比线性表快，遍历比线性表慢。

双向链表原理图：

LinkedList部分源代码：

//源代码非常清晰地表达了原理图

public class LinkedList<E>

extends AbstractSequentialList<E>

implements List<E>, Deque<E>, Cloneable, java.io.Serializable

{

    //头尾节点

    transient Node<E> first;

    transient Node<E> last;

}

//节点类

 private static class Node<E> {

    //节点存储的数据

    E item;

    Node<E> next;

    Node<E> prev;

    Node(Node<E> prev, E element, Node<E> next) {

        this.item = element;

        this.next = next;

        this.prev = prev;

    }

}

由此可依据实际情况来选择使用ArrayList（非同步、非频繁删除时选择）、Vector（需同步时选择）、LinkedList（频繁在任何位置插入、删除时选择）。

Map（存储键值对。key唯一）

HashMap结构的实现原理是将put进来的key-value封装成一个Entry对象存储到一个Entry数组中，位置（数组下标）由key的哈希值与数组长度计算而来。假设数组当前下标已有值，则将数组当前下标的值指向新加入的Entry对象。

有点晕。看图吧：

看完图再看源代码。非常清晰。都不须要凝视。

public class HashMap<K,V>

extends AbstractMap<K,V>

implements Map<K,V>, Cloneable, Serializable

{

    transient Entry<K,V>[] table;

    public V put(K key, V value) {

        if (key == null)

            return putForNullKey(value);

        int hash = hash(key);

        int i = indexFor(hash, table.length);

        //遍历当前下标的Entry对象链，假设key已存在则替换

        for (Entry<K,V> e = table[i]; e != null; e = e.next) {

        Object k;

        if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {

            V oldValue = e.value;

            e.value = value;

            e.recordAccess(this);

            return oldValue;

        }

    }

       addEntry(hash, key, value, i);

        return null;

    }

}

static class Entry<K,V> implements Map.Entry<K,V> {

    final K key;

    V value;

    Entry<K,V> next;

    int hash;

}

TreeMap是由Entry对象为节点组成的一颗红黑树，put到TreeMap的数据默认按key的自然顺序排序，new TreeMap时传入Comparator自己定义排序。红黑树网上非常多资料，我讲不清，这里就不介绍了。

Set（保证容器内元素唯一性）

之所以先讲Map是由于Set结构事实上就是维护一个Map来存储数据的。利用Map结构key值唯一性。

HashSet部分源代码：

public class HashSet<E>

extends AbstractSet<E>

implements Set<E>, Cloneable, java.io.Serializable

{    

    //无意义对象来作为Map的value

    private static final Object PRESENT = new Object();

    public boolean add(E e) {

        return map.put(e, PRESENT)==null;

    }

}

HashSet、TreeSet分别默认维护一个HashMap、TreeMap。

JAVA经常使用数据结构及原理分析的更多相关文章

JAVA常用数据结构及原理分析
JAVA常用数据结构及原理分析 http://www.2cto.com/kf/201506/412305.html 前不久面试官让我说一下怎么理解java数据结构框架,之前也看过部分源码,balaba ...
(6)Java数据结构-- 转：JAVA常用数据结构及原理分析
JAVA常用数据结构及原理分析 http://www.2cto.com/kf/201506/412305.html 前不久面试官让我说一下怎么理解java数据结构框架,之前也看过部分源码,balab ...
Java Web文件上传原理分析(不借助开源fileupload上传jar包)
Java Web文件上传原理分析(不借助开源fileupload上传jar包) 博客分类: Java Web 最近在面试IBM时,面试官突然问到:如果让你自己实现一个文件上传,你的代码要如何写,不 ...
java并发包&线程池原理分析&锁的深度化
java并发包&线程池原理分析&锁的深度化并发包同步容器类 Vector与ArrayList区别 1.ArrayList是最常用的List实现类,内部是通过数组实现的, ...
Java 重入锁 ReentrantLock 原理分析
1.简介可重入锁ReentrantLock自 JDK 1.5 被引入,功能上与synchronized关键字类似.所谓的可重入是指,线程可对同一把锁进行重复加锁,而不会被阻塞住,这样可避免死锁的产生 ...
Java 远程通讯技术及原理分析
在分布式服务框架中,一个最基础的问题就是远程服务是怎么通讯的,在Java领域中有很多可实现远程通讯的技术,例如:RMI.MINA.ESB.Burlap.Hessian.SOAP.EJB和JMS等,这些 ...
Java远程通讯技术及原理分析
在分布式服务框架中,一个最基础的问题就是远程服务是怎么通讯的,在Java领域中有很多可实现远程通讯的技术,例如:RMI.MINA.ESB.Burlap.Hessian.SOAP.EJB和JMS等,这些 ...
Java线程池应用及原理分析（JDK1.8）
目录一.线程池优点二.线程池创建三.任务处理流程四.任务缓存队列及排队策略五.任务拒绝策略六.线程池关闭七.线程池实现原理八.静态方法创建线程池九.如何确定线程池大小一.线程池优点 ...
Java,JDK动态代理的原理分析
1. 代理基本概念: 以下是代理概念的百度解释:代理(百度百科) 总之一句话:三个元素,数据--->代理对象--->真实对象:复杂一点的可以理解为五个元素:输入数据--->代理对象- ...

随机推荐

PHP无限级分类实现（递归+非递归）
<?php /** * Created by PhpStorm. * User: qishou * Date: 15-8-2 * Time: 上午12:00 */ //准备数组,代替从数据库中检 ...
从flink-example分析flink组件(1)WordCount batch实战及源码分析
上一章<windows下flink示例程序的执行> 简单介绍了一下flink在windows下如何通过flink-webui运行已经打包完成的示例程序(jar),那么我们为什么要使用fli ...
[BZOJ1821][JSOI2010]部落划分
感觉学了这么久还是有那么一丢丢进步的...上个学期看到这道题,虽然早就学过并查集和二分了但还是一点思路都没有,现在可以秒切了呢思路就是二分+并查集,有些人说是生成树,其实它没有变成树,只是运用了生成 ...
详细解读css中的浮动以及清除浮动的方法
对于前端初学者来说,css浮动部分的知识是一块比较难以理解的部分,下面我将把我学习过程中的心得分享给大家. 导读: 1.css块级元素讲解 2.css中浮动是如何产生的 3.出现浮动后,如何清除浮 ...
Deutsch lernen (08)
1. empfehlen - empfahl - hat empfohlen 推荐:劝说,劝告 Können Sie mir einen guten Artz empfehlen? jemand e ...
dubbo之泛化引用
使用泛化调用泛化接口调用方式主要用于客户端没有 API 接口及模型类元的情况,参数及返回值中的所有 POJO 均用 Map 表示,通常用于框架集成,比如:实现一个通用的服务测试框架,可通过 Gene ...
Android：JAVA使用HDF5存储
Hierarchical Data Format,可以存储不同类型的图像和数码数据的文件格式,并且可以在不同类型的机器上传输,同时还有统一处理这种文件格式的函数库.大多数普通计算机都支持这种文件格式. ...
Window8.1下安装Matplotlib库
有两种方法: 直接选用一些预打包库软件,如WinPython, Python(x,y), Enthought Canopy, or Continuum Anaconda.这些软件中已包含有Matplo ...
Dijkstra的双栈算术表达式求值算法 C++实现
#include<iostream> #include<string> using namespace std; template<typename T> clas ...
11.02 跳过表中n行
select x.enamefrom (select a.ename,(select count(*)from emp bwhere b.ename <=a.ename) as rnfrom e ...

JAVA经常使用数据结构及原理分析

JAVA经常使用数据结构及原理分析的更多相关文章

随机推荐

热门专题