概述

Java语言中，提供了一套数据集合框架，其中定义了一些诸如List、Set等抽象数据类型，每个抽象数据类型的各个具体实现，底层又采用了不同的实现方式，比如ArrayList和LinkedList。

除此之外，Java对于数据集合的遍历，也提供了几种不同的方式。开发人员必须要清楚的明白每一种遍历方式的特点、适用场合、以及在不同底层实现上的表现。下面就详细分析一下这一块内容。

数据元素是怎样在内存中存放的？

数据元素在内存中，主要有2种存储方式：

1、顺序存储，Random Access（Direct Access）：

这种方式，相邻的数据元素存放于相邻的内存地址中，整块内存地址是连续的。可以根据元素的位置直接计算出内存地址，直接进行读取。读取一个特定位置元素的平均时间复杂度为O(1)。正常来说，只有基于数组实现的集合，才有这种特性。Java中以ArrayList为代表。

2、链式存储，Sequential Access：

这种方式，每一个数据元素，在内存中都不要求处于相邻的位置，每个数据元素包含它下一个元素的内存地址。不可以根据元素的位置直接计算出内存地址，只能按顺序读取元素。读取一个特定位置元素的平均时间复杂度为O(n)。主要以链表为代表。Java中以LinkedList为代表。

Java中提供的遍历方式有哪些？

1、传统的for循环遍历，基于计数器的：

遍历者自己在集合外部维护一个计数器，然后依次读取每一个位置的元素，当读取到最后一个元素后，停止。主要就是需要按元素的位置来读取元素。这也是最原始的集合遍历方法。

写法为：

for (int i = 0; i < list.size(); i++) {

    list.get(i);

}

2、迭代器遍历，Iterator：

Iterator本来是OO的一个设计模式，主要目的就是屏蔽不同数据集合的特点，统一遍历集合的接口。Java作为一个OO语言，自然也在Collections中支持了Iterator模式。

写法为：

Iterator iterator = list.iterator();

while (iterator.hasNext()) {

    iterator.next();

}

3、foreach循环遍历：

屏蔽了显式声明的Iterator和计数器。

优点：代码简洁，不易出错。

缺点：只能做简单的遍历，不能在遍历过程中操作（删除、替换）数据集合。

写法为：

for (ElementType element : list) {

}

每个遍历方法的实现原理是什么？

1、传统的for循环遍历，基于计数器的：

遍历者自己在集合外部维护一个计数器，然后依次读取每一个位置的元素，当读取到最后一个元素后，停止。主要就是需要按元素的位置来读取元素。

2、迭代器遍历，Iterator：

每一个具体实现的数据集合，一般都需要提供相应的Iterator。相比于传统for循环，Iterator取缔了显式的遍历计数器。所以基于顺序存储集合的Iterator可以直接按位置访问数据。而基于链式存储集合的Iterator，正常的实现，都是需要保存当前遍历的位置。然后根据当前位置来向前或者向后移动指针。

3、foreach循环遍历：

根据反编译的字节码可以发现，foreach内部也是采用了Iterator的方式实现，只不过Java编译器帮我们生成了这些代码。

各遍历方式对于不同的存储方式，性能如何？

1、传统的for循环遍历，基于计数器的：

因为是基于元素的位置，按位置读取。所以我们可以知道，对于顺序存储，因为读取特定位置元素的平均时间复杂度是O(1)，所以遍历整个集合的平均时间复杂度为O(n)。而对于链式存储，因为读取特定位置元素的平均时间复杂度是O(n)，所以遍历整个集合的平均时间复杂度为O(n2)（n的平方）。

ArrayList按位置读取的代码：直接按元素位置读取。

transient Object[] elementData;

public E get(int index) {

    rangeCheck(index);

    return elementData(index);

}

E elementData(int index) {

    return (E) elementData[index];

}

LinkedList按位置读取的代码：每次都需要从第0个元素开始向后读取。其实它内部也做了小小的优化。

transient int size = 0;

transient Node<E> first;

transient Node<E> last;

public E get(int index) {

    checkElementIndex(index);

    return node(index).item;

}

Node<E> node(int index) {

    if (index < (size >> 1)) {   //查询位置在链表前半部分，从链表头开始查找

        Node<E> x = first;

        for (int i = 0; i < index; i++)

            x = x.next;

        return x;

    } else {                     //查询位置在链表后半部分，从链表尾开始查找

        Node<E> x = last;

        for (int i = size - 1; i > index; i--)

            x = x.prev;

        return x;

    }

}

2、迭代器遍历，Iterator：

那么对于RandomAccess类型的集合来说，没有太多意义，反而因为一些额外的操作，还会增加额外的运行时间。但是对于Sequential Access的集合来说，就有很重大的意义了，因为Iterator内部维护了当前遍历的位置，所以每次遍历，读取下一个位置并不需要从集合的第一个元素开始查找，只要把指针向后移一位就行了，这样一来，遍历整个集合的时间复杂度就降低为O(n)；

（这里只用LinkedList做例子）LinkedList的迭代器，内部实现，就是维护当前遍历的位置，然后操作指针移动就可以了：

代码：

public E next() {

    checkForComodification();

    if (!hasNext())

        throw new NoSuchElementException();

    lastReturned = next;

    next = next.next;

    nextIndex++;

    return lastReturned.item;

}

public E previous() {

    checkForComodification();

    if (!hasPrevious())

        throw new NoSuchElementException();

    lastReturned = next = (next == null) ? last : next.prev;

    nextIndex--;

    return lastReturned.item;

}

3、foreach循环遍历：

分析Java字节码可知，foreach内部实现原理，也是通过Iterator实现的，只不过这个Iterator是Java编译器帮我们生成的，所以我们不需要再手动去编写。但是因为每次都要做类型转换检查，所以花费的时间比Iterator略长。时间复杂度和Iterator一样。

使用Iterator的字节码：

    Code:

       0: new           #16                 // class java/util/ArrayList

       3: dup

       4: invokespecial #18                 // Method java/util/ArrayList."<init>":()V

       7: astore_1

       8: aload_1

       9: invokeinterface #19,  1           // InterfaceMethod java/util/List.iterator:()Ljava/util/Iterator;

      14: astore_2

      15: goto          25

      18: aload_2

      19: invokeinterface #25,  1           // InterfaceMethod java/util/Iterator.next:()Ljava/lang/Object;

      24: pop

      25: aload_2

      26: invokeinterface #31,  1           // InterfaceMethod java/util/Iterator.hasNext:()Z

      31: ifne          18

      34: return

使用foreach的字节码：

    Code:

       0: new           #16                 // class java/util/ArrayList

       3: dup

       4: invokespecial #18                 // Method java/util/ArrayList."<init>":()V

       7: astore_1

       8: aload_1

       9: invokeinterface #19,  1           // InterfaceMethod java/util/List.iterator:()Ljava/util/Iterator;

      14: astore_3

      15: goto          28

      18: aload_3

      19: invokeinterface #25,  1           // InterfaceMethod java/util/Iterator.next:()Ljava/lang/Object;

      24: checkcast     #31                 // class loop/Model

      27: astore_2

      28: aload_3

      29: invokeinterface #33,  1           // InterfaceMethod java/util/Iterator.hasNext:()Z

      34: ifne          18

      37: return

各遍历方式的适用于什么场合？

1、传统的for循环遍历，基于计数器的：

顺序存储：读取性能比较高。适用于遍历顺序存储集合。

链式存储：时间复杂度太大，不适用于遍历链式存储的集合。

2、迭代器遍历，Iterator：

顺序存储：如果不是太在意时间，推荐选择此方式，毕竟代码更加简洁，也防止了Off-By-One的问题。

链式存储：意义就重大了，平均时间复杂度降为O(n)，还是挺诱人的，所以推荐此种遍历方式。

3、foreach循环遍历：

foreach只是让代码更加简洁了，但是他有一些缺点，就是遍历过程中不能操作数据集合（删除等），所以有些场合不使用。而且它本身就是基于Iterator实现的，但是由于类型转换的问题，所以会比直接使用Iterator慢一点，但是还好，时间复杂度都是一样的。所以怎么选择，参考上面两种方式，做一个折中的选择。

Java的最佳实践是什么？

Java数据集合框架中，提供了一个RandomAccess接口，该接口没有方法，只是一个标记。通常被List接口的实现使用，用来标记该List的实现是否支持Random Access。

一个数据集合实现了该接口，就意味着它支持Random Access，按位置读取元素的平均时间复杂度为O(1)。比如ArrayList。

而没有实现该接口的，就表示不支持Random Access。比如LinkedList。

所以看来JDK开发者也是注意到这个问题的，那么推荐的做法就是，如果想要遍历一个List，那么先判断是否支持Random Access，也就是 list instanceof RandomAccess。

比如：

if (list instanceof RandomAccess) {

    //使用传统的for循环遍历。

} else {

    //使用Iterator或者foreach。

}

Java遍历集合的几种方法分析（实现原理、算法性能、适用场合）的更多相关文章

Java遍历集合的几种方法
遍历集合的几种方法用不同的方法遍历集合. public interface Iterator:对Collection进行迭代的迭代器.迭代器取代了Java Collections FrameWork ...
java 遍历map的四种方法
16:21:42 Map.entrySet() 这个方法返回的是一个Set<Map.Entry<K,V>>,Map.Entry 是Map中的一个接口,他的用途是表示一个映射项( ...
java 遍历Map的4种方法
在Java中如何遍历Map对象 How to Iterate Over a Map in Java 在java中遍历Map有不少的方法.我们看一下最常用的方法及其优缺点. 既然java中的所有map都 ...
java 遍历arrayList的四种方法
package com.test; import java.util.ArrayList;import java.util.Iterator;import java.util.List; public ...
Java遍历List集合的三种方法
Java遍历List集合的三种方法 List<String> list = new ArrayList<String>(); list.add("aaa") ...
java中遍历集合的三种方式
第一种遍历集合的方式:将集合变为数组 package com.lw.List; import java.util.ArrayList; import java.util.List; import ja ...
java解析xml的三种方法
java解析XML的三种方法 1.SAX事件解析 package com.wzh.sax; import org.xml.sax.Attributes; import org.xml.sax.SAXE ...
java 遍历Map的四种方式
java 遍历Map的四种方式 CreationTime--2018年7月16日16点15分 Author:Marydon 一.迭代key&value 第一种方式:迭代entrySet 1 ...
转载：遍历Map的四种方法
http://www.cnblogs.com/kristain/articles/2033566.html 遍历Map的四种方法 public static void main(String[] ar ...

随机推荐

大数据 - spark-sql 常用命令
--spark启动 spark-sql --退出 spark-sql> quit; --退出spark-sql or spark-sql> exit; 1.查看已有的database sh ...
MySQL ICP（Index Condition Pushdown）特性
一.SQL的where条件提取规则在ICP(Index Condition Pushdown,索引条件下推)特性之前,必须先搞明白根据何登成大神总结出一套放置于所有SQL语句而皆准的where查询条 ...
宿主iis部署wcf
WCF学习笔记(4)——宿主iis部署wcf 本文将部署一个wcf+silverlight简单实例,以下是详细步骤: (环境:服务端win2003,iis6.0,asp.net4.0:客户端winXP ...
1.4 Crack小实验
0_day 第一章基础知识 1.4 Crack小实验 <0day_2th>王清著电子书下载链接:https://pan.baidu.com/s/11TgibQSC3-kYwCInm ...
LeetCode--020--括号匹配(java版)
给定一个只包括 '(',')','{','}','[',']' 的字符串,判断字符串是否有效. 有效字符串需满足: 左括号必须用相同类型的右括号闭合. 左括号必须以正确的顺序闭合. 注意空字符串可被认 ...
apicloud 按返回键
api.addEventListener({ name: 'keyback' }, function(ret, err) { //调取index.html暴露的方法 api.execScript({ ...
Arthur and Brackets CodeForces - 508E (贪心,括号匹配)
大意: n个括号, 位置未知, 给出每对括号左右间距, 求输出一个合法括号序列. 最后一个括号间距一定为1, 从右往左遍历, 每次括号划分越小越好. #include <iostream> ...
[Fiddler] ReadResponse() failed: The server did not return a complete response for this request. Server returned 0 bytes.
待解决 [Fiddler] ReadResponse() failed: The server did not return a complete response for this request. ...
Django 的逆向解析url--reverse（转）
https://www.cnblogs.com/zhenfei/p/6368955.html Django中提供了一个关于URL的映射的解决方案,你可以做两个方向的使用: 1.有客户端的浏览器发起一个 ...
WDA基础八：ROWREPEATER的使用
这玩意不知道什么时候用^_^ 组件:Row-Repeater 1.新建WDA程序并激活 ZLYWDA02 2.进入VIEW,创建CONTEXT: 表:0..n 选择行:单选初始化选择行 3.创建循 ...

Java遍历集合的几种方法分析（实现原理、算法性能、适用场合）

概述

数据元素是怎样在内存中存放的？

1、顺序存储，Random Access（Direct Access）：

2、链式存储，Sequential Access：

Java中提供的遍历方式有哪些？

1、传统的for循环遍历，基于计数器的：

2、迭代器遍历，Iterator：

3、foreach循环遍历：

每个遍历方法的实现原理是什么？

1、传统的for循环遍历，基于计数器的：

2、迭代器遍历，Iterator：

3、foreach循环遍历：

各遍历方式对于不同的存储方式，性能如何？

1、传统的for循环遍历，基于计数器的：

2、迭代器遍历，Iterator：

3、foreach循环遍历：

各遍历方式的适用于什么场合？

1、传统的for循环遍历，基于计数器的：

2、迭代器遍历，Iterator：

3、foreach循环遍历：

Java的最佳实践是什么？

Java遍历集合的几种方法分析（实现原理、算法性能、适用场合）的更多相关文章

随机推荐

热门专题