[改善Java代码]不同的列表选择不同的遍历方法
一.场景:
我们来看一个场景,统计一个省的各科高考科目考试的平均分.
当然使用数据库中的一个SQL语句就能求出平均值,不过这个不再我们的考虑之列,这里只考虑使用纯Java的方式来解决.(由于我的机器配置比较好,用80万的数据量有点小,各个统计结果不明显,不能更加显著的说明明问题...这里改为800万)
看代码:
import java.util.ArrayList;
import java.util.Iterator;
import java.util.List;
import java.util.Random; public class Client {
public static void main(String[] args) {
//学生数量,800万
int stuNum = 800*10000;
//List集合,记录所有学生的分数
List<Integer> scores = new ArrayList<Integer>(stuNum);
//写入分数
for(int i=0;i<stuNum;i++){
scores.add(new Random().nextInt(150));
}
//记录开始计算时间
long start = System.currentTimeMillis();
System.out.println("平均分是:" + average(scores));
System.out.println("执行时间:" + (System.currentTimeMillis() -start) + "ms");
} //计算平均数
public static int average(List<Integer> list){
int sum = 0;
//遍历求和
for(int i:list){
sum +=i;
}
/*
Java中的foreach()语法是iterator(迭代器)的变形用法,上面的foreach语法和下面的代码等价
for(Iterator<Integer> i=list.iterator(); i.hasNext(); ){
sum +=i.next();
}
*/ //除以人数,计算平均值
return sum/list.size();
}
}
运行结果:
平均分是:74
执行时间:99ms
仅仅求一个平均值就花费了74毫秒,考虑其他诸如加权平均值、补充平均值等的话,花费时间肯定更长。我们仔细分析一下arverage方法,加号操作是最基本操作,没有可以优化,我们可以尝试对List遍历进行优化。
List的遍历还有另外一种形式,即通过下表方式来遍历,如下:
import java.util.ArrayList;
import java.util.Iterator;
import java.util.List;
import java.util.Random; public class Client {
public static void main(String[] args) {
//学生数量,800万
int stuNum = 800*10000;
//List集合,记录所有学生的分数
List<Integer> scores = new ArrayList<Integer>(stuNum);
//写入分数
for(int i=0;i<stuNum;i++){
scores.add(new Random().nextInt(150));
}
//记录开始计算时间
long start = System.currentTimeMillis();
System.out.println("平均分是:" + average(scores));
System.out.println("执行时间:" + (System.currentTimeMillis() -start) + "ms");
} //计算平均数
public static int average(List<Integer> list){
int sum = 0;
//遍历求和
for(int i = 0, size = list.size(); i < size; i++){
sum += list.get(i);
}
//除以人数,计算平均值
return sum/list.size();
}
}
运行结果如下:
平均分是:74
执行时间:58ms
执行时间大幅提升,性能提升65%。
为什么会有如此提升呢?我们知道foreacher与下面代码等价:
for(Iterator<Integer> i = list.iterator(); i.hasNext;){
sum += i.next();
}
迭代器是23中设计模式的一种,提供一种方法访问一个容器对象中的各个元素,同时又无须暴露该对象的内部细节。也就是说对于ArrayList,需要先创建一个迭代器容器,然后屏蔽内部遍历细节,对外提供hasNext、next等方法。
问题是ArrayList实现了RandomAccess接口,表明元素之间本没有关系,为了使用迭代器就需要强制建立一种互相“知晓”的关系,比如上一个元素可以判断是否有下一个元素,以及下一个元素是什么等关系,这也就是通过foreach遍历耗时的原因。
Java为ArrayList类加上了RandomAccess接口,就是在告诉我们"ArrayList是随机存取的,采用下标方式遍历列表速度会更快".
但是为什么不把RadomAccess加到所有的List实现类上呢?
那是因为有些List实现类是不能随机存取的,而是有序存取的,比如LinkedList类,LinkedList也是一个列表,但是它实现了双向链表,每个数据节点中都有三个数据项:前节点的引用(Previous Node),本节点元素(Node Element),后继节点的引用(Next Node),这是数据结构的节本知识,也就是在LinkedList中的两个元素本来就是有关联的,我知道你的存在,你也知道我的存在.
综上对于LinkedList由分析讲述,元素之间已经有关联了,使用foreach也就是迭代器方式是不是更高呢?代码如下
import java.util.LinkedList;
import java.util.List;
import java.util.Random; public class Client {
public static void main(String[] args){
//学生数量,80万
int stuNum = 800 * 10000;
//List集合,记录所有学生分数
List<Integer> scores = new LinkedList<Integer>(); //写入分数
for(int i = 0; i < stuNum; i++){
scores.add(new Random().nextInt(150));
} //记录开始计算时间
long start = System.currentTimeMillis();
System.out.println("平均分是:" + average(scores));
System.out.println("执行时间:" + (System.currentTimeMillis() - start) + "ms");
}
public static int average(List<Integer> list){
int sum = 0;
//foreach遍历求和
for(int i : list){
sum += i;
}
//除以人数,计算平均值
return sum/list.size();
}
}
运行结果:
平均分是:74
执行时间:118ms
可能这个数据量不是很适合.....用八十万量的数据量LinkedList使用foreach的速度和ArrayList使用普通for循环的速度差不多.....
可以测试使用下标的方式遍历LinkedList中的元素:
其实不用测试,效率真的非常低,直接看源代码:
public E get(int index){
return entry(index).element;
}
由entry方法查找指定下标的节点,然后返回其包含的元素,看entry方法:
private Entry<E> entry(int index){
//检查下标是否越界
Entry<E> e = header;
if(index < (size >> 1)){
//如果下标小于中间值,则从头节点开始搜索
for(int i = 0; i <= index; I++){
e = e.next;
}
}else{
//如果下标大于等于中间值,则从尾节点反向遍历
for(int i = size; i > index; i++){
e = e.previous;
}
}
return e;
}
程序会先判断输入的下标与中间值(size右移一位,也就是除以2了)的关系,小于中间值则从头开始正向搜索,大于中间值则从尾节点反向搜索,想想看,每一次的get方法都是一个遍历,"性能"两字从何说起呢!
明白了随机存取列表和有序存取列表的区别,average方法就必须重构,以便实现不同的列表采用不同的遍历方式.代码如下:
import java.util.LinkedList;
import java.util.List;
import java.util.Random;
import java.util.RandomAccess; public class Client {
public static void main(String[] args) {
// 学生数量,80万
int stuNum = 80 * 10000;
// List集合,记录所有学生的分数
List<Integer> scores = new LinkedList<Integer>();
// 写入分数
for (int i = 0; i < stuNum; i++) {
scores.add(new Random().nextInt(150));
} // 记录开始计算时间
long start = System.currentTimeMillis();
System.out.println("平均分是:" + average(scores));
System.out.println("执行时间:" + (System.currentTimeMillis() - start)
+ "ms");
} // 计算平均数
public static int average(List<Integer> list) {
int sum = 0;
if (list instanceof RandomAccess) {
//可以随机存取,则使用下标遍历
for (int i = 0, size = list.size(); i < size; i++) {
sum += list.get(i);
}
} else {
//有序存取,使用foreach方式
for (int i : list) {
sum += i;
}
}
// 除以人数,计算平均值
return sum / list.size();
}
}
这样无论是随机存取列表还是有序列表,程序都可以提供快速的遍历.
列表遍历也不是那么简单的,适时选择最优的遍历方式,不要固化为一种.
[改善Java代码]不同的列表选择不同的遍历方法的更多相关文章
- [改善Java代码]多种最值算法,适时选择
建议64:多种最值算法,适时选择. 对一批数据进行排序,然后找出其中的最大值或最小值,这是基本的数据结构知识.在Java中我们可以通过编写算法的方式,也可以通过数组先排序再取值的方式来实现.下面以求最 ...
- [改善Java代码]asList方法产生的List对象不可更改
上一个建议之处了asList方法在转换基本类型数组时候存在的问题,在看下asList方法返回的列表有何特殊的地方.看代码: import java.util.Arrays; import java.u ...
- [改善Java代码]注意Class类的特殊性
Java语言是先把Java源文件编译成后缀为class的字节码文件,然后再通过ClassLoader机制把这些类文件加载到内存中,最后生成实例执行的,这是Java处理的基本机制,但加载到内存中的数据是 ...
- [改善Java代码]易变业务使用脚本语言编写
建议16: 易变业务使用脚本语言编写 Java世界一直在遭受着异种语言的入侵,比如PHP.Ruby.Groovy.JavaScript等,这些“入侵者”都有一个共同特征:全是同一类语言—脚本语言,它们 ...
- [改善Java代码]警惕自增的陷阱
建议7: 警惕自增的陷阱 老师就说:自增有两种形式,分别是i++和++i,i++表示的是先赋值后加1,++i是先加1后赋值,这样理解了很多年也没出现问题,直到遇到如下代码,我才怀疑我的理解是不是错了: ...
- [改善Java代码]覆写变长方法也循规蹈矩
建议6:覆写变长方法也循规蹈矩 在Java中,子类覆写父类中的方法很常见,这样做既可以修正Bug也可以提供扩展的业务功能支持,同时还符合开闭原则(Open-Closed Principle),我们来看 ...
- [改善Java代码]不要在finally块中处理返回值
在finally代码块中处理返回值,这是在面试题中经常出现的题目.但是在项目中绝对不能再finally代码块中出现return语句,这是因为这种处理方式非常容易产生"误解",会严重 ...
- 将Java代码打包成jar文件转换为.exe可执行程序方法
做完学生管理系统后我想将代码打包成一个可执行程序,那样就可以直接点击在Windows下运行了,下面就跟大家分享下打包方法. 将Java的代码转换成 .exe 文件需要先把代码打包成 jar 文件然 ...
- Java中关于 ArrayList 和 Map 的常用遍历方法 (学习笔记,便于以后查询)
一.学习ArrayList与Map时,关于常用遍历方法的记录如下: 二.附源码如下: package com.study.in.myself; import java.util.ArrayList; ...
随机推荐
- Window下开发React-Native Android步骤
1.安装Android开发环境 下载并安装JDK 下载并安装Android SDK, Android NDK 启动SDK下面的SDK Manager.exe,安装相关SDK Platform-tool ...
- homework08
1.局部变量生命周期 #include "iostream.h" ;} int main() { ; add1(n); cout << n << endl; ...
- Java设计模式系列之适配器模式
适配器模式的定义 将一个类的接口转换成客户希望的另外一个接口.Adapter模式使得原本由于接口不兼容而不能一起工作的那些类可以一起工作.(就类似于我们充电器的转接头将220V的电压转换成我们的手机端 ...
- HDU 5835 Danganronpa (贪心)
Danganronpa 题目链接: http://acm.hdu.edu.cn/showproblem.php?pid=5835 Description Chisa Yukizome works as ...
- F - Coins
F - Coins Time Limit:3000MS Memory Limit:30000KB 64bit IO Format:%I64d & %I64u Submit St ...
- Object类、instanceof
一.Object 1.所有类都默认继承至Object 2.两个常用的方法 2.1.toString:返回类的字符串描述,一般子类会重写用来打印属性 2.2.equals:默认比较两个对象的引用是否相同 ...
- jeecms支持的freemaker标签大全
<@e.form id="jvForm" action="o_add.do"> <@e.text label="字段名" ...
- map的正确删除方式
遍历删除map元素的正确方式是 for(itor = maptemplate.begin; itor != maptemplate.end(); ) { if(neederase) ...
- 《赢在用户:Web人物角色创建和应用实践指南》阅读总结
本书针对创建人物角色的每一个步骤,包括进行定性.定量的用户研究,生成人物角色分类,使人物角色真实可信等进行了十分详细的介绍.而且,在人物角色如何指导总体商业策略.确定信息架构.内容和设计 ...
- 日志分析(四) Elasticsearch的精确查询
在需要做精确查询时,往往不希望做全文模糊搜索,这时,需要告知Elasticsearch在处理我们提供的字符串时,需要做精确匹配. 此时,在需要做精确匹配的字符串上,加上””,如”/user/info” ...