简洁方便的集合处理——Java 8 stream流
背景
java 8已经发行好几年了,前段时间java 12也已经问世,但平时的工作中,很多项目的环境还停留在java1.7中。而且java8的很多新特性都是革命性的,比如各种集合的优化、lambda表达式等,所以我们还是要去了解java8的魅力。
今天我们来学习java8的Stream,并不需要理论基础,直接可以上手去用。
我接触stream的原因,是我要搞一个用户收入消费的数据分析。起初的统计筛选分组都是打算用sql语言直接从mysql里得到结果来展现的。但在操作中我们发现这样频繁地访问数据库,性能会受到很大的影响,分析速度会很慢。所以我们希望能通过访问一次数据库就拿到所有数据,然后放到内存中去进行数据分析统计过滤。
接着,我看了stream的API,发现这就是我想要的。
一、Stream理解
在java中我们称Stream为『流』,我们经常会用流去对集合进行一些流水线的操作。stream就像工厂一样,只需要把集合、命令还有一些参数灌输到流水线中去,就可以加工成得出想要的结果。这样的流水线能大大简洁代码,减少操作。
二、Stream流程
原集合 —> 流 —> 各种操作(过滤、分组、统计) —> 终端操作
Stream流的操作流程一般都是这样的,先将集合转为流,然后经过各种操作,比如过滤、筛选、分组、计算。最后的终端操作,就是转化成我们想要的数据,这个数据的形式一般还是集合,有时也会按照需求输出count计数。下文会一一举例。

三、API功能举例
首先,定义一个用户对象,包含姓名、年龄、性别和籍贯四个成员变量:
import lombok.AllArgsConstructor;
import lombok.Builder;
import lombok.Data;
import lombok.NoArgsConstructor;
import lombok.extern.log4j.Log4j; @Data
@NoArgsConstructor
@AllArgsConstructor
@Log4j
@Builder
public class User {
//姓名
private String name;
//年龄
private Integer age;
//性别
private Integer sex;
//所在省市
private String address;
}
这里用lombok简化了实体类的代码。
然后创建需要的集合数据,也就是源数据:
//1.构建我们的list
List<User> list= Arrays.asList(
new User("钢铁侠",,,"华盛顿"),
new User("蜘蛛侠",,,"华盛顿"),
new User("赵丽颖",,,"湖北武汉市"),
new User("詹姆斯",,,"洛杉矶"),
new User("李世民",,,"山西省太原市"),
new User("蔡徐坤",,,"陕西西安市"),
new User("葫芦娃的爷爷",,,"山西省太原市")
);
3.1 过滤
1)创建流 stream() / parallelStream()
- stream() : 串行流
- parallelStream(): 并行流
2)filter 过滤(T-> boolean)
比如要过滤年龄在40岁以上的用户,就可以这样写:
List<User> filterList = list.stream().filter(user -> user.getAge() >= )
.collect(toList());
filter里面,->箭头后面跟着的是一个boolean值,可以写任何的过滤条件,就相当于sql中where后面的东西,换句话说,能用sql实现的功能这里都可以实现
打印结果:

3)distinct 去重
和sql中的distinct关键字很相似。为了看到效果,此处在原集合中加入一个重复的人,就选择钢铁侠吧,复联4钢铁侠不幸遇害,大家还是比较伤心的。
List<User> list= Arrays.asList(
new User("钢铁侠",,,"华盛顿"),
new User("钢铁侠",,,"华盛顿"),
new User("蜘蛛侠",,,"华盛顿"),
new User("赵丽颖",,,"湖北武汉市"),
new User("詹姆斯",,,"洛杉矶"),
new User("李世民",,,"山西省太原市"),
new User("蔡徐坤”,18,1,"陕西西安市"),
new User("葫芦娃的爷爷",,,"山西省太原市")
);
//distinct 去重
List<User> distinctList = filterList.stream().distinct()
.collect(toList());
打印结果:

4)sorted排序
如果流中的元素的类实现了 Comparable 接口,即有自己的排序规则,那么可以直接调用 sorted() 方法对元素进行排序,如:
Comparator.comparingInt
反之, 需要调用 sorted((T, T) -> int) 实现 Comparator 接口。
//sorted()
List<User> sortedList = distinctList.stream().sorted(Comparator.comparingInt(User::getAge))
.collect(toList());
打印结果:

结果按照年龄从小到大进行排序。
5)limit() 返回前n个元素
如果想知道这里面年龄最小的是谁,可作如下操作:
//limit 返回前n个元素
List<User> limitList = sortedList.stream().limit()
.collect(toList());

6)skip()
与limit恰恰相反,skip的意思是跳过,也就是去除前n个元素。
打印结果:

果然,前两个人都被去除了,只剩下最老的葫芦娃爷爷。
3.2 映射
1)map(T->R)
map是将T类型的数据转为R类型的数据,比如我们想要设置一个新的list,存储用户所有的城市信息。
//map(T->R)
List<String> cityList = list.stream().map(User::getAddress).distinct().collect(toList());
打印结果:

2)flatMap(T -> Stream)
将流中的每一个元素 T 映射为一个流,再把每一个流连接成为一个流。
//flatMap(T -> Stream<R>)
List<String> flatList = new ArrayList<>();
flatList.add("唱,跳");
flatList.add("rape,篮球,music");
flatList = flatList.stream().map(s -> s.split(",")).flatMap(Arrays::stream).collect(toList());
打印结果:

这里原集合中的数据由逗号分割,使用split进行拆分后,得到的是Stream<string[]>,字符串数组组成的流,要使用flatMap的
Arrays::stream
将Stream<string[]>转为Stream,然后把流相连接,组成了完整的唱、跳、rap、篮球和music。
3.3 查找
1)allMatch(T->boolean)
检测是否全部满足参数行为,假如这些用户是网吧上网的用户名单,那就需要检查是不是每个人都年满18周岁了。
boolean isAdult = list.stream().allMatch(user -> user.getAge() >= );
打印结果:
true
2)anyMatch(T->boolean)
检测是否有任意元素满足给定的条件,比如,想知道同学名单里是否有女生。
//anyMatch(T -> boolean) 是否有任意一个元素满足给定的条件
boolean isGirl = list.stream().anyMatch(user -> user.getSex() == );
打印结果:
true
说明集合中有女生存在。
3)noneMatch(T -> boolean)
流中是否有元素匹配给定的 T -> boolean 条件。
比如检测有没有来自巴黎的用户。
boolean isLSJ = list.stream().noneMatch(user -> user.getAddress().contains("巴黎"));
打印结果:
true
打印true说明没有巴黎的用户。
4)findFirst( ):找到第一个元素
Optional<User> fristUser = list.stream().findFirst();
打印结果:
User(name=钢铁侠, age=, sex=, address=华盛顿)
5)findAny():找到任意一个元素
Optional<User> anyUser = list.stream().findAny();
打印结果:
User(name=钢铁侠, age=, sex=, address=华盛顿)
这里我们发现findAny返回的也总是第一个元素,那么为什么还要进行区分呢?因为在并行流 parallelStream() 中找到的确实是任意一个元素。
Optional<User> anyParallelUser = list.parallelStream().findAny();
打印结果 :
Optional[User(name=李世民, age=, sex=, address=山西省太原市)]
3.4 归纳计算
1)求用户的总人数
long count = list.stream().collect(Collectors.counting());
我们可以简写为:
long count = list.stream().count();
运行结果:
2)得到某一属性的最大最小值
// 求最大年龄
Optional<User> max = list.stream().collect(Collectors.maxBy(
Comparator.comparing(User::getAge))); // 求最小年龄
Optional<User> min = list.stream().collect(Collectors.minBy(
Comparator.comparing(User::getAge)));
运行结果:


3)求年龄总和是多少
// 求年龄总和
int totalAge = list.stream().collect(Collectors.summingInt(User::getAge));
运行结果:
我们经常会用BigDecimal来记录金钱,假设想得到BigDecimal的总和:
// 获得列表对象金额, 使用reduce聚合函数,实现累加器
BigDecimal sum = myList.stream() .map(User::getMoney)
.reduce(BigDecimal.ZERO,BigDecimal::add);
4)求年龄平均值
//求年龄平均值
double avgAge = list.stream().collect(
Collectors.averagingInt(User::getAge));
运行结果:
39.125
5)一次性得到元素的个数、总和、最大值、最小值
IntSummaryStatistics statistics = list.stream().collect(
Collectors.summarizingInt(User::getAge));
运行结果:

6)字符串拼接
要将用户的姓名连成一个字符串并用逗号分割。
String names = list.stream().map(User::getName)
.collect(Collectors.joining(", "));
运行结果:
钢铁侠, 钢铁侠, 蜘蛛侠, 赵丽颖, 詹姆斯, 李世民, 蔡徐坤, 葫芦娃的爷爷
3.5 分组
在数据库操作中,我们经常通过GROUP BY关键字对查询到的数据进行分组,java8的流式处理也提供了分组的功能。使用Collectors.groupingBy来进行分组。
1)可以根据用户所在城市进行分组
Map<String, List<User>> cityMap = list.stream()
.collect(Collectors.groupingBy(User::getAddress));

结果是一个map,key为不重复的城市名,value为属于该城市的用户列表。已经实现了分组。
2)二级分组,先根据城市分组再根据性别分组
Map<String, Map<Integer, List<User>>> group = list.stream().collect(
Collectors.groupingBy(User::getAddress, // 一级分组,按所在地区
Collectors.groupingBy(User::getSex))); // 二级分组,按性别
运行结果:

3)如果仅仅想统计各城市的用户个数是多少,并不需要对应的list
按城市分组并统计人数:
Map<String, Long> cityCountMap = list.stream()
.collect(Collectors.groupingBy(User::getAddress,Collectors.counting()));
运行结果:

4)当然,也可以先进行过滤再分组并统计人数
Map<String,Long> map = list.stream().filter(user -> user.getAge() <= )
.collect(Collectors.groupingBy(User::getAddress,Collectors.counting()));
运行结果:

5)partitioningBy 分区
分区与分组的区别在于,分区是按照 true 和 false 来分的,因此partitioningBy 接受的参数的 lambda 也是 T -> boolean
//根据年龄是否小于等于30来分区
Map<Boolean, List<User>> part = list.stream()
.collect(partitioningBy(user -> user.getAge() <= ));
运行结果:

总结
到目前为止,stream的功能我们已经用了很多了,感觉有点眼花缭乱却无所不能,stream能做的事情远远不止这些。
我们可以多学习使用stream,把原来复杂的sql查询,一遍又一遍地for循环的复杂代码重构,让代码更简洁易懂,可读性强。
拓展阅读:Redis专题(1):构建知识图谱
作者:杨亨
来源:宜信技术学院
简洁方便的集合处理——Java 8 stream流的更多相关文章
- Java之Stream流
Stream流的初步学习 初次学习Stream流的学习笔记,学习之前先了解一下函数式接口 概述 API是一个程序向使用者提供的一些方法,通过这些方法就能实现某些功能.所以对于流API来 说,重点是怎么 ...
- Java中Stream流相关介绍
什么是Stream? Stream是JDK8 API的新成员,它允许以声明性方式处理数据集合 特点 代码简洁: 函数式编程写出的代码简洁且意图明确,使用stream接口让你从此告别for循环 多核友好 ...
- 【重学Java】Stream流
Stream流 体验Stream流[理解] 案例需求 按照下面的要求完成集合的创建和遍历 创建一个集合,存储多个字符串元素 把集合中所有以"张"开头的元素存储到一个新的集合 把&q ...
- 获取单列集合,双列集合,数组的Stream流对象以及简单操作
获取流对象 获取单列集合,双列集合,数组的流对象 单列集合获取流对象: 1.java.util.Collection接口中加入了default方法stream()获取流对象,因此其所有实现类均可通过此 ...
- Java的Stream流式操作
前言 最近在实习,在公司看到前辈的一些代码,发现有很多值得我学习的地方,其中有一部分就是对集合使用Stream流式操作,觉得很优美且方便.所以学习一下Stream流,在这里记录一下. Stream是什 ...
- Java 之 Stream 流
Stream流 在Java 8中,得益于Lambda所带来的函数式编程,引入了一个全新的Stream概念,用于解决已有集合类库既有的弊端 一.传统遍历 1.传统集合的多步遍历代码 几乎所有的集合(如 ...
- Java 8 Stream流编程学习
本文是自己学习菜鸟教程中总结的笔记,用于快速找代码,完整的文档见菜鸟教程:Java 8 Stream Stream 使用一种类似用SQL语句从数据库查询数据的直观方式来提供一种对Java集合运算和表达 ...
- Java基础 | Stream流原理与用法总结
Stream简化元素计算: 一.接口设计 从Java1.8开始提出了Stream流的概念,侧重对于源数据计算能力的封装,并且支持序列与并行两种操作方式:依旧先看核心接口的设计: BaseStream: ...
- Java的Stream流
yi.控制台输入输出流, 1.读取控制台输入 Java的控制台输入由System.in完成.为了获得一个绑定到控制台的字符流,可以把System.in包装在一个BufferedReader对象中来创建 ...
随机推荐
- POJ 2135 Farm Tour (费用流)
[题目链接] http://poj.org/problem?id=2135 [题目大意] 有一张无向图,求从1到n然后又回来的最短路 同一条路只能走一次 [题解] 题目等价于求从1到n的两条路,使得两 ...
- ASIHTTPRequest框架使用总结系列之阿堂教程3(异步请求)
在上一节中,阿堂和网友们分享了ASIHTTPRequest框架对于get,post的同步请求方式.很显然,如果网速比较慢,查询的时候会一直很黑屏,直到请求结束界面才出现结果,这样用户体验肯定很不好了. ...
- hibernate.cfg.xml配置文件对关联关系的书写技巧!
以Department(部门类)和User(用户类)作为例子: 类图如下: 一般hibernate.cfg.xml的配置文件开头都是如下: <?xml version="1.0&quo ...
- Shell--Bash shell的操作环境
一.路径与命令查找顺序 1.以相对/绝对路径执行命令,例如“/bin/ls”或“./ls”; 2.由alias找到该命令来执行 3.由bash内置的(builtin)命令来执行 4.通过$PATH这个 ...
- 什么是滤波器,滤波器是干嘛用的,IIR和FIR滤波器又是什么?(回答请简洁,别浪费大家时间)
信号频率筛选器,用于阻挡不需要的信号: 低通滤波用来阻挡某一频率之上的所有信号: 高通滤波用来阻挡某一频率之下的所有信号: 另外还有带通滤波器,带阻滤波器..... 个人理解,就像是个过滤沙子的筛子一 ...
- tensorflow TensorArray 代码例子
import tensorflow as tf import numpy as np B=3 D=4 T=5 tf.reset_default_graph() xs=tf.placeholder(sh ...
- 2017.7.14 使用case when和group by将多条数据合并成一行,并且根据某些列的合并值做条件判断来生成最终值
参考来自:http://bbs.csdn.net/topics/390737006 1.效果演示 (1)不做处理 (2)合并多列,并对后四列的值做并集处理 2.SQL语句 (1)不做处理 SELECT ...
- 转: java语法与ide级入门介绍 from: IBM dev
点评: 讲的比较初级,但是有教你使用ide (Eclipse) frrom:http://www.ibm.com/developerworks/java/tutorials/j-introtojava ...
- Android使用TextView,设置onClick属性无效解决的方法
Android在布局文件里为View提供了onClick属性.用法例如以下: <TextView android:id="@+id/user" android:layout_ ...
- 容量测试之tcpcopy引流模式
tcpcopy 给用户提供了很多命令参数来修改引流的模式和设置,详细可以查阅手册.在这里把几种常见的引流方式做个归纳小结,以tcpcopy传统架构使用命令举例. 1.分布式引流 用法:Tcpcopy可 ...