使用Java的stream中的Collectors可以很方便地做容器间的转换，可以少写很多代码。但是其中有暗含的坑需要注意和避免，本文探讨Collectors.toMap（JDK8版本）。

Collectors.toMap可以将一个流转化成Map，常见于需要将List转换成Map以便于进一步操作的场景，比如在通过RPC接口获取一个返回结果、从DB中查询到匹配的多条数据后，对其按某个字段（经常是主键id）做分组。这里先定义一个简单的类：

public class User {

    private Long id;

    private String name;

}

后续所有代码的目的均为将这个User类组成的List转换为id作为key、name作为value的Map。

1. 不使用stream

不使用stream时，需要先new一个map，然后手动把list的每一项放入map

    public void test0() {

        User user1 = new User();

        user1.setId(1L);

        user1.setName("1");

        User user2 = new User();

        user2.setId(2L);

        user2.setName("2");

        List<User> list = Lists.newArrayList();

        list.add(user1);

        list.add(user2);

        Map<Long, String> map = new HashMap<>();

        for(User user : list) {

            map.put(user.getId(), user.getName());

        }

    }

2. 使用stream的Collectors.toMap

构造list的代码不变，转化map的代码可以简化为

Map<Long, String> map = list.stream().collect(Collectors.toMap(User::getId, User::getName));

相较第一种，简洁多了。

但是，如果User1和User2的id是一样的，会发生什么情况？将代码中user2.setId(2L)修改为user2.setId(1L)，再次执行，发现抛异常java.lang.IllegalStateException: Duplicate key 1，说明在merge时报错了：key不允许重复。

但是有些情况下key确实是可以重复的，比如我调用上游的数据，上游没做校验和控制；再或者这个字段本身不是惟一的，多个数据可能重复。那么如何改进呢？

3. Collectors.toMap指定merge函数

可以自定义一个merge函数来确定key重复时，如何取value。比如下面这种写法，是保留第一个value。你也可以保留第二个，或者是做一些更复杂的处理。

Map<Long, String> map = list.stream().collect(Collectors.toMap(User::getId, User::getName, (x1,x2)->x1));

4. value为null的场景

传入merge方法以后，看似万事大吉了，没想到还有坑。将user2.setName(null)，会发现抛了NullPointerException异常，异常栈信息为：

可以看到对应的源码里，value是不允许为null的。

虽然说Map的value是支持null值的，但是map自己的merge方法天生不支持，此时仅靠自定义merge方法也已经无能为力了。如果仍然想使用Collectors.toMap，需要手动处理null的值，比如：

Map<Long, String> map = list.stream().collect(Collectors.toMap(User::getId, value -> Optional.ofNullable(value.getName()).orElse("")));

当然，这样处理后的map的value并不是实际的值，并不适用于所有场景。

这样看来，Collectors.toMap的局限性无法避免了，使用的时候要确认不会发生预期的问题。

当然你也可以做一些预处理，比如使用filter过滤掉value=null的数据，来规避这个问题。

5. key=null时会怎么样？

不会怎么样，一切正常。

public void test5() {

    User user1 = new User();

    user1.setId(null);

    user1.setName("1");

    User user2 = new User();

    user2.setId(2L);

    user2.setName("2");

    List<User> list = Lists.newArrayList();

    list.add(user1);

    list.add(user2);

    Map<Long, String> map = list.stream().collect(Collectors.toMap(User::getId, User::getName));

    System.out.print(map);

}

6. 还有什么要注意的？

上述的例子，均是建立在list不为空的前提下进行的。如果list本身为null，在调用stream()时自然也会抛NullPointerException；如果list是空的（内容为空但是容器本身初始化过，如list = new ArrayList<>()），则不会报错。

小结

调用stream()前先确定容器本身是否为null
如果不确定要通过Collectors.toMap转换为map的源容器的数据
- 对应key是否会重复，可以在toMap()传入merge方法
- 对应value是否为null，可以做过滤或指定默认值
如果不想思考和求证，还是继续用for循环吧

Collectors.toMap的暗坑与避免方式的更多相关文章

Java8 Collectors.toMap的坑
按照常规思维,往一个map里put一个已经存在的key,会把原有的key对应的value值覆盖,然而通过一次线上问题,发现Java8中的Collectors.toMap反其道而行之,它默认给抛异常,抛 ...
使用Collectors.toMap遇到NullPointerException
这个坑也是踩过好几次了,记录一笔. 当试图使用Collectors.toMap将一个stream收集为Map的时候,若构造map的valueMapper返回null时,则会报NullPointerEx ...
HTTP 规范中的那些暗坑
HTTP 协议可以说是开发者最熟悉的一个网络协议,「简单易懂」和「易于扩展」两个特点让它成为应用最广泛的应用层协议. 虽然有诸多的优点,但是在协议定义时因为诸多的博弈和限制,还是隐藏了不少暗坑,让人一 ...
java 8 lamda Stream的Collectors.toMap 参数
使用toMap()函数之后,返回的就是一个Map了,自然会需要key和value.toMap()的第一个参数就是用来生成key值的,第二个参数就是用来生成value值的.第三个参数用在key值冲突的情 ...
Collectors.toMap不允许Null Value导致NPE
背景线上某任务出现报警,报错日志如下: java.lang.NullPointerException: null at java.util.HashMap.merge(HashMap.java:12 ...
java8 list转Map报错Collectors.toMap :: results in "Non-static method cannot be refernced from static context"
1.问题:java8 list转Map 报错Collectors.toMap :: results in "Non-static method cannot be refernced fro ...
SpringBoot填坑系列---XML方式配置数据库
本次只是简单的运用SpringBoot搭建框架,对其原理并不做深入的探究 1.POM文件 <?xml version="1.0" encoding="UTF-8&q ...
python pyinstaller打包exe暗坑1
环境 python2.7.9 win-xp 今天打包了一个小脚本,结果打开报错
jenkins构建基于gradle的springboot项目CI采坑(采用jar方式部署)
试了一堆插件,最后用的还是 publish over SSH jenkins基本配置不多说了,就是配置一下git仓储,配置一下gradle执行命令 clean bootRepackage 之后执行Se ...
[转]深入理解Java 8 Lambda（类库篇——Streams API，Collectors和并行）
以下内容转自: 作者:Lucida 微博:@peng_gong 豆瓣:@figure9 原文链接:http://zh.lucida.me/blog/java-8-lambdas-insideout-l ...

随机推荐

【换模型更简单】如何用 Serverless 一键部署 Stable Diffusion?
作者|寒斜(阿里云智能技术专家) 前文回顾 AI 作画火了,如何用 Serverless 函数计算部署 Stable Diffusion? [自己更换模型]如何用 Serverless 一键部署 St ...
[tslint] Identifier 'loggedIn' is never reassigned; use 'const' instead of 'let'. (prefer-const)
vue判断用户在页面停留时间是否超时
需求当用户停留超过15分钟后,用户提交订单,提示用户超时并重新加载页面代码 data () { return { // 超时定时器 overTimer: null, // 是否超时 isOvert ...
Linux 文件目录配置及命令总结
前言在Linux中,一切皆文件,而每一个文件和目录都是从根目录开始的 Linux文件目录的作用 /bin目录:用来存放二进制可执行命令的目录,用户常用的命令都存在该目录下. /sbin目录:用来存放 ...
pojo层、dao层、service层、controller层的作用
分层解耦介绍 1.pojo层(model) 实体层数据库在项目中的类 model是模型的意思,与entity.domain.pojo类似,是存放实体的类. 类中定义了多个类属性,并与数据库表的字段保 ...
MySQL复习——20211027
MYSQL MySQL创建数据库我们可以在登录MySQL服务后,使用create命令创建数据库,语法如下: CREATE DATABASE 数据库名; 使用root用户登录,root用户拥有最高权限 ...
代码使我头疼之React初学习
前言开始了,去年(2020)说要学的React,到现在2021年的12月底了,才来实施--(年底警告!年末总结还没开始写!) 不过前端为啥要学React呢?Vue不是很好用吗?Vue确实很好用,并且 ...
[转帖]elasticsearch 8.0 linux安装部署
1. 下载安装包 https://www.elastic.co/cn/downloads/elasticsearch 选择下载linux版本,elasticsearch-8.0.0-linux-x86 ...
Jmeter学习之三_知识梳理
Jmeter学习之三_知识梳理背景简单学习了Jmeter的两个用例感觉可以继续深入学习一下Jmeter了. 所以想着趁体检入职之前继续学习完善一下. 希望能够继续提高 Jmeter的相关知识 1 ...
【转帖】Linux 调优篇：虚拟化调优（hugepage 大页内存）* 叁
一. 大页(HugePages)概念Hugepage的引入二. hugepages相关概念三.Regular Pages 与 HugePagesa.Regular Pagesb.Huge Pages四 ...

Collectors.toMap的暗坑与避免方式