java8学习之groupingBy源码分析

继续接着上一次【http://www.cnblogs.com/webor2006/p/8366083.html】来分析Collectors中的各种收集器的实现，对里它里面有个groupingby()方法，这个之前咱们也已经对它详细使用过，但是！！它的实现是比较复杂的，所以这次来仔细分析一下该方法的实现细节，纵览一下它，存在几个重载方式：

先来从最基础的开始分析，如下：

其中先来看一下该方法返回值所携带泛型的含义：

接着看下方法的参数，既提供一个分类器：

接着方法的实现是调用了另外一个groupingBy()：

那像这种有下游收集器的方法实现的一个大致思路是怎样的呢？downstream既然已经是一个收集器了，所以就会有收集器的那几个重要的方法，而还有一个分类器参数，其实就是将这个分类器应用到这个下游收集器当中，使得收集器进行了一系列的转换，而最终转换成的收集器则就是方法要返回的收集器啦，所以但凡方法中带有一个收集器然后又返回一个收集器其构造思路都类似。

目前这个groupingBy()有四个泛型了，下面先来对每个泛型有个认知：

接着再来看这个方法的具体实现，发现又调用了另外一个groupingBy()方法，如下：

而可以看到第二个参数实例化了一个HashMap对象，先不去看它所调用的另外一个重载groupingBy()方法的定义，从这个字面就能知道第二个参数肯定是做为最终的结果容器对象，所以说如果咱们在使用时是使用了第一个最简单的groupingBy()来对数据进行分组，最终返回的肯定是HashMap对象，而如果咱们想自己定义最终返回的类型比如：TreeMap，那这时就得使用最复杂的最后一个groupingBy()方法啦，所以下面将焦点转移到这个最复杂方法上面，先来贴出这个方法的实现先来感受一下其复杂性：

public static <T, K, D, A, M extends Map<K, D>>

    Collector<T, ?, M> groupingBy(Function<? super T, ? extends K> classifier,

                                  Supplier<M> mapFactory,

                                  Collector<? super T, A, D> downstream) {

        Supplier<A> downstreamSupplier = downstream.supplier();

        BiConsumer<A, ? super T> downstreamAccumulator = downstream.accumulator();

        BiConsumer<Map<K, A>, T> accumulator = (m, t) -> {

            K key = Objects.requireNonNull(classifier.apply(t), "element cannot be mapped to a null key");

            A container = m.computeIfAbsent(key, k -> downstreamSupplier.get());

            downstreamAccumulator.accept(container, t);

        };

        BinaryOperator<Map<K, A>> merger = Collectors.<K, A, Map<K, A>>mapMerger(downstream.combiner());

        @SuppressWarnings("unchecked")

        Supplier<Map<K, A>> mangledFactory = (Supplier<Map<K, A>>) mapFactory;

        if (downstream.characteristics().contains(Collector.Characteristics.IDENTITY_FINISH)) {

            return new CollectorImpl<>(mangledFactory, accumulator, merger, CH_ID);

        }

        else {

            @SuppressWarnings("unchecked")

            Function<A, A> downstreamFinisher = (Function<A, A>) downstream.finisher();

            Function<Map<K, A>, M> finisher = intermediate -> {

                intermediate.replaceAll((k, v) -> downstreamFinisher.apply(v));

                @SuppressWarnings("unchecked")

                M castResult = (M) intermediate;

                return castResult;

            };

            return new CollectorImpl<>(mangledFactory, accumulator, merger, finisher, CH_NOID);

        }

    }

艾玛~~先不看实现，看到泛型的定义就立马蒙圈，确实够复杂的，所以接下来准备一行行代码来理解它的具体实现，先来看一下它的参数定义：

而对于第二个groupingBy()方法在调用这个groupingBy()时，对于这个mapFactory传递的是：

接着简单的看一下它的javadoc:

上面这句话说的就是这个参数：

其中可以发现，因为要带排序功能，所以得用TreeMap，所以此时调用的groupingBy就是用的第三个最复杂的，因为自由的来决定最终返回的结果容器。

关于上面提到的groupingByConcurrent()函数也是有几个重载的，如下：

这个并行的分组函数待将groupingBy()函数分析完之后再对它进行分析。

好了，通过阅读javadoc已经对这个函数有了一定的认识，接下来则硬着头皮来分析它的具体实现啦，如下：

那从上游收集器中获取这些对象是干嘛用的呢？其实如开始所说，因为最终要返回一个Collector，所以最终的Collector的新对象是需要依赖于这个下游收集器来生成的，接着继续往下看：

下面具体看一下累加器的构建过程：

而其中用到卫个新的Map的方法：computeIfAbsent()，这是java1.8推出的，如下：

所以有必要理解一下这个方法是干嘛用的，先看一下它的javadoc:

言外之意就是说：如果值不存在才会进行计算，否则就直接返回了，而计算的值如果不为null，那么就将它放到map当中，那它的具体实现是怎样的呢？

嗯~~该函数理解了，接着再回到咱们所关的groupingBy()的这句代码上来：

其中使用到了一个mapMerger()的私有方法如下：

这个合并过程就不多说了，不难，重点知道这个函数的作用就是将两个Map进行数据合并，接着再回到主代码流程：

接着就到了一句比较难理解的代码了，如下：

理解这句代码的关键是要以生成一个新的收集器的角度去思考，而不要以groupingBy()传的那个mapFactory角度来理解，如下：

好了，一些新收集器需要的参数都已经准备好了，接下来就是将其实例化之后将其返回，如下：

接着再来看一下else的情况：很显然是下游收集器中不包含有"IDENTITY_FINISH"这个特性，那证明中间结果容器跟最终结果的类型是不一样的，最终肯定需要调用收集器的finisher()方法，所以生成的CollectorImpl是带有finihser的构造，如下：

其中特性也发生了变化，这里传了一个空的特性：

由于其它参数跟if中的一模一样，所以在else中主要是为了生成finisher，那下面看一下生成的具体细节：

那下面来看一下这个replaceAll方法：

其中接收一个BiFunction函数式接口，先看一下该方法的javadoc描述：

总而言之就是将map中的key对应的value值给替换掉，明白了此方法的作用之后，再回到咱们要分析的代码处：

此是intermediate对象就发生变化了，接着对它进行强制类型转换并但值返回：

至此最为复杂的groupingBy的方法就完完整整的分析完成，虽说这些实现在实际我们使用时完全不用去关心这些细节，但是！！通过分析底层的具体实现可以让我们对收集器理解得更加扎实，而且对于函数式编程也能够进一步巩固~所以说是有利无害的~

java8学习之groupingBy源码分析的更多相关文章

java8学习之Collector源码分析与收集器核心
之前已经对流在使用上已经进行了大量应用了,也就是说对于它的应用是比较熟悉了,但是比较欠缺的是对于它底层的实现还不太了解,所以接下来准备大量通过阅读官方的javadoc反过来加深对咱们已经掌握这些知识更 ...
java8学习之Stream源码分析
上一次已经将Collectors类中的各种系统收集器的源代码进行了完整的学习,而在之前咱们已经花了大量的篇幅对其Stream进行了详细的示例学习,如: 那接下来则通过源代码的角度来对Stream的运作 ...
Java8集合框架——LinkedList源码分析
java.util.LinkedList 本文的主要目录结构: 一.LinkedList的特点及与ArrayList的比较二.LinkedList的内部实现三.LinkedList添加元素四.L ...
Nginx学习笔记4 源码分析
Nginx学习笔记(四) 源码分析源码分析在茫茫的源码中,看到了几个好像挺熟悉的名字(socket/UDP/shmem).那就来看看这个文件吧!从简单的开始~~~ src/os/unix/Ngx_ ...
MQTT再学习 -- MQTT 客户端源码分析
MQTT 源码分析,搜索了一下发现网络上讲的很少,多是逍遥子的那几篇. 参看:逍遥子_mosquitto源码分析系列参看:MQTT libmosquitto源码分析参看:Mosquitto学习笔记 ...
Redis学习——ae事件处理源码分析
0. 前言 Redis在封装事件的处理采用了Reactor模式,添加了定时事件的处理.Redis处理事件是单进程单线程的,而经典Reator模式对事件是串行处理的.即如果有一个事件阻塞过久的话会导致整 ...
Java多线程学习之ThreadLocal源码分析
0.概述 ThreadLocal,即线程本地变量,是一个以ThreadLocal对象为键.任意对象为值的存储结构.它可以将变量绑定到特定的线程上,使每个线程都拥有改变量的一个拷贝,各线程相同变量间互不 ...
springMVC源码学习之addFlashAttribute源码分析
本文主要从falshMap初始化,存,取,消毁来进行源码分析,springmvc版本4.3.18.关于使用及验证请参考另一篇jsp取addFlashAttribute值深入理解即springMVC发r ...
大数据学习--day14(String--StringBuffer--StringBuilder 源码分析、性能比较)
String--StringBuffer--StringBuilder 源码分析.性能比较站在优秀博客的肩上看问题:https://www.cnblogs.com/dolphin0520/p/377 ...

随机推荐

从 ssh private key 中重新生成 public key
Use the -y option to ssh-keygen: ssh-keygen -f ~/.ssh/id_rsa -y > ~/.ssh/id_rsa.pub From the 'man ...
使用Nginx压缩文件、设置反向代理缓存提高响应速度
Gzip压缩: 最开始,这个竟然要6m多(大到不寻常),响应的速度3分多钟. 所以先对返回的文件进行gzip压缩.判断返回的资源是否有使用gzip压缩,观察响应头部里面,如果没有 Content-En ...
JAVA文件上传 ServletFileUpLoad 实例
1. jsp <%@ page language="java" contentType="text/html" pageEncoding="u ...
Django路由系统-分组命名匹配
Django路由系统分组命名匹配在上述基本配置示例中,使用了简单的正则表达式分组匹配来捕获URL中的值并以位置参数的形式传递给视图,例如url(r'^articles/([0-9]{4})/( ...
目前最新u盘启动快捷热键一览表
现在重装系统已不再是件难事了,一个普通的u盘就可以帮你搞定,但是对于一些新手来说在使用u盘启动盘安装系统是也许会遇到这样的小问题,面对一台新电脑时不知道该如何让电脑优先访问u盘从而进入PE系统下进行装 ...
【Linux开发】linux设备驱动归纳总结（三）：7.异步通知fasync
linux设备驱动归纳总结(三):7.异步通知fasync xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx ...
mysql 速度优化
1.添加索引 ALTER TABLE `cw_base_house` ADD INDEX idx_house ( `villageCode`, `buildingNo`, `unitNo`, `hou ...
浅谈Linux du命令
**du(disk usage),顾名思义,查看目录/文件占用空间大小** 1.查看当前目录下的所有目录以及子目录的大小 du -h du -ah #-h:用K.M.G的人性化形式显示#-a:显示目 ...
什么是云数据库 HBase 版
云数据库 HBase 版(ApsaraDB for HBase)是基于 Hadoop 的一个分布式数据库,支持海量的PB级的大数据存储,适用于高吞吐的随机读写的场景.目前在阿里内部有数百个集群,100 ...
建立分表sql执行语句批量生成工具（自创）
public void addTable (){ String add=""; for(int i=1;i<13;i++){ for(int j=0;j<60 ...

java8学习之groupingBy源码分析

java8学习之groupingBy源码分析的更多相关文章

随机推荐

热门专题