Java通用集合分组实现方案详解：从基础到高级实践

在Java开发中，对集合中的元素按照特定属性进行分组是一项常见而重要的操作。本文将全面介绍Java中实现集合分组的多种方案，从基础实现到高级用法，并通过丰富的示例展示每种方案的实际效果。

一、基础分组实现

1.1 单属性分组

最基本的集合分组方式是按照对象的单个属性进行分组：

// 通用单属性分组方法

public static <T, K> Map<K, List<T>> groupBySingleProperty(

        Collection<T> collection,

        Function<T, K> classifier) {

    return collection.stream()

            .collect(Collectors.groupingBy(classifier));

}

// 使用示例：按姓名分组

Map<String, List<Person>> byName = groupBySingleProperty(people, Person::getName);

// 结果输出

System.out.println("按姓名分组结果:");

byName.forEach((name, list) ->

    System.out.println("  " + name + ": " + list));

执行结果：

按姓名分组结果:

  Bob: [Bob(30,Chicago), Bob(25,New York)]

  Alice: [Alice(25,New York), Alice(25,Chicago), Alice(30,New York)]

1.2 多属性分组（使用List作为键）

当需要按照多个属性组合作为分组依据时：

// 通用多属性分组方法

public static <T, K> Map<List<K>, List<T>> groupByMultipleProperties(

        Collection<T> collection,

        Function<T, K>... classifiers) {

    return collection.stream()

            .collect(Collectors.groupingBy(

                item -> Arrays.stream(classifiers)

                        .map(fn -> fn.apply(item))

                        .collect(Collectors.toList())

            ));

}

// 使用示例：按姓名和年龄分组

Map<List<Object>, List<Person>> byNameAndAge =

    groupByMultipleProperties(people, Person::getName, Person::getAge);

// 结果输出

System.out.println("\n按姓名和年龄分组结果:");

byNameAndAge.forEach((key, list) ->

    System.out.println("  " + key + ": " + list));

执行结果：

按姓名和年龄分组结果:

  [Alice, 25]: [Alice(25,New York), Alice(25,Chicago)]

  [Bob, 30]: [Bob(30,Chicago)]

  [Alice, 30]: [Alice(30,New York)]

  [Bob, 25]: [Bob(25,New York)]

二、增强型分组实现

2.1 使用GroupKey分组

为避免使用List作为Map键可能带来的问题，我们可以引入专门的GroupKey类：

// GroupKey定义

public static class GroupKey {

    private final Object[] keys;

    public GroupKey(Object... keys) {

        this.keys = keys;

    }

    @Override

    public boolean equals(Object o) {

        if (this == o) return true;

        if (!(o instanceof GroupKey)) return false;

        GroupKey groupKey = (GroupKey) o;

        return Arrays.equals(keys, groupKey.keys);

    }

    @Override

    public int hashCode() {

        return Arrays.hashCode(keys);

    }

    @Override

    public String toString() {

        return Arrays.toString(keys);

    }

}

// 使用GroupKey的分组方法

public static <T> Map<GroupKey, List<T>> groupByWithGroupKey(

        Collection<T> collection,

        Function<T, ?>... classifiers) {

    return collection.stream()

            .collect(Collectors.groupingBy(

                item -> new GroupKey(

                    Arrays.stream(classifiers)

                          .map(fn -> fn.apply(item))

                          .toArray()

                )

            ));

}

// 使用示例：按年龄和城市分组

Map<GroupKey, List<Person>> byAgeAndCity =

    groupByWithGroupKey(people, Person::getAge, Person::getCity);

// 结果输出

System.out.println("\n使用GroupKey按年龄和城市分组结果:");

byAgeAndCity.forEach((key, list) ->

    System.out.println("  " + key + ": " + list));

执行结果：

使用GroupKey按年龄和城市分组结果:

  [25, New York]: [Alice(25,New York), Bob(25,New York)]

  [30, Chicago]: [Bob(30,Chicago)]

  [25, Chicago]: [Alice(25,Chicago)]

  [30, New York]: [Alice(30,New York)]

三、基于枚举的高级分组方案

3.1 枚举分组基础架构

// 分组字段枚举接口

public interface GroupFieldEnum<T> {

    Function<T, Object> getExtractor();

    String getFieldName();

}

// Person类的分组字段枚举

public enum PersonGroupField implements GroupFieldEnum<Person> {

    NAME("姓名", Person::getName),

    AGE("年龄", Person::getAge),

    CITY("城市", Person::getCity);

    private final String fieldName;

    private final Function<Person, Object> extractor;

    PersonGroupField(String fieldName, Function<Person, Object> extractor) {

        this.fieldName = fieldName;

        this.extractor = extractor;

    }

    @Override

    public Function<Person, Object> getExtractor() {

        return extractor;

    }

    @Override

    public String getFieldName() {

        return fieldName;

    }

}

// 枚举分组工具类

public class EnumGroupingUtils {

    public static <T, E extends Enum<E> & GroupFieldEnum<T>>

            Map<GroupKey, List<T>> groupByEnumFields(

            Collection<T> collection,

            E... groupFields) {

        return collection.stream()

                .collect(Collectors.groupingBy(

                    item -> new GroupKey(

                        Arrays.stream(groupFields)

                              .map(field -> field.getExtractor().apply(item))

                              .toArray()

                    )

                ));

    }

}

3.2 枚举分组使用示例

// 按枚举字段分组示例

System.out.println("\n枚举分组方案演示:");

// 按姓名分组

Map<GroupKey, List<Person>> byNameEnum =

    EnumGroupingUtils.groupByEnumFields(people, PersonGroupField.NAME);

System.out.println("1. 按姓名分组结果:");

byNameEnum.forEach((key, list) ->

    System.out.println("  " + key + ": " + list));

// 按姓名和年龄分组

Map<GroupKey, List<Person>> byNameAndAgeEnum =

    EnumGroupingUtils.groupByEnumFields(people,

        PersonGroupField.NAME, PersonGroupField.AGE);

System.out.println("\n2. 按姓名和年龄分组结果:");

byNameAndAgeEnum.forEach((key, list) ->

    System.out.println("  " + key + ": " + list));

// 按所有字段分组

Map<GroupKey, List<Person>> byAllFieldsEnum =

    EnumGroupingUtils.groupByEnumFields(people,

        PersonGroupField.values());

System.out.println("\n3. 按所有字段分组结果:");

byAllFieldsEnum.forEach((key, list) ->

    System.out.println("  " + key + ": " + list));

// 动态选择分组字段

List<PersonGroupField> dynamicFields = new ArrayList<>();

dynamicFields.add(PersonGroupField.CITY);

dynamicFields.add(PersonGroupField.AGE);

Map<GroupKey, List<Person>> dynamicResult =

    EnumGroupingUtils.groupByEnumFields(people,

        dynamicFields.toArray(new PersonGroupField[0]));

System.out.println("\n4. 动态选择字段(城市+年龄)分组结果:");

dynamicResult.forEach((key, list) ->

    System.out.println("  " + key + ": " + list));

执行结果：

枚举分组方案演示:

1. 按姓名分组结果:

  [Alice]: [Alice(25,New York), Alice(25,Chicago), Alice(30,New York)]

  [Bob]: [Bob(30,Chicago), Bob(25,New York)]

2. 按姓名和年龄分组结果:

  [Alice, 25]: [Alice(25,New York), Alice(25,Chicago)]

  [Bob, 30]: [Bob(30,Chicago)]

  [Alice, 30]: [Alice(30,New York)]

  [Bob, 25]: [Bob(25,New York)]

3. 按所有字段分组结果:

  [Alice, 25, New York]: [Alice(25,New York)]

  [Bob, 30, Chicago]: [Bob(30,Chicago)]

  [Alice, 25, Chicago]: [Alice(25,Chicago)]

  [Alice, 30, New York]: [Alice(30,New York)]

  [Bob, 25, New York]: [Bob(25,New York)]

4. 动态选择字段(城市+年龄)分组结果:

  [New York, 25]: [Alice(25,New York), Bob(25,New York)]

  [Chicago, 30]: [Bob(30,Chicago)]

  [Chicago, 25]: [Alice(25,Chicago)]

  [New York, 30]: [Alice(30,New York)]

四、技术深度解析

4.1 `toArray(new PersonGroupField[0])`原理

在动态字段分组中使用的这种写法是Java集合转数组的惯用模式：

dynamicFields.toArray(new PersonGroupField[0])

作用：将List转换为PersonGroupField[]数组
原理：
1. 传入空数组作为类型模板
2. JVM根据运行时类型信息创建正确类型和大小的新数组
3. 比直接指定大小更简洁高效（无需先调用size()）
Java 11+优化：可使用toArray(PersonGroupField[]::new)替代

4.2 枚举分组的优势

类型安全：编译器会检查枚举值的有效性
可维护性：所有分组字段集中管理，修改方便
自描述性：枚举可包含字段描述信息
IDE支持：代码自动补全和提示更完善
可扩展性：新增分组字段只需添加枚举项

五、方案对比与选型建议

方案	适用场景	优点	缺点
单属性分组	简单分组需求	实现简单	功能有限
多属性List分组	临时性多字段分组	无需额外类	List作为键不够直观
GroupKey分组	需要清晰键定义的分组	键表达明确	需维护GroupKey类
枚举分组	企业级应用、复杂分组需求	类型安全、可维护	需要前期设计

选型建议：

简单工具类：使用基础分组方案
中型项目：推荐GroupKey方案
大型复杂系统：采用枚举分组架构
需要最大灵活性：结合动态字段选择

六、性能优化建议

大数据集处理：

// 使用并行流提高处理速度

Map<GroupKey, List<Person>> result = people.parallelStream()

        .collect(Collectors.groupingBy(...));

内存优化：
- 对于不可变数据集，考虑使用Guava的ImmutableListMultimap
- 分组结果如果不需要修改，返回不可变集合
缓存优化：
- 频繁使用的分组结果可以考虑缓存
- 对于相同分组条件的多次操作，可以复用分组结果

七、总结

本文详细介绍了Java中实现集合分组的四种主要方案，从基础的Collectors.groupingBy()使用到基于枚举的高级分组架构。每种方案都附带了完整的代码示例和实际执行结果展示，帮助开发者深入理解其实现原理和应用场景。

对于大多数项目，推荐从GroupKey方案开始，它在复杂度和功能性之间取得了良好的平衡。随着项目规模扩大，可以平滑过渡到枚举分组方案，获得更好的类型安全性和可维护性。

无论选择哪种方案，理解分组操作背后的原理和各个方案的优缺点，都能帮助开发者写出更高效、更易维护的集合处理代码。

【集合分组利器】Java通用集合分组方案的更多相关文章

Mysql高手系列 - 第9篇：详解分组查询，mysql分组有大坑！
这是Mysql系列第9篇. 环境:mysql5.7.25,cmd命令中进行演示. 本篇内容分组查询语法聚合函数单字段分组多字段分组分组前筛选数据分组后筛选数据 where和having的区 ...
android系统联系人分组特效实现(1)---分组导航和挤压动画
1.打开activity_main.xml <RelativeLayout xmlns:android="http://schemas.android.com/apk/res/andr ...
java集合框架之java HashMap代码解析
java集合框架之java HashMap代码解析文章Java集合框架综述后,具体集合类的代码,首先以既熟悉又陌生的HashMap开始. 源自http://www.codeceo.com/arti ...
mysql按字段分组并获取每个分组按照某个字段排序的前三条
这是原始数据想按照brand_id分组并获取每个分组total_num最高的前3位 SQL语句为: > (select count(*) from data where brand_id = ...
ThinkPHP第七天(F函数使用，项目分组配置，项目分组模板文件放置规则配置)
1.F(文件名称,写入数据,写入地址),用于将数据写入至磁盘文件中,如F('Data',$arr,'./Data/'),作用是将$arr写入至网站根目录的Data文件夹中的Data.php中. 2.读 ...
java集合框架容器 java框架层级继承图结构集合框架的抽象类集合框架主要实现类
本文关键词: java集合框架框架设计理念容器继承层级结构继承图集合框架中的抽象类主要的实现类实现类特性集合框架分类集合框架并发包并发实现类什么是容器? 由一个或多个确 ...
split与re.split/捕获分组和非捕获分组/startswith和endswith和fnmatch/finditer 笔记
split()对字符串进行划分: >>> a = 'a b c d' >>> a.split(' ') ['a', 'b', 'c', 'd'] 复杂一些可以使用r ...
Oracle分组函数以及数据分组
简单总结一下对于数据的分组和分组函数. 本文所举实例,数据来源oracle用户scott下的emp,dept ,salgrade 3表:数据如下: 一.分组函数 1.sum()求和函数.max()求最 ...
Mysql：实现分组查询拼接未分组同一字段字符group_concat()
Mysql:实现分组查询拼接未分组同一字段字符group_concat() MySQL中,如果想实现将分组之后的多个数据合并到一列,可以使用group_concat函数,如下图所示: 在oralce中 ...
SQL Server 根据日期分组、根据时间段分组（每三个小时一组）
所用数据表: 一.根据日期分组 1. 使用convert() 函数方式 --根据年月 ),CreatTime,)日期,COUNT(*) 次数,sum(Money)总数 from Orders ),Cr ...

随机推荐

ASP6.0 (VB) 获取目录下所有图片文件
<% 'Desc : ASP6.0 (VB) 获取目录下所有图片文件 'by : wgscd 'date : 2024-2-1 dim c_path c_path=Server.MapPath( ...
w3cschool-Netty 实战精髓篇3
https://www.w3cschool.cn/essential_netty_in_action/essential_netty_in_action-wd1j28dq.html Netty Web ...
Flume架构与源码分析-整体架构
最近在学习Flume源码,所以想写一份Flume源码学习的笔记供需要的朋友一起学习参考. 1.Flume介绍 Flume是cloudera公司开源的一款分布式.可靠地进行大量日志数据采集.聚合和并转移 ...
【转载】Geojson常用工具，收藏备用
收集了网上几个比较好用的网站,收藏备用 1.Geojson数据下载器:http://datav.aliyun.com/tools/atlas/#&lat=33.54139466898275&a ...
Maven：目前的部分技术
第4章 C#的高级特性
第4章 C#的高级特性 4.1 委托 4.1.2 多播委托对值为 null 的委托变量进行 + 或 += 操作,等价于为变量指定一个新值: SomeDelegate d = null; d += ...
TCP 和 UDP 可以使用同一个端口吗？
文档地址:https://mp.weixin.qq.com/s/3fMZN_LidCi5fiD16nNWWA
【忍者算法】从生活场景理解链表反转：最重要的基础算法｜LeetCode第206题反转链表
从生活场景理解链表反转:最重要的基础算法为什么这道题如此重要反转链表看似简单,却是链表操作的基石.就像建房子要先打好地基,做复杂的链表操作前必须深刻理解反转原理.无数高频面试题都建立在这个基础之上 ...
mongo数据库CPU使用率飙高及优化
出现的情况某天高高兴兴上班,发现一台mongo数据库负载较高,达到了300多,且一直很稳定,难道是硬件过时了. 检查主机的资源使用发现一个mongod进程使用了几乎所有的CPU资源. top - 1 ...
WPF 事件实现MVVM中的Command绑定
1. 在ViewModel中弹出消息提示框,需要添加下面的代码块: <dxmvvm:Interaction.Behaviors> <dx:DXMessageBoxService /& ...

【集合分组利器】Java通用集合分组方案

Java通用集合分组实现方案详解：从基础到高级实践

一、基础分组实现

1.1 单属性分组

1.2 多属性分组（使用List作为键）

二、增强型分组实现

2.1 使用GroupKey分组

三、基于枚举的高级分组方案

3.1 枚举分组基础架构

3.2 枚举分组使用示例

四、技术深度解析

4.1 toArray(new PersonGroupField[0])原理

4.2 枚举分组的优势

五、方案对比与选型建议

六、性能优化建议

七、总结

【集合分组利器】Java通用集合分组方案的更多相关文章

随机推荐

热门专题

4.1 `toArray(new PersonGroupField[0])`原理