项目需求

导出生成大批量数据的文件，一个Excel中最多存有五十万条数据，查询多余五十万的数据写多个Excel中。导出完成是生成的多个Excel文件打包压缩成zip，而后更新导出记录中的压缩文件路径。

大数据量文件一般采用异步生成文件，导出时首先授权生成一个流水号，而后将数据携带流水号请求导出接口。

抛开实际业务，做成一个比较公共的导出功能。

参数说明

{

    "className": "ValideData",         //导出的数据的实体类，类中有别名和顺序相关的注解

    "createUser": "",				//操作人

    "downLoadNo": "202203181504732568468066304",  	//下载流水号

    "fileName": "机卡绑定",          //文件名      fileName+HHmmssSSS.xlsx

    "keys": [						//redis key的数据，分批获取数据

    ],

    "remark": "机卡绑定",				//备注（不关注）

    "type": "机卡绑定"					//导出类型（不关注）

}

坐标

<dependency>

  <groupId>org.apache.commons</groupId>

  <artifactId>commons-compress</artifactId>

  <version>1.21</version>

</dependency>

注：抛开导出前的参数校验，只关注导出操作。

主要代码

逻辑说明：

导出前将请求参数更新到导出记录中。
类加载器加载需要导出数据的实体类
设置一个数据量指针，记录到每个文件的数据量
达到阈值时指定文件写出到磁盘并清缓。
重置数据量指针，新增一条文件记录（循环）
数据量指针未到阈值时但数据已经查询完成---->>写入剩余数据
查询该流水号的所有文件记录
压缩文件并返回压缩文件地址
更新到导出记录中

主流程

public void bigDataExport(PortDto dto) throws Exception {

    long start = System.currentTimeMillis();

    log.info("开始导出，批次号：<{}>, 开始时间：{}", dto.getDownLoadNo(), DateUtil.now());

    //修改导出记录

    LambdaUpdateWrapper<PortDto> updateWrapper = new LambdaUpdateWrapper<>();

    updateWrapper.eq(PortDto::getDownLoadNo, dto.getDownLoadNo());

    //生成导出记录

    int row = this.baseMapper.update(dto, updateWrapper);

    if (row > 0) {

        log.info("批次号：<{}>准备生成文件", dto.getDownLoadNo());

        try {

            Iterator<String> iterator = keys.iterator();

            Workbook workbook = null;

            ExportParams params = new ExportParams();

            //加载导出数据实体类

            Class<?> aClass = Class.forName(entityBasePackage + dto.getClassName());

            int element = 0;

            while (iterator.hasNext()) {

                String key = iterator.next();

                Collection<?> list = getList(key, aClass);

                element += list.size();

                workbook = ExcelExportUtil.exportBigExcel(params, aClass, list);

                //文件数据达到阈值

                if (element >= maxDataCount) {

                    String fileName = dto.getFileName() + "_" + DateUtil.format(new Date(),

                            "HHmmssSSS") + ".xlsx";

                    ExcelExportUtil.closeExportBigExcel();

                    FileOutputStream fos =

                            new FileOutputStream(fileProp.getPath().getPath() + fileName);

                    workbook.write(fos);

                    fos.close();

                    element = 0;

                    //更新地址

                    Map<String, Object> map = new HashMap<>();

                    map.put("downloadNo", dto.getDownLoadNo());

                    map.put("filePath", fileProp.getPath().getPath() + fileName);

                    map.put("createTime", new Date());

                    this.baseMapper.insertPathRecord(map);

                    log.info("文件写入完成，文件名：{}", fileName);

                    continue;

                }

                iterator.remove();

            }

            //写入剩余文件

            if (element != 0) {

                String fileName = dto.getFileName() + "_" + DateUtil.format(new Date(),

                        "HHmmssSSS") + ".xlsx";

                ExcelExportUtil.closeExportBigExcel();

                FileOutputStream fos = new FileOutputStream(fileProp.getPath().getPath() + fileName);

                workbook.write(fos);

                fos.close();

                element = 0;

                //更新地址

                Map<String, Object> map = new HashMap<>();

                map.put("downloadNo", dto.getDownLoadNo());

                map.put("filePath", fileProp.getPath().getPath() + fileName);

                map.put("createTime", new Date());

                this.baseMapper.insertPathRecord(map);

                log.info("文件写入完成，文件名：{}", fileName);

            }

            long end = System.currentTimeMillis();

            log.info("导出结束，批次号：<{}>, 结束时间：{}， 耗时：{}", dto.getDownLoadNo(), DateTime.of(end),

                    DateUtil.formatBetween(end - start));

        } catch (Exception e) {

            log.info("批次号<{}>导出异常：", dto.getDownLoadNo(), e);

            throw new BusinessException("");

        } finally {

            log.info("批次号<{}>生成文件结束，准备压缩文件，修改状态", dto.getDownLoadNo());

            //合并文件到导出文件记录主表

            //当只有一个文件记录时直接更新主表文件地址

            List<PortDto> recordList = exportDao.getPathRecord(dto);

            if (recordList.size() > 1) {

                //zipPath

                dto.setFilePath(zcat(dto, recordList));

            } else {

                //xlsxPath

                dto.setFilePath(recordList.size()==0? "":recordList.get(0).getFilePath());

            }

            updateWrapper.clear();

            updateWrapper.set(PortDto::getFilePath, dto.getFilePath());

            updateWrapper.set(PortDto::getSuccessTime, new Date());

            updateWrapper.set(PortDto::getStatus, "1");

            updateWrapper.eq(PortDto::getDownLoadNo, dto.getDownLoadNo());

            this.baseMapper.update(null, updateWrapper);

            log.info("批次号<{}>更新下载记录表文件地址，修改状态成功", dto.getDownLoadNo());

        }

    }

}

文件压缩

/**

 *  多文件压缩

 * @param dto 导出信息

 * @Param recordList 文件路径

 * @return void

 * @throws

 * @author Surpass

 * @date 2022/3/17 9:59

 */

private String zcat(PortDto dto, List<PortDto> recordList) throws Exception {

    String fileName = dto.getFileName() + "_" + DateUtil.format(new Date(), "HHmmssSSS") + ".zip";

    String zipPath = fileProp.getPath().getPath() + fileName;

    Archiver archiver = CompressUtil.createArchiver(

            CharsetUtil.CHARSET_UTF_8,

            ArchiveStreamFactory.ZIP,

            new File(zipPath)

    );

    for (PortDto portDto : recordList) {

        archiver.add(FileUtil.file(portDto.getFilePath()));

    }

    archiver.finish();

    archiver.close();

    return zipPath;

}

查询数据

/**

 *   查询redis数据

 * @param key

 * @param cls

 * @return java.util.Collection<?>

 * @throws

 * @author Surpass

 * @date 2022/3/18 15:51

 */

private Collection<?> getList(String key, Class<?> cls) {

    List<String> list = redis.getList(key);

    return list.stream().map(item -> JSONObject.parseObject(item, cls)).collect(Collectors.toList());

}

补充

导出还设置了队列计数器来限制同一时间最大的导出请求，使用aop在申请流水号时计数器+1，导出完成或者异常时队列计数器-1。导出完成后根据操作人发送邮件通知导出结果。

Export大数据量导出和打包的更多相关文章

poi 操作Excel 以及大数据量导出
maven 依赖 (版本必须一致,否则使用SXSSFworkbook 时程序会报错) <dependency> <groupId>org.apache.poi</grou ...
SQL Server 使用bcp进行大数据量导出导入
转载:http://www.cnblogs.com/gaizai/archive/2010/04/17/1714389.html SQL Server的导出导入方式有: 在SQL Server中提供了 ...
使用内存映射文件MMF实现大数据量导出时的内存优化
前言导出功能几乎是所有应用系统必不可少功能,今天我们来谈一谈,如何使用内存映射文件MMF进行内存优化,本文重点介绍使用方法,相关原理可以参考文末的连接实现我们以单次导出一个excel举例(csv ...
EasyPoi大数据导入导出百万级实例
EasyPoi介绍: 利用注解的方式简化了Excel.Word.PDF等格式的导入导出,而且是百万级数据的导入导出.EasyPoi官方网址:EasyPoi教程_V1.0 (mydoc.io).下面我写 ...
java 导出Excel 大数据量，自己经验总结！
出处: http://lyjilu.iteye.com/ 分析导出实现代码,XLSX支持: /** * 生成<span style="white-space: normal; back ...
NPOI大数据量多个sheet导出源码（原）
代码如下: #region NPOI大数据量多个sheet导出 /// <summary> /// 大数据量多个sheet导出 /// </summary> /// <t ...
java excel大数据量导入导出与优化
package com.hundsun.ta.utils; import java.io.File; import java.io.FileOutputStream; import java.io.I ...
POI3.8解决导出大数据量excel文件时内存溢出的问题
POI3.8的SXSSF包是XSSF的一个扩展版本,支持流处理,在生成大数据量的电子表格且堆空间有限时使用.SXSSF通过限制内存中可访问的记录行数来实现其低内存利用,当达到限定值时,新一行数据的加入 ...
elasticsearch5.0集群大数据量迁移方法及注意事项
当es集群的数据量较小的情况下elasticdump这个工具比较方便,但是当数据量达到一定级别比如上百G的时候,elasticdump速度就很慢了,此时我们可以使用快照的方法进行备份 elasticd ...

随机推荐

JS字符串去替换元素再转换成数组
原创:转载需注明原创地址 https://www.cnblogs.com/fanerwei222/p/11648074.html JS字符串替换不必要的元素, 然后去除多余的空格, 转换成数组: va ...
fuzz——AFL基础使用方法
最近打 ctf 的时候感觉有点遇到瓶颈,就来 fuzz 这块看看. AFL 全称为 American huzzy loop,是 Fuzzing 最高级的测试工具之一.这个工具对有源码和无源码的二进制程 ...
《PHP程序员面试笔试宝典》——如何处理与面试官持不同观点这个问题？
如何巧妙地回答面试官的问题? 本文摘自<PHP程序员面试笔试宝典> 在面试的过程中,求职者所持有的观点不可能与面试官一模一样,在对某个问题的看法上,很有可能两个人相去甚远.当与面试官持不同 ...
KC705E增强版基于FMC接口的 Kintex-7 XC7K325T PCIeX8 接口卡
一.板卡概述本板卡基于Xilinx公司的FPGAXC7K325T-2FFG900 芯片,pin_to_pin兼容FPGAXC7K410T-2FFG900 ,支持PCIeX8.64bit DDR3容量 ...
Solution -「CF 1375G」Tree Modification
\(\mathcal{Description}\) Link. 给定一棵 \(n\) 个结点的树,每次操作选择三个结点 \(a,b,c\),满足 \((a,b),(b,c)\in E\),并令 ...
nacos配置中心文件（bootstrap.properties）不生效问题解决
springcloud整合nacos作为配置中心时,配置文件不生效的问题在这个问题处卡了一天多,在网上各种搜索.大多数解决方案都是在bootstrap.properties文件中配置nacos地址. ...
[LeetCode]1470. 重新排列数组
给你一个数组 nums ,数组中有 2n 个元素,按 [x1,x2,...,xn,y1,y2,...,yn] 的格式排列. 请你将数组按 [x1,y1,x2,y2,...,xn,yn] 格式重新排列, ...
MHA + Maxscale 数据库的高可用和读写分离
MySQL 常见发行版本 MySQL 标准化.自动化部署深入浅出MySQL备份与恢复深入理解MySQL主从复制 MySQL构架设计与容量规划 MHA Maxscale MySQL 常见发行版本 M ...
2021年BI软件系统推荐，知名商业智能厂商品牌
国内外一直有一些厉害的商业智能厂商,在国外,例如国外微软的PowerBI.在国外是商业智能的行业领导者,在国外的市场占有率上远远领先其它产品,然而在中国市场却落后于国内商业智能厂商思迈特软件的Smar ...
Shell、命令行界面、控制台什么区别
Shell 是什么?Shell 是一个命令解释器,它为用户提供了一个向操作系统内核发送请求以便运行程序界面系统级程序,它的作用就是遵循一定的语法将输入的命令加以解释并传给系统,他大意是指对系统的操控 ...

Export大数据量导出和打包