有效提升大数据量写入excel的效率

在开发过程中经常会有需要将数据导出到 excel 的需求，当数据量很大，达到几万甚至几十万、几百万级别的时候，如何加快生成 excel 的速度呢？
首先普及一下知识背景：
Excel2003 及以下版本一张表最多支持 65536 行、256 列数据，所以要生成十万、百万级别数据就不能用 Excel2003 了；
Excel2007 版本一张表最多支持1048576行，16384 列，基本可以满足百万级别以下的数据量级。

一般通过 poi 生成 excel 的方式如下：(原谅我以前没有研究过poi，就只会用这种方式，而且网上的demo好多也是这种方式)

 public static void exportDataToExcel1(String[] header, List<String[]> datas, String path) {

         File file = new File(path);

         Workbook workbook = null;

         if (path.endsWith(EXCEL_2003)) {

             workbook = new HSSFWorkbook();

         }

         if (path.endsWith(EXCEL_2007)) {

             workbook = new XSSFWorkbook();

         }

         Sheet sheet = workbook.createSheet();

         Row firstRow = sheet.createRow(0); //第一行

         for (int i = 0; i < header.length; i++) {

             Cell cell = firstRow.createCell(i);

             cell.setCellValue(header[i]);

         }

         if (datas != null && datas.size() > 0) {

             for (int i = 0; i < datas.size(); i++) {

                 Row row = sheet.createRow(i + 1);

                 String[] d = datas.get(i);

                 for (int j = 0; j < d.length; j++) {

                     Cell cell = row.createCell(j);

                     cell.setCellValue(d[j]);

                 }

             }

         }

         try {

             OutputStream outputStream = new FileOutputStream(file);

             workbook.write(outputStream);

             outputStream.flush();

             outputStream.close();

         } catch (FileNotFoundException e) {

             e.printStackTrace();

         } catch (IOException e) {

             e.printStackTrace();

         }

     }

利用上述方式生成一张 10万行、30 列的 excel 表在我的电脑上耗时大约40多秒

数据准备了 1731 ms

导出花费了 46795 ms

查看 poi 官网http://poi.apache.org/spreadsheet/index.html发现从 3.8 beta3 版本开始新增 SXSSF api 用于解决大数据量场景

这种方式新增了自动刷入数据的机制，可以设置一个数据量阈值，达到这个阈值后会将数据刷入到磁盘，缓解了运行时的压力。

改后的代码如下：

public static void exportDataToExcel(String[] header, List<String[]> datas, String path) {

        File file = new File(path);

        SXSSFWorkbook sxssfWorkbook = new SXSSFWorkbook(100);

        Sheet sheet = sxssfWorkbook.createSheet();

        Row firstRow = sheet.createRow(0);         //第一行

        for (int i = 0; i < header.length; i++) {

            Cell cell = firstRow.createCell(i);

            cell.setCellValue(header[i]);

        }

        if (datas != null && datas.size() > 0) {

            for (int i = 0; i < datas.size(); i++) {

                Row row = sheet.createRow(i + 1);

                String[] d = datas.get(i);

                for (int j = 0; j < d.length; j++) {

                    Cell cell = row.createCell(j);

                    cell.setCellValue(d[j]);

                }

            }

        }

        try {

            OutputStream outputStream = new FileOutputStream(file);

            sxssfWorkbook.write(outputStream);

            outputStream.flush();

            outputStream.close();

        } catch (FileNotFoundException e) {

            e.printStackTrace();

        } catch (IOException e) {

            e.printStackTrace();

        }finally {

            sxssfWorkbook.dispose();

        }

    }

使用这种方式测试相同量级的数据，导出excel缩短到了6、7秒，可见这个提升幅度还是很明显的。

数据准备了 1096 ms

导出花费了 6784 ms

有效提升大数据量写入excel的效率的更多相关文章

Winform .NET 利用NPOI导出大数据量的Excel
前言:公司让做一个导出数据到Excel的小工具,要求是用户前端输入sql语句,点击导出按钮之后,将数据导出到Excel,界面如图所示:文件下端显示导出的进度遇到的问题: 1.使用NPOI进行Exce ...
浅谈PageHelper插件分页实现原理及大数据量下SQL查询效率问题解决
前因:项目一直使用的是PageHelper实现分页功能,项目前期数据量较少一直没有什么问题.随着业务扩增,数据库扩增PageHelper出现了明显的性能问题.几十万甚至上百万的单表数据查询性能缓慢,需 ...
POI读写大数据量EXCEL
另一篇文章http://www.cnblogs.com/tootwo2/p/8120053.html里面有xml的一些解释. 大数据量的excel一般都是.xlsx格式的,网上使用POI读写的例子比较 ...
java 导出Excel 大数据量，自己经验总结！
出处: http://lyjilu.iteye.com/ 分析导出实现代码,XLSX支持: /** * 生成<span style="white-space: normal; back ...
POI读写大数据量excel，解决超过几万行而导致内存溢出的问题
1. Excel2003与Excel2007 两个版本的最大行数和列数不同,2003版最大行数是65536行,最大列数是256列,2007版及以后的版本最大行数是1048576行,最大列数是16384 ...
[转]POI大数据量Excel解决方案
全文转载自:jinshuaiwang的博客目前处理Excel的开源javaAPI主要有两种,一是Jxl(Java Excel API),Jxl只支持Excel2003以下的版本.另外一种是Apach ...
POI3.8解决导出大数据量excel文件时内存溢出的问题
POI3.8的SXSSF包是XSSF的一个扩展版本,支持流处理,在生成大数据量的电子表格且堆空间有限时使用.SXSSF通过限制内存中可访问的记录行数来实现其低内存利用,当达到限定值时,新一行数据的加入 ...
c#中@标志的作用 C#通过序列化实现深表复制细说并发编程-TPL 大数据量下DataTable To List效率对比【转载】C#工具类：实现文件操作File的工具类异步多线程 Async .net 多线程 Thread ThreadPool Task .Net 反射学习
c#中@标志的作用参考微软官方文档-特殊字符@,地址 https://docs.microsoft.com/zh-cn/dotnet/csharp/language-reference/toke ...
java excel大数据量导入导出与优化
package com.hundsun.ta.utils; import java.io.File; import java.io.FileOutputStream; import java.io.I ...

随机推荐

Linux中文乱码问题终极解决方法
方法一: 修改/root/.bash_profile文件,增加export LANG=zh_CN.GB18030该文件在用户目录下,对于其他用户,也必须相应修改该文件. 使用该方法时putty能显示中 ...
Tomcat集群环境下session共享方案通过memcached 方法实现
对于web应用集群的技术实现而言,最大的难点就是:如何能在集群中的多个节点之间保持数据的一致性,会话(Session)信息是这些数据中最重要的一块.要实现这一点, 大体上有两种方式:一种是把所有Ses ...
HDU5312 Sequence
题意:t组数据,每组数据给个m.问m最少能由几项形如3*n*(n-1)+1的数表示 eg 7=1(n=1)+1(n=1)+1(n=1)+1(n=1)+1(n=1)+1(n=1)+1(n=1); ...
Android技术——在Android中的随意视图中找控件
1.在非常多情况下,我们可能不知道控件的id,可是我们却希望在包括这个控件的视图中找到它,能够採用例如以下做法: 例:在Activity的根视图中找出当中全部的Button控件 private voi ...
使用ant运行testng的testng.xml并且使用testng-results.xsl美化结果
先看build.xml <?xml version="1.0" encoding="UTF-8"?> <project basedir=&qu ...
云计算之路-试用Azure：搭建自己的内网DNS服务器
之前我们写过一篇博文谈到Azure内置的内网DNS服务器不能跨Cloud Service,而我们的虚拟机部署场景恰恰需要跨多个Cloud Service,所以目前只能选择用Azure虚拟机搭建自己的内 ...
SQL Server中按照条件随机返回数据
需求:查询对应关键字的数据,并随机返回一条. 这时,需要一个SQL的那只方法:NEWID(). 用法: [sql]SELECT TOP 1 * FROM Table WHERE TID = 1 ORD ...
1年内4次架构调整，谈Nice的服务端架构变迁之路
Nice 本身是一款照片分享社区类型的应用,在分享照片和生活态度的同时可以在照片上贴上如品牌.地点.兴趣等tag. Nice从2013.10月份上线App Store到目前每天2亿PV,服务端架构经过 ...
UIWebView捕获内部web点击事件
在此有一个webView默认是打开百度的页面:设置代理,并在代理中处理 - (BOOL)webView:(UIWebView *)webView shouldStartLoadWithRequest ...
Activity生命周期以及启动模式对生命周期的影响
前天用户体验反馈的一个需求,要求每次进入应用都定位到首页;这个操作很明显不适合放在首页Activity(启动模式为SingleTask)的onResume中,如果对Activity的启动模式和生命周期 ...

有效提升大数据量写入excel的效率

有效提升大数据量写入excel的效率的更多相关文章

随机推荐

热门专题