POI 海量数据/大数据文件生成SXSSFWorkbook使用简介

　　在之前我们知道处理xls的excel用的workbook是HSSFWorkbook，处理xlsx的excel用的是XSSFWorkbook。

　　上面两个类导出excel的时候数据会驻留在内存中，所以当数据量大的时候容易造成内存溢出。SXSSFWorkbook是用来生成海量excel数据文件,主要原理是借助临时存储空间生成excel。POI要求3.8以上,生成的文件格式要求是07及以上版本,因为excel07级以上版本的行数1048576,量很大,而03版本的只有6万多。

　　读取07及以上版本的excel仍然是“XSSFWorkbook”，写入则为“SXSSFWorkbook ”。

导出的代码:(一个简单的测试，如果想封装工具类，参考:https://www.cnblogs.com/qlqwjy/p/9974212.html)

package cn.xm.exam.utils;

import java.io.File;

import java.io.FileOutputStream;

import org.apache.poi.ss.usermodel.Cell;

import org.apache.poi.ss.usermodel.Row;

import org.apache.poi.ss.usermodel.Sheet;

import org.apache.poi.ss.usermodel.Workbook;

import org.apache.poi.xssf.streaming.SXSSFWorkbook;

public class SXSSFExcelUtil {

    public static void main(String[] args) {

        String[] title = { "id", "name", "sex" };

        // 创建一个工作簿

        Workbook workbook = new SXSSFWorkbook();

        // 创建一个工作表sheet

        Sheet sheet = workbook.createSheet();

        // 创建第一行

        Row row = sheet.createRow(0);

        // 创建一个单元格

        Cell cell = null;

        // 创建表头

        for (int i = 0; i < title.length; i++) {

            cell = row.createCell(i);

            cell.setCellValue(title[i]);

        }

        // 从第二行开始追加数据

        for (int i = 1; i <= 10000; i++) {

            // 创建第i行

            Row nextRow = sheet.createRow(i);

            // 参数代表第几列

            Cell cell2 = nextRow.createCell(0);

            cell2.setCellValue("a" + i);

            cell2 = nextRow.createCell(1);

            cell2.setCellValue("user" + i);

            cell2 = nextRow.createCell(2);

            cell2.setCellValue("男");

        }

        // 创建一个文件

        File file = new File("G:/tt1.xls");

        try {

            file.createNewFile();

            // 打开文件流

            FileOutputStream outputStream = new FileOutputStream(file);

            workbook.write(outputStream);

            outputStream.close();

        } catch (Exception e) {

            // TODO Auto-generated catch block

            e.printStackTrace();

        }

    }

}

补充:SXFFSWoorkbook导出的excel相比于XSSFWoorkbook导出的更节省空间:

下面分别是SXXFS\XFFS\HFFS导出上面1万条数据的excel的文件大小:

补充:测试HSSF\XSSF导出的数据占用内存，而SXFFS导出的数据不容易造成内存溢出

数据改为5万条并且写入之后查看内存信息:

(1)查看XSSF导出的时候占用JVM内存

package cn.xm.exam.utils;

import java.io.File;

import java.io.FileOutputStream;

import org.apache.poi.ss.usermodel.Cell;

import org.apache.poi.ss.usermodel.Row;

import org.apache.poi.ss.usermodel.Sheet;

import org.apache.poi.ss.usermodel.Workbook;

import org.apache.poi.xssf.usermodel.XSSFWorkbook;

public class SXSSFExcelUtil {

    public static void main(String[] args) {

        String[] title = { "id", "name", "sex" };

        // 创建一个工作簿

        Workbook workbook = new XSSFWorkbook();

        // 创建一个工作表sheet

        Sheet sheet = workbook.createSheet();

        // 创建第一行

        Row row = sheet.createRow(0);

        // 创建一个单元格

        Cell cell = null;

        // 创建表头

        for (int i = 0; i < title.length; i++) {

            cell = row.createCell(i);

            cell.setCellValue(title[i]);

        }

        // 从第二行开始追加数据

        for (int i = 1; i <= 50000; i++) {

            // 创建第i行

            Row nextRow = sheet.createRow(i);

            // 参数代表第几列

            Cell cell2 = nextRow.createCell(0);

            cell2.setCellValue("a" + i);

            cell2 = nextRow.createCell(1);

            cell2.setCellValue("user" + i);

            cell2 = nextRow.createCell(2);

            cell2.setCellValue("男");

        }

        // 创建一个文件

        File file = new File("G:/tt1.xls");

        try {

            file.createNewFile();

            // 打开文件流

            FileOutputStream outputStream = new FileOutputStream(file);

            workbook.write(outputStream);

            outputStream.close();

            // dispose of temporary files backing this workbook on disk

//            ((SXSSFWorkbook) workbook).dispose();

            System.out.println("创建完成");

            System.out.println("总的内存->" + Runtime.getRuntime().totalMemory() / 1024 / 1024 + "MB");

            System.out.println("剩余的内存->" + Runtime.getRuntime().freeMemory() / 1024 / 1024 + "MB");

        } catch (Exception e) {

            // TODO Auto-generated catch block

            e.printStackTrace();

        }

    }

}

结果:

创建完成
总的内存->883MB
剩余的内存->550MB

(2)查看SXSSF导出的时候占用JVM内存

将上面XSSF改为SXFFS查看结果：

创建完成
总的内存->182MB
剩余的内存->175MB

POI 海量数据/大数据文件生成SXSSFWorkbook使用简介的更多相关文章

POI实现大数据EXCLE导入导出，解决内存溢出问题
使用POI能够导出大数据保证内存不溢出的一个重要原因是SXSSFWorkbook生成的EXCEL为2007版本,修改EXCEL2007文件后缀为ZIP打开可以看到,每一个Sheet都是一个xml文件, ...
sqlcmd导入大数据文件
sqlcmd导入大数据文件 SQLCMD 允许在Windows命令窗中通过命令行提示符运行脚本. 语法如下: sqlcmd [ { { -U <login id> [ -P <p ...
POI读写大数据量EXCEL
另一篇文章http://www.cnblogs.com/tootwo2/p/8120053.html里面有xml的一些解释. 大数据量的excel一般都是.xlsx格式的,网上使用POI读写的例子比较 ...
POI读写大数据量excel，解决超过几万行而导致内存溢出的问题
1. Excel2003与Excel2007 两个版本的最大行数和列数不同,2003版最大行数是65536行,最大列数是256列,2007版及以后的版本最大行数是1048576行,最大列数是16384 ...
phpmyadmin导入导出大数据文件的办法
在phpmyadmin的使用中,经常需要进行导入导出数据库的操作. 但是在导入导出大型数据库文件的时候经常会只是部分导出或者部分导入. 或者是导入导出不成功. 原因就是服务器和php.mysql限制了 ...
使用distcp并行拷贝大数据文件
以前我们介绍的访问HDFS的方法都是单线程的,Hadoop中有一个工具可以让我们并行的拷贝大量数据文件,这个工具就是distcp. distcp的典型应用就是在两个HDFS集群中拷贝文件,如果两个集群 ...
阿里云Mysql导入大数据文件
1.查询数据保存为CSV文件 select * from account into outfile '/root/account.csv' fields terminated by ',' enclo ...
orcle导入大数据文件
0,创建ctl文件内容为 OPTIONS (skip=0) LOAD DATA CHARACTERSET 'UTF8' INFILE 'F:\anhui_data\20180814\shangh ...
Day1 - 认识大数据& 企业需求分析 & 北风网简介
上午: 介绍: 海量的乱七八糟的数据中快速的计算出某些有用的信息刑侦视频追踪云栖大会大数据分析/挖掘 ==> python <== 重点关注大数据运维 ==> 运服务 ...

随机推荐

Ubuntu下载报错“文件尺寸不符”
最近学习openfoam,安装双系统后,根据官网进行安装openfoam,在文件的下载中会出现: “文件尺寸不符” 这个错误是因为网络不好造成的,或是请求的网站无回应. 解决的办法手机打开4G,打开热 ...
Advertising.csv
TV,radio,newspaper,sales1,230.1,37.8,69.2,22.12,44.5,39.3,45.1,10.43,17.2,45.9,69.3,9.34,151.5,41.3, ...
mysql性能分析工具
一.EXPALIN 在SQL语句之前加上EXPLAIN关键字就可以获取这条SQL语句执行的计划那么返回的这些字段是什么呢? 我们先关心一下比较重要的几个字段: 1. select_type 查询类型 ...
PubMed数据下载
目标站点分析目标:抓取页面中的机构名称,日期,标题,作者, 作者信息, 摘要程序实现 # -*- coding: utf-8 -*- """ @Datetime: 2 ...
css3 rotate(1turn)的用法
1turn:一圈,一个圆共一圈. 90deg = 0.25turn.
腾讯云部署javaWeb项目之一应用服务器
1.登录腾讯云,点击登录选择浏览器登录.输入用户名按回车键然后输入密码. 2.安装java环境,直接命令:yum -y install java-1.8.0-openjdk java-1.8.0 ...
【leetcode-84】柱状图中最大的矩形
(1pass,比较简单的hard) 给定 n 个非负整数,用来表示柱状图中各个柱子的高度.每个柱子彼此相邻,且宽度为 1 . 求在该柱状图中,能够勾勒出来的矩形的最大面积. 以上是柱状图的示例,其中每 ...
HDU 6374(拼三角形 **)
题意是在给定的线段长中挑选出能拼成三角形的最长的三条边,输出三角形的周长.先对所有边排序,从大到小,满足两较短边之和大于第三边就输出,若从未输出过就输出 -1 #include <iostrea ...
JS获得元素相对位置坐标getBoundingClientRect()
getBoundingClientRect用于获取某个元素相对于视窗的位置集合.集合中有top, right, bottom, left等属性. 1.语法:这个方法没有参数. rectObject = ...
Retrofit的通讯方式示例
Retrofit有两种通讯方式,同步和异步异步方式: APIService req; req = RetrofitManager.getInstance().createReq(APIService ...

POI 海量数据/大数据文件生成SXSSFWorkbook使用简介

POI 海量数据/大数据文件生成SXSSFWorkbook使用简介的更多相关文章

随机推荐

热门专题