POI实现大数据EXCLE导入导出，解决内存溢出问题

　　使用POI能够导出大数据保证内存不溢出的一个重要原因是SXSSFWorkbook生成的EXCEL为2007版本，修改EXCEL2007文件后缀为ZIP打开可以看到，每一个Sheet都是一个xml文件，单元格格式和单元格坐标均用标签表示。直接使用SXSSFWorkbook来到导出EXCEL本身就是POI为了大数据量导出而量身定制的，所以导出可以直接使用SXSSFWorkbook方式。

　　为了保险起见可以采用多Sheet的方式保证内存不溢出。需要注意的是Sheet名称不能重复；下载的时候需要定义好返回头。

response.setContentType("application/vnd.openxmlformats-officedocument.spreadsheetml.sheet");

　　导出EXCEL较为简单，创建Workbook对象和Sheet对象往里塞值就行了。但是导入读取EXCEL的时候SXSSFWorkbook没有读取文件流的方法，只能使用XSSFWorkbook来读取，几千条数据可能就内存溢出了。

　　这时候就要使用OPCPackage

public static OPCPackage open(java.io.InputStream in)

                       throws InvalidFormatException,

                              java.io.IOException

Open a package. Note - uses quite a bit more memory than open(String), which doesn't need to hold the whole zip file in memory, and can take advantage of native methods

Parameters:

    in - The InputStream to read the package from

Returns:

    A PackageBase object

Throws:

    InvalidFormatException

    java.io.IOException

　　POI给出的API表示使用OPCPackage不需要将文件完全读取到内存中。

　　调用方法

File file = uploadFile.getFile();

InputStream is = new FileInputStream(file);

excelReader.readInputStream(is);

excelReader.process();

　　ExcelReader.java

/**

 * 抽象Excel2007读取器，excel2007的底层数据结构是xml文件，采用SAX的事件驱动的方法解析

 * xml，需要继承DefaultHandler，在遇到文件内容时，事件会触发，这种做法可以大大降低

 * 内存的耗费，特别使用于大数据量的文件。

 *

 */

public class Excel2007Reader extends DefaultHandler {

    //共享字符串表

    private SharedStringsTable sst;

    //上一次的内容

    private String lastContents;

    private boolean nextIsString;

    private int sheetIndex = -1;

    private List<String> rowlist = new ArrayList<String>();

    //当前行

    private int curRow = 0;

    //当前列

    private int curCol = 0;

    //日期标志

    private boolean dateFlag;

    //数字标志

    private boolean numberFlag;

    private boolean isTElement;

    private IRowReader rowReader;

    public void setRowReader(IRowReader rowReader){

        this.rowReader = rowReader;

    }

    /**只遍历一个电子表格，其中sheetId为要遍历的sheet索引，从1开始，1-3

     * @param filename

     * @param sheetId

     * @throws Exception

     */

    public void processOneSheet(String filename,int sheetId) throws Exception {

        OPCPackage pkg = OPCPackage.open(filename);

        XSSFReader r = new XSSFReader(pkg);

        SharedStringsTable sst = r.getSharedStringsTable();

        XMLReader parser = fetchSheetParser(sst);

        // 根据 rId# 或 rSheet# 查找sheet

        InputStream sheet2 = r.getSheet("rId"+sheetId);

        sheetIndex++;

        InputSource sheetSource = new InputSource(sheet2);

        parser.parse(sheetSource);

        sheet2.close();

    }

    /**

     * 遍历工作簿中所有的电子表格

     * @param filename

     * @throws Exception

     */

    public void process(String filename) throws Exception {

        OPCPackage pkg = OPCPackage.open(filename);

        XSSFReader r = new XSSFReader(pkg);

        SharedStringsTable sst = r.getSharedStringsTable();

        XMLReader parser = fetchSheetParser(sst);

        Iterator<InputStream> sheets = r.getSheetsData();

        while (sheets.hasNext()) {

            curRow = 0;

            sheetIndex++;

            InputStream sheet = sheets.next();

            InputSource sheetSource = new InputSource(sheet);

            parser.parse(sheetSource);

            sheet.close();

        }

    }

    public XMLReader fetchSheetParser(SharedStringsTable sst)

            throws SAXException {

        XMLReader parser = XMLReaderFactory

                .createXMLReader("org.apache.xerces.parsers.SAXParser");

        this.sst = sst;

        parser.setContentHandler(this);

        return parser;

    }

    public void startElement(String uri, String localName, String name,

            Attributes attributes) throws SAXException {

        // c => 单元格

        if ("c".equals(name)) {

            // 如果下一个元素是 SST 的索引，则将nextIsString标记为true

            String cellType = attributes.getValue("t");

            if ("s".equals(cellType)) {

                nextIsString = true;

            } else {

                nextIsString = false;

            }

            //日期格式

            String cellDateType = attributes.getValue("s");

            if ("1".equals(cellDateType)){

                dateFlag = true;

            } else {

                dateFlag = false;

            }

            String cellNumberType = attributes.getValue("s");

            if("2".equals(cellNumberType)){

                numberFlag = true;

            } else {

                numberFlag = false;

            }

        }

        //当元素为t时

        if("t".equals(name)){

            isTElement = true;

        } else {

            isTElement = false;

        }

        // 置空

        lastContents = "";

    }

    public void endElement(String uri, String localName, String name)

            throws SAXException {

        // 根据SST的索引值的到单元格的真正要存储的字符串

        // 这时characters()方法可能会被调用多次

        if (nextIsString) {

            try {

                int idx = Integer.parseInt(lastContents);

                lastContents = new XSSFRichTextString(sst.getEntryAt(idx))

                        .toString();

            } catch (Exception e) {

            }

        }

        //t元素也包含字符串

        if(isTElement){

            String value = lastContents.trim();

            rowlist.add(curCol, value);

            curCol++;

            isTElement = false;

            // v => 单元格的值，如果单元格是字符串则v标签的值为该字符串在SST中的索引

            // 将单元格内容加入rowlist中，在这之前先去掉字符串前后的空白符

        } else if ("v".equals(name)) {

            String value = lastContents.trim();

            value = value.equals("")?" ":value;

            //日期格式处理

            if(dateFlag){

                 Date date = HSSFDateUtil.getJavaDate(Double.valueOf(value));

                 SimpleDateFormat dateFormat = new SimpleDateFormat(

                 "dd/MM/yyyy");

                 value = dateFormat.format(date);

            }

            //数字类型处理

            if(numberFlag){

                BigDecimal bd = new BigDecimal(value);

                value = bd.setScale(3,BigDecimal.ROUND_UP).toString();

            }

            rowlist.add(curCol, value);

            curCol++;

        }else {

            //如果标签名称为 row ，这说明已到行尾，调用 optRows() 方法

            if (name.equals("row")) {

                rowReader.getRows(sheetIndex,curRow,rowlist);

                rowlist.clear();

                curRow++;

                curCol = 0;

            }

        }

    }

    public void characters(char[] ch, int start, int length)

            throws SAXException {

        //得到单元格内容的值

        lastContents += new String(ch, start, length);

    }

}

POI实现大数据EXCLE导入导出，解决内存溢出问题的更多相关文章

POI读写大数据量excel，解决超过几万行而导致内存溢出的问题
1. Excel2003与Excel2007 两个版本的最大行数和列数不同,2003版最大行数是65536行,最大列数是256列,2007版及以后的版本最大行数是1048576行,最大列数是16384 ...
java excel大数据量导入导出与优化
package com.hundsun.ta.utils; import java.io.File; import java.io.FileOutputStream; import java.io.I ...
POI3.8解决导出大数据量excel文件时内存溢出的问题
POI3.8的SXSSF包是XSSF的一个扩展版本,支持流处理,在生成大数据量的电子表格且堆空间有限时使用.SXSSF通过限制内存中可访问的记录行数来实现其低内存利用,当达到限定值时,新一行数据的加入 ...
大数据批量导入，解决办法，实践从定时从 sqlserver 批量同步数据到 mySql
c#代码,批量导入数据代码 public class MySql_Target : ZFCommon.DataAccesser.Base.DABase { public MySql_Target() ...
使用phpExcel实现Excel数据的导入导出(完全步骤)
使用phpExcel实现Excel数据的导入导出(完全步骤) 很多文章都有提到关于使用phpExcel实现Excel数据的导入导出,大部分文章都差不多,或者就是转载的,都会出现一些问题,下面是本人 ...
Mysql 大数据量导入程序
Mysql 大数据量导入程序<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" ...
Springboot Excle导入导出
Springboot Excle导入导出导入操作:Excle批量导入导出操作:下载模版开发笔记 pom.xml  <dependency& ...
SQL Server中bcp命令的用法以及数据批量导入导出
原文:SQL Server中bcp命令的用法以及数据批量导入导出 1.bcp命令参数解析 bcp命令有许多参数,下面给出bcp命令参数的简要解析用法: bcp {dbtable | query} { ...
【EXPDP/IMPDP】ORACLE数据泵导入导出案例(expdp & impdp)
概要: 因项目需要,通常需要将生产库下的部分数据抽取并恢复到测试库上本文主要介绍数据泵导入导出的几种情况以及错误处理案例环境: rhel-server-6.5-x86_64 oracle 11.2 ...

随机推荐

解题思路：best time to buy and sell stock i && ii && iii
这三道题都是同一个背景下的变形:给定一个数组,数组里的值表示当日的股票价格,问你如何通过爱情买卖来发家致富? best time to buy and sell stock i: 最多允许买卖一次 b ...
P、NP、NP完全问题
如果一个算法的最差时间效率属于O(p(n)),则该算法可以在多项式的时间内对问题进行求解,其中p(n)是输入规模n的一个多项式函数. 可以在多项式时间内求解的问题是易解的.不能在多项式时间内求解的问题 ...
jmeter通过org.sqlite.JDBC驱动连接db数据库
最近遇到个项目,默认业务库为内置db数据库,在性能脚本编辑过程中要通过正则表达式提取器(关联)获取对应的id号,通过该id号到db数据库中查找对应的数据源name字段内容,为下一个post请求做par ...
CentOS 7.x上gitlab搭建教程(https可用，邮件可用)
目录知识要求搭建感想搭建过程参考知识要求: nginx基础知识搭建感想注:以下是我搭建gitlab时的思考,需要nginx的基础知识,Docker的基础知识才容易理解,与下面的搭建过程是 ...
C语言学生管理系统（增进版）
在原版上进行改进,主要改进的功能有. 1.利用atof:将字符串转换为浮点型: 利用atoi:将字符串转换为整型: 原文地址:http://www.cnblogs.com/sddai/p/577412 ...
C#用DataTable实现Group by数据统计
http://www.cnblogs.com/sydeveloper/archive/2013/03/29/2988669.html 1.用两层循环计算,前提条件是数据已经按分组的列排好序的. Dat ...
C#语言和SQL Server第十章笔记
第十章 :使用关键字模糊查询笔记一:使用关键字 :LIKE BETWEEN IN进行模糊查询通配符: 一类字符,代替一个或多个真正的字符与LIKE关键字一起使用通配符: 解释实例符 ...
css实现椭圆、半椭圆
一.自适应的椭圆 1. 椭圆 css .ellipse{ width: 250px; height: 150px; margin: 50px; background: #FFD900; border- ...
shell中的循环语句while
循环语句的结构: ------------| while 条件 | do | 需要执行的命令 | done | -----------| 例如: 1.while一直循环 2.whi ...
扩充表字段长度，引发的意外KILLED/ROLLBACK
这一段时间,因为系统升级,新系统产生的数据长度,比原来的数据长度要长,所以说要扩充一下字段长度. ) --修改字段长度sql 在执行的时候,有这样一个情况. 例如Student表的Name字段长度是n ...

POI实现大数据EXCLE导入导出，解决内存溢出问题

POI实现大数据EXCLE导入导出，解决内存溢出问题的更多相关文章

随机推荐

热门专题