POI实现大数据EXCLE导入导出，解决内存溢出问题

　　使用POI能够导出大数据保证内存不溢出的一个重要原因是SXSSFWorkbook生成的EXCEL为2007版本，修改EXCEL2007文件后缀为ZIP打开可以看到，每一个Sheet都是一个xml文件，单元格格式和单元格坐标均用标签表示。直接使用SXSSFWorkbook来到导出EXCEL本身就是POI为了大数据量导出而量身定制的，所以导出可以直接使用SXSSFWorkbook方式。

　　为了保险起见可以采用多Sheet的方式保证内存不溢出。需要注意的是Sheet名称不能重复；下载的时候需要定义好返回头。

response.setContentType("application/vnd.openxmlformats-officedocument.spreadsheetml.sheet");

　　导出EXCEL较为简单，创建Workbook对象和Sheet对象往里塞值就行了。但是导入读取EXCEL的时候SXSSFWorkbook没有读取文件流的方法，只能使用XSSFWorkbook来读取，几千条数据可能就内存溢出了。

　　这时候就要使用OPCPackage

public static OPCPackage open(java.io.InputStream in)

                       throws InvalidFormatException,

                              java.io.IOException

Open a package. Note - uses quite a bit more memory than open(String), which doesn't need to hold the whole zip file in memory, and can take advantage of native methods

Parameters:

    in - The InputStream to read the package from

Returns:

    A PackageBase object

Throws:

    InvalidFormatException

    java.io.IOException

　　POI给出的API表示使用OPCPackage不需要将文件完全读取到内存中。

　　调用方法

File file = uploadFile.getFile();

InputStream is = new FileInputStream(file);

excelReader.readInputStream(is);

excelReader.process();

　　ExcelReader.java

/**

 * 抽象Excel2007读取器，excel2007的底层数据结构是xml文件，采用SAX的事件驱动的方法解析

 * xml，需要继承DefaultHandler，在遇到文件内容时，事件会触发，这种做法可以大大降低

 * 内存的耗费，特别使用于大数据量的文件。

 *

 */

public class Excel2007Reader extends DefaultHandler {

    //共享字符串表

    private SharedStringsTable sst;

    //上一次的内容

    private String lastContents;

    private boolean nextIsString;

    private int sheetIndex = -1;

    private List<String> rowlist = new ArrayList<String>();

    //当前行

    private int curRow = 0;

    //当前列

    private int curCol = 0;

    //日期标志

    private boolean dateFlag;

    //数字标志

    private boolean numberFlag;

    private boolean isTElement;

    private IRowReader rowReader;

    public void setRowReader(IRowReader rowReader){

        this.rowReader = rowReader;

    }

    /**只遍历一个电子表格，其中sheetId为要遍历的sheet索引，从1开始，1-3

     * @param filename

     * @param sheetId

     * @throws Exception

     */

    public void processOneSheet(String filename,int sheetId) throws Exception {

        OPCPackage pkg = OPCPackage.open(filename);

        XSSFReader r = new XSSFReader(pkg);

        SharedStringsTable sst = r.getSharedStringsTable();

        XMLReader parser = fetchSheetParser(sst);

        // 根据 rId# 或 rSheet# 查找sheet

        InputStream sheet2 = r.getSheet("rId"+sheetId);

        sheetIndex++;

        InputSource sheetSource = new InputSource(sheet2);

        parser.parse(sheetSource);

        sheet2.close();

    }

    /**

     * 遍历工作簿中所有的电子表格

     * @param filename

     * @throws Exception

     */

    public void process(String filename) throws Exception {

        OPCPackage pkg = OPCPackage.open(filename);

        XSSFReader r = new XSSFReader(pkg);

        SharedStringsTable sst = r.getSharedStringsTable();

        XMLReader parser = fetchSheetParser(sst);

        Iterator<InputStream> sheets = r.getSheetsData();

        while (sheets.hasNext()) {

            curRow = 0;

            sheetIndex++;

            InputStream sheet = sheets.next();

            InputSource sheetSource = new InputSource(sheet);

            parser.parse(sheetSource);

            sheet.close();

        }

    }

    public XMLReader fetchSheetParser(SharedStringsTable sst)

            throws SAXException {

        XMLReader parser = XMLReaderFactory

                .createXMLReader("org.apache.xerces.parsers.SAXParser");

        this.sst = sst;

        parser.setContentHandler(this);

        return parser;

    }

    public void startElement(String uri, String localName, String name,

            Attributes attributes) throws SAXException {

        // c => 单元格

        if ("c".equals(name)) {

            // 如果下一个元素是 SST 的索引，则将nextIsString标记为true

            String cellType = attributes.getValue("t");

            if ("s".equals(cellType)) {

                nextIsString = true;

            } else {

                nextIsString = false;

            }

            //日期格式

            String cellDateType = attributes.getValue("s");

            if ("1".equals(cellDateType)){

                dateFlag = true;

            } else {

                dateFlag = false;

            }

            String cellNumberType = attributes.getValue("s");

            if("2".equals(cellNumberType)){

                numberFlag = true;

            } else {

                numberFlag = false;

            }

        }

        //当元素为t时

        if("t".equals(name)){

            isTElement = true;

        } else {

            isTElement = false;

        }

        // 置空

        lastContents = "";

    }

    public void endElement(String uri, String localName, String name)

            throws SAXException {

        // 根据SST的索引值的到单元格的真正要存储的字符串

        // 这时characters()方法可能会被调用多次

        if (nextIsString) {

            try {

                int idx = Integer.parseInt(lastContents);

                lastContents = new XSSFRichTextString(sst.getEntryAt(idx))

                        .toString();

            } catch (Exception e) {

            }

        }

        //t元素也包含字符串

        if(isTElement){

            String value = lastContents.trim();

            rowlist.add(curCol, value);

            curCol++;

            isTElement = false;

            // v => 单元格的值，如果单元格是字符串则v标签的值为该字符串在SST中的索引

            // 将单元格内容加入rowlist中，在这之前先去掉字符串前后的空白符

        } else if ("v".equals(name)) {

            String value = lastContents.trim();

            value = value.equals("")?" ":value;

            //日期格式处理

            if(dateFlag){

                 Date date = HSSFDateUtil.getJavaDate(Double.valueOf(value));

                 SimpleDateFormat dateFormat = new SimpleDateFormat(

                 "dd/MM/yyyy");

                 value = dateFormat.format(date);

            }

            //数字类型处理

            if(numberFlag){

                BigDecimal bd = new BigDecimal(value);

                value = bd.setScale(3,BigDecimal.ROUND_UP).toString();

            }

            rowlist.add(curCol, value);

            curCol++;

        }else {

            //如果标签名称为 row ，这说明已到行尾，调用 optRows() 方法

            if (name.equals("row")) {

                rowReader.getRows(sheetIndex,curRow,rowlist);

                rowlist.clear();

                curRow++;

                curCol = 0;

            }

        }

    }

    public void characters(char[] ch, int start, int length)

            throws SAXException {

        //得到单元格内容的值

        lastContents += new String(ch, start, length);

    }

}

POI实现大数据EXCLE导入导出，解决内存溢出问题的更多相关文章

POI读写大数据量excel，解决超过几万行而导致内存溢出的问题
1. Excel2003与Excel2007 两个版本的最大行数和列数不同,2003版最大行数是65536行,最大列数是256列,2007版及以后的版本最大行数是1048576行,最大列数是16384 ...
java excel大数据量导入导出与优化
package com.hundsun.ta.utils; import java.io.File; import java.io.FileOutputStream; import java.io.I ...
POI3.8解决导出大数据量excel文件时内存溢出的问题
POI3.8的SXSSF包是XSSF的一个扩展版本,支持流处理,在生成大数据量的电子表格且堆空间有限时使用.SXSSF通过限制内存中可访问的记录行数来实现其低内存利用,当达到限定值时,新一行数据的加入 ...
大数据批量导入，解决办法，实践从定时从 sqlserver 批量同步数据到 mySql
c#代码,批量导入数据代码 public class MySql_Target : ZFCommon.DataAccesser.Base.DABase { public MySql_Target() ...
使用phpExcel实现Excel数据的导入导出(完全步骤)
使用phpExcel实现Excel数据的导入导出(完全步骤) 很多文章都有提到关于使用phpExcel实现Excel数据的导入导出,大部分文章都差不多,或者就是转载的,都会出现一些问题,下面是本人 ...
Mysql 大数据量导入程序
Mysql 大数据量导入程序<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" ...
Springboot Excle导入导出
Springboot Excle导入导出导入操作:Excle批量导入导出操作:下载模版开发笔记 pom.xml  <dependency& ...
SQL Server中bcp命令的用法以及数据批量导入导出
原文:SQL Server中bcp命令的用法以及数据批量导入导出 1.bcp命令参数解析 bcp命令有许多参数,下面给出bcp命令参数的简要解析用法: bcp {dbtable | query} { ...
【EXPDP/IMPDP】ORACLE数据泵导入导出案例(expdp & impdp)
概要: 因项目需要,通常需要将生产库下的部分数据抽取并恢复到测试库上本文主要介绍数据泵导入导出的几种情况以及错误处理案例环境: rhel-server-6.5-x86_64 oracle 11.2 ...

随机推荐

调用CMD命令的一个.NET工具类（MyWindowsCmd）
功能大概描述一下如果直接StandardOutput.ReadToEnd()这种方法,有很多限制这类方式必须把命令全部执行一次写入并标记为exit,而且返回内容的获取会一直等待,如果在主线程里使用会 ...
nova创建虚拟机源码分析系列之一 restful api
开始学习openstack源码,源码文件多,分支不少.按照学习的方法走通一条线是最好的,而网上推荐的最多的就是nova创建虚机的过程.从这一条线入手,能够贯穿openstack核心服务.写博文仅做学习 ...
关于html，css，js三者的加载顺序问题
<head lang="en"> <meta charset="utf-8"> <title></title> ...
ES6 Proxy和Reflect (上)
Proxy概述 Proxy用于修改某些操作的默认行为,等同于在语言层面做出修改,所以属于一种"元编程"(meta programming),即对编程语言进行编程. Proxy可以理 ...
初识QT
前言:这是写给纯小白看的文章,大神可以自行绕道. QT的优势(摘自360百科): Qt支持下列操作系统: Microsoft Windows 95/98, Microsoft Windows NT, ...
mac安全权限解决
如果有以下提示的,并不是文件损坏了,而是macOS Sierra新系统取消了安装本地程序的功能. 解决办法如下: 1.首先打开终端(找不到哪里打开终端 command+空格搜索 "终端 ...
JS对时间的操作
JS时间操作大全 1.获取每个月的开始和结束. 2.获取每个季度的开始和结束. 3.获取当前季度. 4.把日期转换为字符串(支持各种格式) ... 5.未完待续,不断添加 String.prototy ...
<转>LOG日志级别
Level Description Example emerg Emergencies - system is unusable 紧急 - 系统无法使用 Child cannot open lock ...
How It Works: CMemThread and Debugging Them
The wait type of CMemThread shows up in outputs such as sys.dm_exec_requests. This post is intended ...
java内存溢出问题
相信有一定java开发经验的人或多或少都会遇到OutOfMemoryError的问题,这个问题曾困扰了我很长时间,随着解决各类问题经验的积累以及对问题根源的探索,终于有了一个比较深入的认识. 在解决j ...

POI实现大数据EXCLE导入导出，解决内存溢出问题

POI实现大数据EXCLE导入导出，解决内存溢出问题的更多相关文章

随机推荐

热门专题