在工作中需要将mongo中的数据导出到excel中,所以根据需要学习了poi。以下为学习内容的总结:

1.POI是什么?

  • poi是Apache团队开发的专门面对用java处理Excel文档的工具。
  • 官网地址:https://poi.apache.org/
  • 在操作exccel有HSSFWorkbook和XSSFWorkbook两种方式。两种方式的区别在于根据excel的版本不同,一个简单的方式就是后缀为.xls为HSSFWorkbook;后缀为.xlsx为XSSFWorkbook

2.输出Excel操作流程

  • 此部分通过代码解释使用POI将集合导出Excel的流程,在下一节中详细解释。
   /**
* 将集合转化为Excel表格
*/
public void getExcel(List<List<String>> list) throws IOException {
//1.标题
String[] title = {"招聘名称", "投递邮箱", "信息来源", "信息城市", "来源网站"};
//2.文件名
String fileName = new String("企业邮箱信息.xls".getBytes(), "utf-8");
//3.sheet名
String sheetName = new String("梧桐果、海投网、我司企业邮箱信息".getBytes(), "utf-8"); // 1.创建一个HSSFWorkbook,对应一个Excel文件
HSSFWorkbook hssfWorkbook = new HSSFWorkbook();
// 2.在workbook中添加一个sheet,对应Excel文件中的sheet
HSSFSheet sheet = hssfWorkbook.createSheet(sheetName);
// 3.在sheet中添加表头第0行,也就是标题行
HSSFRow row = sheet.createRow(0);
// 4.创建单元格,并设置单元格格式
HSSFCellStyle cellStyle = hssfWorkbook.createCellStyle();
cellStyle.setAlignment(HSSFCellStyle.ALIGN_CENTER);//样式为中心水平对齐 //5.创建列单元格
for (int i = 0; i < title.length; i++) {
HSSFCell cell = row.createCell(i);
cell.setCellValue(title[i]);
cell.setCellStyle(cellStyle);
}//表头 for (int y = 0; y < list.size(); y++) {
HSSFRow row1 = sheet.createRow(y + 1);//创建行
List<String> strings = list.get(y);
for (int x = 0; x < title.length; x++) {
HSSFCell cell = row1.createCell(x);
cell.setCellValue(strings.get(x));
cell.setCellStyle(cellStyle);//创建列
}
} File file = new File("C:\\Users\\bxk\\Desktop\\" + fileName);
OutputStream outputStream = new FileOutputStream(file);
hssfWorkbook.write(outputStream);
outputStream.flush();
outputStream.close();
}

3.输出Excel操作步骤详解

3.1创建出所需的文件信息

        //1.标题
String[] title = {"招聘名称", "投递邮箱", "信息来源", "信息城市", "来源网站"};
//2.文件名
String fileName = new String("企业邮箱信息.xls".getBytes(), "utf-8");
//3.sheet名
String sheetName = new String("我是一个sheet名称".getBytes(), "utf-8");

3.2 创建WorkBook

 HSSFWorkbook hssfWorkbook = new HSSFWorkbook(); //对应一个Excel文件

  demo:如下文就可以生成一个空白的、名为workbook的xlsk文档。注意当文件名为中文的时候可能会出现乱码。使用 new String("中文","utf-8") ,将解决乱码问题。

HSSFWorkbook wb = new XSSFWorkbook(); try (OutputStream fileOut = new FileOutputStream("workbook.xlsx")) { wb.write(fileOut); }

3.3创建Sheet

HSSFSheet sheet = hssfWorkbook.createSheet(sheetName);//对应Excel文件中的sheet   其中sheetName不能为 "" ,不能为 Null

值得注意的是,创建的过程中不会覆盖。每一个sheet都是独立的,就算此sheet并没有使用,也不会消失,而是叠加。

String safeName = WorkbookUtil.createSafeSheetName("");//这样创建的sheetName ""会转化为empty,null会转化为“null”

这个sheet我当时也找了好一会,可能是实在是不熟悉Excel。sheet就表示excel中的某一张表,当然既然是表,就会有表名。所以sheetName的作用就是显示表名。上截图解释具体位置。

3.4创建表头

HSSFRow row = sheet.createRow(0);// 在sheet中添加表头第0行,也就是标题行

3.5创建单元格样式

HSSFCellStyle cellStyle = hssfWorkbook.createCellStyle();
cellStyle.setAlignment(HorizontalAlignment.CENTER);//样式为中心水平对齐 还有其他样式都在 HorizontalAlignment 中,可以自行查找。

3.6创建列单元格

for (int i = 0; i < title.length; i++) {
HSSFCell cell = row.createCell(i);
cell.setCellValue(title[i]);
cell.setCellStyle(cellStyle);
}//表头

 在poi中对于excel的操作,只有行操作:定位到某一行,进行具体操作。所以就需要得到行元素HSSFRow ,在根据 HSSFCell  定位到某行的第某个单元格。

3.7创建数据

for (int y = 0; y < list.size(); y++) {
List<String> strings = list.get(y);
if (strings.get(0).toString().indexOf("海投") != -1 || strings.get(0).toString().indexOf("梧桐果") != -1) {
continue;
}
HSSFRow row1 = sheet.createRow(y + 1);//创建行
for (int x = 0; x < title.length; x++) {
HSSFCell cell = row1.createCell(x);
cell.setCellValue(strings.get(x));
cell.setCellStyle(cellStyle);//创建列
}
}

3.8打印输出

  File file = new File("C:\\Users\\bxk\\Desktop\\" + fileName);
OutputStream outputStream = new FileOutputStream(file);
hssfWorkbook.write(outputStream);
outputStream.flush();
outputStream.close();

此处有个小提示,在idea中输出输入流或者HSSFWorkbook 等创建后,没有close的都会标红,看着实在是难受。可以try后在finally中进行close,可以解决标红。

4读取excel文件

为什么又学习了读取excel呢,就是因为我感觉爬虫的数据不够完美,打算重新爬一边,就把数据库删了....。然后那个数据一时半会也爬不下来。

(爬不下来的原因:1.爬的速度太快,ip被封,就算后来设置了得到一个数据暂停一秒也不可以。。。2.在西刺网得到一些服务器的ip和端口号,借助这些服务器去帮我爬取数据。可是这些服务器不稳定 ,有时会出现连接超时等错误,就需要手动重启项目。很麻烦。有一个想法:就是当运行出现超时错误时,重启项目。刚好设计模式中的观察者模式可以解决这个问题)

所以我就换了一个方法。。。重新读取导出的excel数据,将数据重新切割进行保存。

这个事情告诉我,删数据库之前,一定要做好备份。。。

    /**
* 读取我司数据库 中的数据 C:\Users\bxk\Desktop\企业邮箱信息(我司数据里).xls
*/
public List<List<String>> getExcelDateToAddress() {
ArrayList<List<String>> lists = new ArrayList<>();
Workbook wb = null;
InputStream inp = null;
try {
inp = new FileInputStream("C:\\Users\\bxk\\Desktop\\数据.xls");
wb = new HSSFWorkbook(inp);  //读取excel文件
Sheet sheetAt = wb.getSheetAt(0);  //得到第一个sheet文件,
Iterator<Row> rowIterator = sheetAt.rowIterator();  //得到行数的迭代器
while (rowIterator.hasNext()) {
ArrayList<String> strings = new ArrayList<>();
Row next = rowIterator.next();
Iterator<Cell> cellIterator = next.cellIterator();
while (cellIterator.hasNext()) {  //得到单元格的迭代器
Cell next1 = cellIterator.next();
String stringCellValue = next1.getStringCellValue();
strings.add(stringCellValue);
}
strings.set(3, getCity(strings.get(3)));
lists.add(strings);
}
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
} finally {
try {
wb.close();
inp.close();
} catch (IOException e) {
e.printStackTrace();
}
}
return lists;
}

这个很简单,就不详细解释了。当poi读取到文件后,就会分析出sheet、行数等消息。但是我找了好半天也没有得到行数的接口。想要读取每行的信息,只能通过迭代器。

打开官网(上面有链接)——API介绍(Component)——快速指南(Quick Guide) 也能看到详细的例子和解释哦。

【POI】java对excel的读写操作的更多相关文章

  1. 使用JXL.jar实现JAVA对EXCEL的读写操作

    简介: jxl.jar是通过java操作excel表格的工具类库 jxl操作excel包括对象Workbook(工作簿),Sheet(工作表) ,Cell(单元格). 一个excel就对应一个Work ...

  2. JAVA实现Excel的读写--jxl

    前段时间因为开发网站的需要,研究了一下java实现excel的读写,一般当我们做管理软件时,都需要打印报表,报表如何制作呢?相信一定难为过大家,本篇就为大家揭开它的神秘面纱,学习完半篇,你一定会对报表 ...

  3. Java 字节流实现文件读写操作(InputStream-OutputStream)

    Java 字节流实现文件读写操作(InputStream-OutputStream) 备注:字节流比字符流底层,但是效率底下. 字符流地址:http://pengyan5945.iteye.com/b ...

  4. 使用Python对Excel进行读写操作

    学习Python的过程中,我们会遇到Excel的读写问题.这时,我们可以使用xlwt模块将数据写入Excel表格中,使用xlrd模块从Excel中读取数据.下面我们介绍如何实现使用Python对Exc ...

  5. Python—对Excel进行读写操作

    学习Python的过程中,我们会遇到Excel的读写问题.通过搜索得知,我们可以使用xlwt module将数据写入Excel表格,使用xlrd module从Excel读取数据.下面介绍如何实现使用 ...

  6. JAVA实现Excel的读写--poi

    上一篇为大家介绍了通过xls.jar的方式生成Excel的方法,本篇就为大家再介绍一下通过poi方式实现Excel文件的读写操作,内容很简单,代码注释很清晰. 1.生成Excel文件: import ...

  7. Apache POI 实现对 Excel 文件读写

    1. Apache POI 简介 Apache POI是Apache软件基金会的开放源码函式库. 提供API给Java应用程序对Microsoft Office格式档案读和写的功能. 老外起名字总是很 ...

  8. 78、excel的读写操作

    本篇主要是用python来自动生成excel数据文件也就是简单的excel读写操作.python读写excel文件主要是第三方模块库xlrd.xlwt. 本篇导航: 写excel 读excel 一.写 ...

  9. 使用jxl操作之一: 实现对Excel简单读写操作

    项目目录树 对象类UserObject UserObject.java package com.dlab.jxl; public class UserObject { private String u ...

随机推荐

  1. UnicodeEncodeError: 'gbk' codec can't encode character '\xbb' in position 30633: illegal multibyte sequence

    import urllib.request def load_baidu(): url = "https://www.baidu.com/" header = {"Use ...

  2. ArcGIS制作tpk离线压缩包

    ArcGIS制作tpk离线压缩包 tpk是什么的缩写,对应的中文名称是? 什么叫tpk文件? 缓存切片? 切片类型:紧凑型与稀疏型.   一.目前自己使用的在ArcMap中制作tpk压缩包 1.首先打 ...

  3. istio sidecar自动注入过程分析

    目录 istio sidecar自动注入过程分析 sidecar自动注入检查 检查kube-apiserver 检查sidecar-injector的configmap 检查namespace标签 s ...

  4. hbase-0.92.1表备份还原

    原表结构和数据 hbase(main):021:0* describe 'test' DESCRIPTION ENABLED {NAME => ', TTL = true > ', COM ...

  5. [LeetCode] 80. Remove Duplicates from Sorted Array II ☆☆☆(从有序数组中删除重复项之二)

    https://leetcode.com/problems/remove-duplicates-from-sorted-array-ii/discuss/27976/3-6-easy-lines-C% ...

  6. Linux内存管理(一)

    Linux内存管理之一:基本概念篇 物理地址.线性地址(虚拟地址)和逻辑地址:阐述段式管理和页式管理基本概念:Linux操作系统内存管理和虚拟内存概念:为内核开发做一个基础铺垫. 内存是linux内核 ...

  7. python 对象存储OSS 阿里云

    SDK参考 ->python->上传文件->简单上传 #  -*- coding: utf-8 -*- import oss2 auth=oss2.Auth('<yourAcc ...

  8. JS-圣杯模式

    var inherit = (function(){ var F = function(){}; return function(Target,Origin){ F.prototype = Origi ...

  9. EChart.js 简单入门

    EChart.js 简单入门 最近有一个统计的项目要做,在前端的数据需要用图表的形式展示.网上搜索了一下,发现有几种统计图库. MSChart   这个是Visual Studio里的自带控件,使用比 ...

  10. python练习小文章-文本爬虫

    一入“程”门深四海...... 有学习就得有练习,我来练一个文本爬虫,代码直接写到下面,抓取的是网页图片,简单好学,适合新手练习. 话不多说直接上干货! 1. 目标网址:https://www.jik ...