直入正题,需求为页面预览word文档,用的是poi3.8,以下代码支持表格、图片,不支持分页,只支持doc,不支持docx;

  1. /**
  2. *
  3. */
  4. import java.io.BufferedWriter;
  5. import java.io.File;
  6. import java.io.FileInputStream;
  7. import java.io.FileNotFoundException;
  8. import java.io.FileOutputStream;
  9. import java.io.IOException;
  10. import java.io.OutputStream;
  11. import java.io.OutputStreamWriter;
  12. import java.util.List;
  13. import javax.xml.parsers.DocumentBuilderFactory;
  14. import javax.xml.parsers.ParserConfigurationException;
  15. import javax.xml.transform.OutputKeys;
  16. import javax.xml.transform.Transformer;
  17. import javax.xml.transform.TransformerException;
  18. import javax.xml.transform.TransformerFactory;
  19. import javax.xml.transform.dom.DOMSource;
  20. import javax.xml.transform.stream.StreamResult;
  21. import org.apache.commons.io.output.ByteArrayOutputStream;
  22. import org.apache.poi.hwpf.HWPFDocument;
  23. import org.apache.poi.hwpf.converter.PicturesManager;
  24. import org.apache.poi.hwpf.converter.WordToHtmlConverter;
  25. import org.apache.poi.hwpf.model.PicturesTable;
  26. import org.apache.poi.hwpf.usermodel.CharacterRun;
  27. import org.apache.poi.hwpf.usermodel.Paragraph;
  28. import org.apache.poi.hwpf.usermodel.Picture;
  29. import org.apache.poi.hwpf.usermodel.PictureType;
  30. import org.apache.poi.hwpf.usermodel.Range;
  31. import org.apache.poi.hwpf.usermodel.Table;
  32. import org.apache.poi.hwpf.usermodel.TableCell;
  33. import org.apache.poi.hwpf.usermodel.TableIterator;
  34. import org.apache.poi.hwpf.usermodel.TableRow;
  35. import org.w3c.dom.Document;
  36. /**
  37. * @author: Chembo Huang
  38. * @since: May 3, 2012
  39. * @modified: May 3, 2012
  40. * @version:
  41. */
  42. public class Word2Html {
  43. public static void main(String argv[]) {
  44. try {
  45. convert2Html("D://1.doc","D://1.html");
  46. } catch (Exception e) {
  47. e.printStackTrace();
  48. }
  49. }
  50. public static void writeFile(String content, String path) {
  51. FileOutputStream fos = null;
  52. BufferedWriter bw = null;
  53. try {
  54. File file = new File(path);
  55. fos = new FileOutputStream(file);
  56. bw = new BufferedWriter(new OutputStreamWriter(fos,"GB2312"));
  57. bw.write(content);
  58. } catch (FileNotFoundException fnfe) {
  59. fnfe.printStackTrace();
  60. } catch (IOException ioe) {
  61. ioe.printStackTrace();
  62. } finally {
  63. try {
  64. if (bw != null)
  65. bw.close();
  66. if (fos != null)
  67. fos.close();
  68. } catch (IOException ie) {
  69. }
  70. }
  71. }
  72. public static void convert2Html(String fileName, String outPutFile)
  73. throws TransformerException, IOException,
  74. ParserConfigurationException {
  75. HWPFDocument wordDocument = new HWPFDocument(new FileInputStream(fileName));//WordToHtmlUtils.loadDoc(new FileInputStream(inputFile));
  76. WordToHtmlConverter wordToHtmlConverter = new WordToHtmlConverter(
  77. DocumentBuilderFactory.newInstance().newDocumentBuilder()
  78. .newDocument());
  79. wordToHtmlConverter.setPicturesManager( new PicturesManager()
  80. {
  81. public String savePicture( byte[] content,
  82. PictureType pictureType, String suggestedName,
  83. float widthInches, float heightInches )
  84. {
  85. return "test/"+suggestedName;
  86. }
  87. } );
  88. wordToHtmlConverter.processDocument(wordDocument);
  89. //save pictures
  90. List pics=wordDocument.getPicturesTable().getAllPictures();
  91. if(pics!=null){
  92. for(int i=0;i<pics.size();i++){
  93. Picture pic = (Picture)pics.get(i);
  94. System.out.println();
  95. try {
  96. pic.writeImageContent(new FileOutputStream("D:/test/"
  97. + pic.suggestFullFileName()));
  98. } catch (FileNotFoundException e) {
  99. e.printStackTrace();
  100. }
  101. }
  102. }
  103. Document htmlDocument = wordToHtmlConverter.getDocument();
  104. ByteArrayOutputStream out = new ByteArrayOutputStream();
  105. DOMSource domSource = new DOMSource(htmlDocument);
  106. StreamResult streamResult = new StreamResult(out);
  107. TransformerFactory tf = TransformerFactory.newInstance();
  108. Transformer serializer = tf.newTransformer();
  109. serializer.setOutputProperty(OutputKeys.ENCODING, "GB2312");
  110. serializer.setOutputProperty(OutputKeys.INDENT, "yes");
  111. serializer.setOutputProperty(OutputKeys.METHOD, "html");
  112. serializer.transform(domSource, streamResult);
  113. out.close();
  114. writeFile(new String(out.toByteArray()), outPutFile);
  115. }
  116. }

下载poi-bin-3.9-20121203.tar.gz并解压,提取查看Office文档所依赖的包。

poi完美word转html(表格、图片、样式)的更多相关文章

  1. 使用POI导出Word(含表格)的实现方式及操作Word的工具类

    .personSunflowerP { background: rgba(51, 153, 0, 0.66); border-bottom: 1px solid rgba(0, 102, 0, 1); ...

  2. Java使用POI读取Word中的表格

    个人博客 地址:https://www.wenhaofan.com/a/20190627135921 代码 package live.autu.word; import java.io.FileInp ...

  3. Apache Poi 操作word,替换字符保留样式问题,runs段落混乱问题。

    关于这个问题也是刚好遇到,一通搜索也没有找到类似的或者是有效的方法.下面介绍一下. 首先apache poi的引入 <dependency> <groupId>org.apac ...

  4. [转]CSS如何设置html table表格边框样式

    原文地址:http://www.divcss5.com/wenji/w503.shtml 对table设置css样式边框,分为几种情况: 1.只对table设置边框 2.对td设置边框 3.对tabl ...

  5. POI 生成 word 文档 简单版(包括文字、表格、图片、字体样式设置等)

      POI 生成word 文档 一般有两种方法: ① word模板 生成word 文档 : ② 写代码直接生成 word 文档: 我这里演示的是第二种方法,即写代码生成 word文档,不多说废话,直接 ...

  6. Java利用poi生成word(包含插入图片,动态表格,行合并)

    转(小改): Java利用poi生成word(包含插入图片,动态表格,行合并) 2018年12月20日 09:06:51 wjw_11093010 阅读数:70 Java利用poi生成word(包含插 ...

  7. poi导出word表格详解 超详细了

    转:非常感谢原作者 poi导出word表格详解 2018年07月20日 10:41:33 Z丶royAl 阅读数:36138   一.效果如下 二.js代码 function export_word( ...

  8. C#通过模板导出Word(文字,表格,图片)

    C#通过模板导出Word(文字,表格,图片)   C#导出Word,Excel的方法有很多,这次因为公司的业务需求,需要导出内容丰富(文字,表格,图片)的报告,以前的方法不好使,所以寻找新的导出方法, ...

  9. word模板导出的几种方式:第二种:C#通过模板导出Word(文字,表格,图片) 占位符替换

    原文出处:https://www.cnblogs.com/ilefei/p/3508463.html 一:模板的创建   (注意文件后缀只能是.docx或.doct) 在需要位置 插入-文档部件-域, ...

随机推荐

  1. Github-flavored Markdown 导出为 PDF

    前提条件: 你可以访问Google和它相关的服务 第一步 到Chrome Store安装插件 Markdown Preview Plus 安装以后记得勾选 "允许访问文件网址" 设 ...

  2. HDU 4359 Easy Tree DP? 组合数学+动归

    题意:定义一种树,每个节点的权值都是20到2n-1,每个权值出现一次,每个节点的左子树的权值和小于右子树,除非只有一个子树.给你n和d,问有n个节点且恰好深度是d的这种树有多少种. 比赛的时候我没有做 ...

  3. SQL Server 2008 R2 超详细安装图文教程及问题解决(锐姿公司安装)

    问题点: 1.为了sqlserver与mysql 的安全,建议数据库低权限运行.禁止远程访问 1433与 3306端口等. 2.安装提示.net 3.5没有安装 ,在server2012的添加 3. ...

  4. 大吉大利,晚饭吃鸡!——accept关闭问题

    假期收尾了,学芽子们都军训了.一群张一山和周冬雨在校内晃晃悠悠,说起来春风十里也就军训比较有意思.对于我这种一年追一部剧的人,显然是有点对不住.在我假期任务即将圆满之际,我开始放慢脚步寻找生活的美妙时 ...

  5. 紫书 习题 10-44 UVa 11246 ( 容斥原理)

    把k的倍数的删去(k, 2k, 3k--),但是k^2不应该删去,因为k已经删去,所以不存在某个数乘上k之后为k^2 所以k^2可以留下,然后因为有k^2,所以k^3就是k^2的k倍,所以k^3要删去 ...

  6. SpringBoot结合Mybatis 使用 mapper*.xml 进行数据库增删改查操作

    什么是 MyBatis? MyBatis 是支持普通 SQL 查询,存储过程和高级映射的优秀持久层框架. MyBatis 消除了几乎所有的 JDBC 代码和参数的手工设置以及对结果集的检索. MyBa ...

  7. 【hiho39】二分·归并排序之逆序对

    近期申请了微软的暑假实习,4号就要在线笔试了,在线測试系统用的是http://hihocoder.com/,今天试手做了一道题. [题目] 原题链接:http://hihocoder.com/cont ...

  8. 游戏server之server优化思路

    本文仅仅是提供一些游戏server优化思路,当中一些思路是用在不同场合的,不是同个架构的.须要依据应用场景选用合适方式. 本文的引用的文章都是在自己写的在本博客内的.也都是上线开几百个服的成熟项目的. ...

  9. OpenCASCADE 参数曲面面积

    OpenCASCADE 参数曲面面积 eryar@163.com Abstract. 本文介绍了参数曲面的第一基本公式,并应用曲面的第一基本公式,结合OpenCASCADE中计算多重积分的类,对任意参 ...

  10. 43.安装npm及cnpm(Windows)

    转自:https://www.cnblogs.com/yominhi/p/7039795.html [工具官网] Node.js : http://nodejs.cn/ 淘宝NPM: https:// ...