springboot jodconverter openoffice 实现 office 文件 在线预览
这个已是好几个月前做的,好多细节已记得不那边清楚了。今天部署到环境还遇到不少问题。总结下。
1、office 文件实现在线预览的一般思路就是,将文件转pdf,在通过pdf.js 实现在线浏览。这其中转pdf 各个工具转换的效果有些差异,存在走样问题。
2、另一种思路是通过脚本调用office 的转换pdf功能,这种效果最好,高保真。但就是会麻烦些,依赖office 工具。
3、如果还要部署到Linux上使用哪就只能用开源的办公软件 openoffice 了。
4、jodconverter 能很好的调用openoffice 工具转换 配置也相对比较简单。
效果图:



springboot 默认集成了jodconverter 所有应用起来很方便
yml 中加入如下配置就可以了
jodconverter:
enabled: true #注意这个开关,今天部署时就遇到这个问题,排查好久才发现。
officeHome: C:\Program Files (x86)\OpenOffice 4
portNumbers: 8101,8102,8103,8104,8105
maxTasksPerProcess: 5
核心代码:
public boolean office2pdf(FileEntity fileEntity, String suffix) {
LOG.info("call office to pdf ,file info:" + fileEntity.toString());
File file = new File(fileEntity.getAbsolute_path());
if (file.exists() && file.isFile()) {
LOG.info("call office to pdf ,find file info:" + fileEntity.toString());
try {
File pdfFile = new File(file.getParentFile(), fileEntity.getPrn() + suffix);
if (!pdfFile.exists()) {
DocumentConverter documentConverter = szAppConfig.getBeanByClass(DocumentConverter.class);
documentConverter.convert(file).to(pdfFile).execute();
if (".html".equalsIgnoreCase(suffix)) {
try {
String htmlFormant =
"<script src=\"" + sz_ng_root_path + "/commons/js/333614537928.js\"></script>\n" +
" <STYLE>\n" +
" \n" +
" BODY, DIV, TABLE, THEAD, TBODY, TFOOT, TR, TH, TD, P {\n" +
" font-family: \"微软雅黑\";\n" +
" font-size: x-small\n" +
" }\n" +
"\n" +
" TABLE {\n" +
" margin: 0 auto;\n" +
" border-collapse: inherit;\n" +
" }\n" +
"\n" +
" .tabBox {\n" +
" border-bottom: 1px solid #ccc;\n" +
" padding-bottom: 1px;\n" +
" height: 30px;\n" +
" line-height: 30px;\n" +
" color: #696969;\n" +
" }\n" +
"\n" +
" .tabBox a {\n" +
" float: left;\n" +
" font-family: \"微软雅黑\";\n" +
" cursor: pointer;\n" +
" padding: 0px 25px 0px;\n" +
" font-size: 13px;\n" +
" height: 30px;\n" +
" line-height: 30px;\n" +
" background: #F4F5F9;\n" +
" border-top: 1px solid #C5D0DC;\n" +
" border-left: 1px solid #C5D0DC;\n" +
" border-bottom: 1px solid #C5D0DC;\n" +
" }\n" +
"\n" +
" .tabBox a.current {\n" +
" border-bottom: 0px;\n" +
" border-top: 2px solid #7599DE;\n" +
" font-size: 13px;\n" +
" color: #343434;\n" +
" background: #FFFFFF;\n" +
"\n" +
" }\n" +
"\n" +
" .tabBox a:last-child {\n" +
" border-right: 1px solid #C5D0DC;\n" +
" }\n" +
"\n" +
" .tabDetail {\n" +
" display: none;\n" +
" }\n" +
" </STYLE>\n" +
"\n" +
"\n" +
"<script type=\"text/javascript\">\n" +
" $(function () {\n" +
" var tabs = $(\"[href^='#table']\");\n" +
" $(\"H1:contains('摘要')\").remove();\n" +
" tabs.wrapAll(\"<p class=\\\"tabBox\\\"></p>\");\n" +
" tabs.removeAttr(\"href\");\n" +
" var tabContents = $(\"a[NAME]\");\n" +
" tabContents.each(function () {\n" +
" var tcid = $(this).attr(\"name\");\n" +
" var tc = $(this).next();\n" +
" var tcl = $(this).prev();\n" +
" $(this).wrap(\"<div class=\\\"tabDetail\\\"></div>\")\n" +
" tc.appendTo($(this).parent());\n" +
" tcl.appendTo($(this).parent());\n" +
" });\n" +
" });\n" +
" $(function () {\n" +
" $($('.tabBox > a')[0]).attr(\"class\",\"current\");\n" +
" $($('.tabDetail')[0]).show();\n" +
" $('.tabBox > a').on(\"click\",function(){\n" +
" var num=$(this).index();\n" +
" console.log(num)\n" +
" $('.tabBox > a').each(function(){\n" +
" if($(this).index()==num){\n" +
" $(this).attr(\"class\",\"current\");\n" +
" $('.tabDetail').hide();\n" +
" $($('.tabDetail')[num]).show();\n" +
" }else{\n" +
" $(this).attr(\"class\",\"\");\n" +
" }\n" +
" });\n" +
" });\n" +
" });\n" +
"</script>\n" +
"</HTML>";
RandomAccessFile raf = new RandomAccessFile(pdfFile.getAbsolutePath(), "rw");
long lastPoint = 0; //记住上一次的偏移量
String line = null;
while ((line = raf.readLine()) != null) {
final long ponit = raf.getFilePointer();
if (line.toUpperCase().contains("</HTML>")) {
String str = line.toUpperCase().replace("</HTML>", htmlFormant);
raf.seek(lastPoint);
raf.write(str.getBytes("gb2312"));
}
lastPoint = ponit;
}
raf.close();
} catch (IOException e) {
e.printStackTrace();
}
}
LOG.info("call office to pdf ,convert over. file info:" + fileEntity.toString());
}
return true;
} catch (OfficeException e) {
e.printStackTrace();
LOG.info(
"call office to pdf ,thrown error info:" + e.toString() + ", file info:" + fileEntity
.toString());
return false;
}
}
return false;
}
上面有一个任意读写文件,是为了加入自定已的js 来控制excle 的展示样式。反正当时纠结了好久。
pom:
<!--open office-->
<dependency>
<groupId>org.jodconverter</groupId>
<artifactId>jodconverter-core</artifactId>
<version>4.1.0</version>
</dependency>
<dependency>
<groupId>org.jodconverter</groupId>
<artifactId>jodconverter-local</artifactId>
<version>4.1.0</version>
</dependency>
<dependency>
<groupId>org.jodconverter</groupId>
<artifactId>jodconverter-spring-boot-starter</artifactId>
<version>4.1.0</version>
</dependency>
<dependency>
<groupId>org.libreoffice</groupId>
<artifactId>juh</artifactId>
<version>5.4.2</version>
</dependency>
<dependency>
<groupId>org.libreoffice</groupId>
<artifactId>jurt</artifactId>
<version>5.4.2</version>
</dependency>
<dependency>
<groupId>org.libreoffice</groupId>
<artifactId>ridl</artifactId>
<version>5.4.2</version>
</dependency>
<dependency>
<groupId>org.libreoffice</groupId>
<artifactId>unoil</artifactId>
<version>5.4.2</version>
</dependency>
<dependency>
<groupId>org.libreoffice</groupId>
<artifactId>unoloader</artifactId>
<version>5.4.2</version>
</dependency>
代码就这么些着实有些简洁,却实现了一个看着不那么容易的功能。
springboot jodconverter openoffice 实现 office 文件 在线预览的更多相关文章
- 使用jodconverter和swftools实现文件在线预览
参考:仿百度文库解决方案(四)——利用JODConverter调用OpenOffice.org服务转换文档为PDF 文档在线预览主要用到如下两个工具 1,安装openoffice(同时下载jodcon ...
- office文件在线预览,模仿网易邮箱在线预览的
最近研究了半天,代码是倾情奉送啊,C#,asp.net的 这个原理是office文件转换为PDF文件,然后再转换成SWF文件,FlexPaper+swfTools. 有个问题,需要在web.confi ...
- 基于开源方案构建统一的文件在线预览与office协同编辑平台的架构与实现历程
大家好,又见面了. 在构建业务系统的时候,经常会涉及到对附件的支持,继而又会引申出对附件在线预览.在线编辑.多人协同编辑等种种能力的诉求. 对于人力不是特别充裕.或者项目投入预期规划不是特别大的公司或 ...
- 文件在线预览doc,docx转换pdf(一)
文件在线预览doc,docx转换pdf(一) 1. 前言 文档转换是一个是一块硬骨头,但是也是必不可少的,我们正好做的知识库产品中,也面临着同样的问题,文档转换,精准的全文搜索,知识的转换率,是知识库 ...
- asp.net word ecxel类型文件在线预览
asp.net word ecxel类型文件在线预览 首先得引用COM: Microsoft Excel 10 Object Library Microsoft Word 10 Object Libr ...
- 网页中动态嵌入PDF文件/在线预览PDF内容https://www.cnblogs.com/xgyy/p/6119459.html
#网页中动态嵌入PDF文件/在线预览PDF内容# 摘要:在web开发时我们有时会需要在线预览PDF内容,在线嵌入pdf文件: 问题1:如何网页中嵌入PDF: 在网页中: 常用的几种PDF预览代码片段如 ...
- kkfileview v2.0 发布,文件在线预览项目方案
kkfileview文件在线预览 此项目为文件文档在线预览项目解决方案,项目使用流行的spring boot搭建,易上手和部署,部署好后可以独立提供预览服务,使用http接口访问,不需要和应用集成,具 ...
- office文件的预览
使用FlexPaper实现office文件的预览(C#版) 需求很简单,用户上传office文件(word.excel.ppt)后,可以预览上传的这些文件.搜索的相关的资料后.整理如下: Step1. ...
- 使用PDF.JS实现pdf文件在线预览时,报文件被损坏的错误
首先大概说明一下问题出现的背景:我用PDF.JS实现文件在线预览,参考网上的办法,在jsp文件中使用 <iframe src="<c:url value="js/gen ...
- C# WebAPI 文件在线预览
最近在写一个移动端API接口,其中有一个需求:接口返回附件url地址让手机端调用实现文件在线预览.大体实现思路:把doc.xls等文本格式文件转换为pdf,转换后的pdf文件存放在服务器上面,方便第二 ...
随机推荐
- 蓝桥杯训练赛二-1169 问题 D: 绝对值排序
题目描述 输入n(n<=100)个整数,按照绝对值从大到小排序后输出.题目保证对于每一个测试实例,所有的数的绝对值都不相等. 输入 输入数据有多组,每组占一行,每行的第一个数字为n,接着是n个整 ...
- 浏览器中通过js获取用户语言环境方法
用户语言环境存在navigator对象中,不同浏览器分别通过如下方法获取用户浏览器语言.操作系统语言. IE6 IE7 IE8 Firefox Chrome Safari Opera naviga ...
- win的安全更新安装不成功,可用下面命令进行强制更新
- GIT迁移仓库地址时如何保留分支和历史记录
需求背景 GIT仓库(GitLab)所在服务器因某些原因要关停,相关服务需转移到另外一台机器上. 操作步骤 # clone项目 git clone --mirror http://192.168.12 ...
- 《OKR源于英特尔和谷歌的目标管理利器》读书笔记
17年10月下旬至11月,因团队需要改变考核方式以及更好的服务业务,Q4将尝试OKR的方式进行考核,故阅读了此书,有些想法与笔记. OKR定义:OKR是一套严密的思考框架和持续的纪律要求,旨在确保员工 ...
- ASP.NET WebAPI 单元测试-UnitTest
xUnit.Net
- CF1534F2 Falling Sand (Hard Version)
个人思路: 每个点向相邻沙子连边,向本列和相邻 \(2\) 列下方第一个沙子连边. 对于一个 DAG,所有入度为 \(0\) 的点会覆盖全部点.我们缩点即可通过 F1. 但是这样做是过不了 F2 的. ...
- Pr视频软件主要知识点
1,选中某一个面板,点击"Tab键上的 '波浪号' 键"即可将这个面板全屏展示 . 2,新建序列项目:自定义,25帧/s,方形像素,无场(逐行扫描). 3,序列面板素材自动缩放适 ...
- imputation-综述文章:关于网络推理的scRNA序列插补工具基准突出了高稀疏性水平下的性能缺陷
文章题目: Benchmarking scRNA-seq imputation tools with respect to network inference highlights 中文题目: 关于网 ...
- pyhon&QT编译
1.编译qrcpyrcc5 -o ico_rc.py ./ico/ico.qrc.qrc文件格式<RCC> <qresource prefix="/"> & ...