pdf2htmlEx安装及测试
pdf2htmEx转换效果优秀,可以将pdf转换为html文件,转换速度很快
有两种输出形式,
1、一个pdf对应一个html文件,转换出来的html文件较大
2、一个pdf对应多个html页面,且可实现页面自动懒加载
缺点:转换出来的html文件比原始文件要大、对html5支持的好,对IE8及以下兼容差。
官方提供的代码依赖项目繁多,且安装复杂,对centos支持差,有提供docker镜像。
个别pdf转换之后会生成woff字体文件,导致生成的体积比较大。
对中文字体支持的不好
官方demo:
http://coolwanglu.github.io/pdf2htmlEX/demo/geneve.html
http://coolwanglu.github.io/pdf2htmlEX/demo/demo.html
http://coolwanglu.github.io/pdf2htmlEX/demo/cheat.html
教程:
http://blog.csdn.net/chijiaodaxie/article/details/47684089
http://blog.csdn.net/chijiaodaxie/article/details/50974314
http://blog.csdn.net/knight_zhen/article/details/48268841
docker安装:docker安装不再介绍
安装docker镜像,运行如下命令:docker pull bwits/pdf2htmlex
原生安装:sudo add-apt-repository ppa:coolwanglu/pdf2htmlex && sudo apt-get update && sudo apt-get install pdf2htmlEX
手动编译源文件安装(ubuntu14.04):
1、源文件安装之前需要注意设置INCLUDE_PATH环境变量,既设置在 ~/.bashrc文件的末尾添加export INCLUDE_PATH=/usr/include/glib-2.0
2、安装FontForge
2.1、安装git
sudo apt-get install git;
2.2、安装依赖
sudo apt-get install packaging-dev pkg-config python-dev libpango1.0-dev libglib2.0-dev libxml2-dev giflib-dbg libjpeg-dev libtiff-dev uthash-dev libspiro-dev build-essential automake flex bison;
2.3、安装unifont
sudo apt-get install unifont;
2.4、编译并安装libspiro
git clone https://github.com/fontforge/libspiro.git
cd libspiro
autoreconf -i
automake --foreign -Wall
./configure
make
sudo make install
2.5、编译并安装libuninameslist
git clone https://github.com/fontforge/libuninameslist.git
cd libuninameslist
autoreconf -i
automake --foreign
./configure
make
sudo make install
2.6、编译并安装fontforge
cd fontforge;
./bootstrap;
./configure;
make;
sudo make install;
sudo ldconfig;
3、安装poppler
wget https://poppler.freedesktop.org/poppler-0.49.0.tar.xz
./configure --enable-xpdf-headers --prefix=/usr
make;
sudo make install;
4、安装pdf2htmlEX
git clone git://github.com/coolwanglu/pdf2htmlEX.git
cd pdf2htmlEX
cmake . && make && sudo make install
操作系统:ubuntu14.04
内存:1GB
处理器:单核
测试1:
测试步骤:
1:在~/目录创建pdf子目录,将spring-framework-reference.pdf放入pdf目录,
2:运行命令:sudo pdf2htmlEX --zoom 1.3 spring-framework-reference.pdf
待转换的pdf文件:
内容:纯文字(有表格)
大小:5.46M
页数:907页
生成的html:
|
形式 |
用时 |
总输出大小 |
单个页面大小 |
|
单个文件 |
1分24秒 |
26.3M |
无 |
|
多个文件(懒加载) |
1分22秒 |
22.9M |
20k左右 |
测试2:
测试步骤:
1:在~/目录创建pdf子目录,将spring-framework-reference.pdf放入pdf目录,
2:运行命令:sudo pdf2htmlEX --zoom 1.3 GROOVY入门经典.pdf
待转换的pdf文件:
内容:扫描的pdf
大小:15.6M
页数:372页
生成的html:
|
形式 |
用时 |
总输出大小 |
单个页面大小 |
|
单个文件 |
1分37秒 |
53.9M |
无 |
|
多个文件(懒加载) |
1分34秒 |
40.5M |
100k左右 |
测试3
测试步骤:
1:在~/目录创建pdf子目录,将spring-framework-reference.pdf放入pdf目录,
2:单个文件运行命令:sudo pdf2htmlEX --zoom 1.3 RocketMQ_design.pdf
3:多个文件运行命令:sudo pdf2htmlEX --embed cfijo --split-pages 1 --dest-dir out --page-filename RocketMQ_design-%d.page ~/pdf/RocketMQ_design.pdf
待转换的pdf文件:
内容:有图片及流程图的文字pdf
大小:1.25M
页数:37页
生成的html:
|
形式 |
用时 |
总输出大小 |
单个页面大小 |
|
单个文件 |
1分37秒 |
53.9M |
无 |
|
多个文件(懒加载) |
1分34秒 |
40.5M |
100k左右 |
使用pdftoppm将pdf转换成图片
教程:https://websetnet.com/zh/convert-pdf-bitmap-image-pdftoppm/
缺点:对中文支持力度不够,转换时间长,输出文件大
测试1:
测试步骤:
1:在~/目录创建pdf子目录,将spring-framework-reference.pdf放入pdf目录,
2:分别运行命令:
pdftoppm -jpeg spring-framework-reference.pdf spring_framework_reference
pdftoppm -png spring-framework-reference.pdf spring_framework_reference
待转换的pdf文件:
内容:纯文字(有表格)
大小:5.46M
页数:907页
生成的图片:
|
格式 |
用时 |
总输出大小 |
单个页面大小 |
画面比例 |
|
jpeg |
1分05秒 |
207M |
250k左右 |
100% |
|
png |
5分58秒 |
254M |
300k左右 |
100% |
测试2:
测试步骤:
1:在~/目录创建pdf子目录,将GROOVY入门经典.pdf放入pdf目录,
2:分别运行命令:
pdftoppm -jpeg GROOVY入门经典.pdf GROOVY入门经典
pdftoppm -png GROOVY入门经典.pdf GROOVY入门经典
待转换的pdf文件:
内容:扫描的pdf
大小:15.6M
页数:372页
生成的图片:
|
格式 |
用时 |
总输出大小 |
单个页面大小 |
画面比例 |
|
jpeg |
0分21秒 |
54.4M |
150k左右 |
100% |
|
png |
1分44秒 |
37.6M |
100k左右 |
100% |
pdf2htmlEx安装及测试的更多相关文章
- my SQL下载安装,环境配置,以及密码忘记的解决,以及navicat for mysql下载,安装,测试连接
一.下载 在百度上搜索"mysql-5.6.24-winx64下载" 二.安装 选择安装路径,我的路径“C:\Soft\mysql-5.6.24-winx64” 三.环境配置 计算 ...
- OpenCV2+入门系列(一):OpenCV2.4.9的安装与测试
这里假设看到这篇文章的人都已经对OpenCV以及机器视觉等最基础的概念有了一定的认识,因此本文不会对OpenCV做任何的介绍,而是直接介绍OpenCV2.4.9的安装与测试.此外本文只是简单的介绍如何 ...
- 决战大数据之三-Apache ZooKeeper Standalone及复制模式安装及测试
决战大数据之三-Apache ZooKeeper Standalone及复制模式安装及测试 [TOC] Apache ZooKeeper 单机模式安装 创建hadoop用户&赋予sudo权限, ...
- coreseek实战(一):windows下coreseek的安装与测试
coreseek实战(一):windows下coreseek的安装与测试 网上关于 coreseek 在 windows 下安装与使用的教程有很多,官方也有详细的教程,这里我也只是按着官方提供的教程详 ...
- Window下memcached安装与测试步骤
如何在Window下memcached安装与测试步骤 工具/原料 电脑 memcached 软件 方法/步骤 软件包下载 下载Memercached For Windows:http://downlo ...
- 【MySql】5.6.14版本的安装和测试
当前状态:apache2.4.6和php5.5.6已经安装成功: mysql的安装和测试: 一.安装mysql5.6.14,参考http://wenku.baidu.com/link?url=_0jk ...
- jdbc_odbc SQLserver 驱动安装及测试
有2次被问到同一个问题,尽管博客园是.net的园子,我还是分享下吧.PS:我现在做的.net,以前学过点java.献丑了. ------------------ 原始邮件 -------------- ...
- mosquitto在Linux环境下的部署/安装/使用/测试
mosquitto在Linux环境下的部署 看了有三四天的的源码,(当然没怎么好好看了),突然发现对mosquitto的源码有了一点点感觉,于是在第五天决定在Linux环境下部署mosquitto. ...
- http_load安装与测试参数分析 - 追求自由自在的编程 - ITeye技术网站
http_load安装与测试参数分析 - 追求自由自在的编程 - ITeye技术网站 http_load -p 50 -s 120 urls
随机推荐
- 【辅助远程连接,可穿防火墙、NAT】一次 TeamViewer 的安装与测试
背景: 应课程老师要求帮助某化学老师维修机器(高性能电脑),并解决老师的若干问题,在解决硬件问题(上网问题:多个网络接口)之后,化学老师提出需要远程链接到该机器,试询问之前如何实现,化学老师推荐Tea ...
- p/invoke碎片--对类的封送处理
主要是看默认封送处理行为 按类成员的类型是否为“可直接传递到非托管内存”的类型来分类;按照成员中是否有“可直接传递到非托管内存”的类型来讨论. 所有成员都是“可直接传递到非托管内存”的类型 托管代码和 ...
- .htaccess基本语法和应用 (2012-11-09 16:13:47)转载▼
htaccess基本语法和应用 (2012-11-09 16:13:47) 转载▼ 标签: htaccess it 分类: 网络 .htaccess是Apache服务器的一个非常强大的分布式配置文件 ...
- Input输入框输入银行卡号自动空格
input输入框是表格中用都最多的,像输入手机,密码,银行卡号的,很多对于输入银行卡号是没有处理的,比如这样~~ 看起来是不是一团乱麻,, 眼睛瞬间一片漆黑~ 如果是这样,会不会好很多呢~~ 其实逻 ...
- NFS
测试版本:CentOS 6.4 64b NFS监听2049(TCP/UDP)端口,但由于文件系统非常复杂,不同的功能都会使用不同的程序来启动,因此额外端口就会不固定(随机1024以下的),这就需要向远 ...
- HTC vive开发:关于手柄按键
一.关于左右手柄的对应关系 两个手柄和SteamVR_TrackedObject.EIndex是对应的,一个是EIndex.Device2,另一个是EIndex.Device3(有编号的那个) 在场景 ...
- KVC 和 KVO
KVC 键值编码 全称是Key-value coding,翻译成键值编码.它提供了一种使用字符串而不是访问器方法去访问一个对象实例变量的机制. 1.通过key(成员变量的名称)设置 ...
- 第4月第2天 nsinvocation崩溃 mvc videotrack
1. __unsafe_unretained id result = nil; [invocation getReturnValue:&result]; return result; http ...
- 修改git remote url
$ ssh -v wangz@gitlab.alibaxx-inc.com $ git remote ali set-url git@gitlab.alibaxx-inc.com:youk-aaa/x ...
- 为select 设置样式
问题: 在为表单添加下拉菜单时,有时候对菜单的样式没有特别的要求,就是需要修改下select元素的宽度和高度,但众所周知select元素的样式很难修改: select在各个浏览器,字体大小为14px时 ...