php 实现百度文库搭建
第一步:安装jodconverter,安装之后可以实现doc文档转成pdf。
文件下载地址为http://www.artofsolving.com/opensource/jodconverter
下载了之后直接解压,解压到/opt目录下/opt/jodconverter-2.2.2/,使用到的文件是安装包内的lib/jodconverter-cli-2.2.2.jar。
测试是否可以使用
- java -jar /opt/jodconverter-2.2.2/lib/jodconverter-cli-2.2.2.jar /home/php/1.doc /home/php/1.pdf
这里提示缺少java软件包,并会提示几个安装包供。选择我安装openjdk-6-jre-headless,命令如下:
- sudo apt_get openjdk-6-jre-headless
安装之后再运行上面doc转pdf的命名,会提示openoffice进程未启动,

因为JODConverter是通过OpenOffice來做转换的 ,所以使用前需要先安裝OpenOffice, 並且將OpenOffice的Service启动, 才可以使用. 启动命令
sudo /usr/bin/soffice -headless -accept="socket,host=127.0.0.1,port=8100;urp" -nofirststartwizard
到此运行上面的doc转pdf的命令已经可以成功。
如果系统没有按照openoffice或者曾经安装过liboffice
参考下面步骤
如果系统安装了libreoffice
参考下面步骤
如果安装了libreoffice 执行 sudo apt-get purge libreoffice*
一、下载“openOffice.org”的DEB安装包
到中文官网上下载DEB安装包 , 网址:http://download.openoffice.org/other.html#en-US,现在(2011年6月1日)的最新版是 3.3.0,我下载的文件是“OOo_3.3.0_Linux_x86_install-deb_zh-CN.tar.gz”。并将下载的文件复制到主目
录(即当前登录用户的主目录,这样所在文件夹名字不带汉字,可防发生意外)下。
二、卸载“LibreOffice”
利用“新立得”或“软件中心”卸载“LibreOffice”。用新立得卸载时,在新立得中搜索“LibreOffice”,结果中有“LibreOffice”的已安装文件一律卸载。
三、安装“openOffice.org”:
1、解压文件
打开终端,输入命令:
sudo tar -zxvf Ooo_3.3.0_Linux_x86_install-deb_zh-CN.tar.gz,得到文件夹“OOO330_m20_native_packed-1_zh-CN.9567”。
2、进入解压后的文件夹中的“DEBS”文件夹
命令:cd ./OOO330_m20_native_packed-1_zh-CN.9567/DEBS 。
3、安装主文件
命令:sudo dpkg -i *.deb 安装“DEBS”包内的全部“.deb”文件。此包内的文件全部安装后,在系统菜单的“办公”菜单下还不能找到“openOffice.org”的快捷方式,继续安装。
4、进入“DEBS”包内的“desktop-integration”文件夹
命令:cd desktop-integration 。
5、安装“openOffice.org”的快捷方式
安装“desktop-integration”文件夹内的“.deb”文件,命令:
sudo dpkg -i *.deb,此命令执行完后,如果没有错误提示,OK。这时你就可在系统菜单中的“办公”菜单中找到“openOffice.org”的快捷方式了。
第二步:安装swftools,安装之后可以实现pdf文件转成swf
- wget http://www.swftools.org/swftools-0.9.1.tar.gz
- tar xzf swftools-0.9.1.tar.gz
- cd swftools-0.9.1
- ./configure
- make
- make install
测试是否可以使用
pdf2swf -o /home/php/1.swf -z -t -f /home/php/1.pdf -s flashversion=9
第三步:用FlexPaper实现在线预览,里面有详细的demo。
第四步:使用php测试文档转换命令:
文档转pdf
- <?php
- $doc = './docs/test.txt';
- $formatName = './pdf/test.pdf';
- $command = 'java -jar /opt/jodconverter-2.2.2/lib/jodconverter-cli-2.2.2.jar '.$doc.' '.$formatName;
- exec($command);
- echo 'ok';
pdf转swf
- <?php
- $pdf = './pdf/test.pdf';
- $swf = './swf/test.swf';
- $command = '/usr/local/wenku/swftools-0.9.1/src/pdf2swf -o '.$swf.' -T -z -t -f '.$pdf.' -s flashversion=9';
- exec($command);
- echo 'ok';
php脚本去运行上面的命令可能存在权限的问题无法执行
其中我测试使用的php脚本调用pdf2swf进行转换文件,生成不了。这样只需配置apache的用户权限即可,确保配置的用户有权限运行pdf2swf命令
默认安装的php环境ubuntu下配置文件是/etc/apache2/apache2.conf修改这两行,
User ${APACHE_RUN_USER}
Group ${APACHE_RUN_USER}
配置完之后,重启apache。
/etc/init.d/apache2 restart
到此linux下的安装配置就结束了。
window下测试
下载window下使用的Pdf2Swf tool和FlexPaper,手动的将pdf文件转swf后进行在线查看的功能。
步骤整理如下:
1.安装Pdf2Swf tool之后,进行将pdf转swf。cmd命令行:
pdf2swf.exe -t D:\wamp5.3\www\test\pdf\c.pdf -s flashversion=9 -o D:\wamp5.3\www\test\swf\c.swf
-t: 源文件路径,即待转换的pdf文件路径。
-s: 设置参数,这里我们设置为 flashversion=9 ,即可以转换为9 的版本啦。
-o: 输出文件的路径,这里我输出到D:盘下
运行的结果如图所示:

2.使用FlexPaper插件显示浏览swf文件。这里下载使用的版本是1.5.8 Flash Version (release notes)。软件包内就已经有html版本的demo,稍微改动下句可以实现了。
代码如下:
- <script src="js/flexpaper_flash.js" type="text/javascript"></script>
- <a id="viewerPlaceHolder" style="width:680px;height:480px;display:block;"/></a>
- <script type="text/javascript">
- var fp = new FlexPaperViewer(
- 'FlexPaperViewer',
- 'viewerPlaceHolder', { config : {
- SwfFile : escape('c.swf'),
- Scale : 0.1,
- ZoomTransition : 'easeOut',
- ZoomTime : 0.5,
- ZoomInterval : 0.2,
- FitPageOnLoad : true,
- FitWidthOnLoad : false,
- FullScreenAsMaxWindow : false,
- ProgressiveLoading : false,
- MinZoomSize : 0.2,
- MaxZoomSize : 5,
- SearchMatchAll : false,
- InitViewMode : 'Portrait',
- PrintPaperAsBitmap : false,
- ViewModeToolsVisible : true,
- ZoomToolsVisible : true,
- NavToolsVisible : true,
- CursorToolsVisible : true,
- SearchToolsVisible : true,
- localeChain: 'en_US'
- }})
- </script>
到此就结束了,查看效果如图实现:

上面为ubuntu环境安装
centos安装如下
第一步安装openoffice
安装最新的openoffice 需要最新的系统,redhadserver5.5不行,因为里面GLIBC最高是2.5的,最新的openoffice需要GLIBC_2.11。所以openoffice安装到了线上的阿里云上面的CentOS 6.2上面。
1:下载最新的 openoffice
地址:
下载文件。
2:下载完成后解压
tar xfApache_OpenOffice_incubating_3.4.1_Linux_x86-64_install-rpm_zh-CN.tar.gz
[root~]# tar xfApache_OpenOffice_incubating_3.4.1_Linux_x86-64_install-rpm_zh-CN.tar.gz
3.安装软件
[root~]# cd zh-CN/
[root~]# cd RPMS
安装所有的rpm
[root~]# yum localinstall *.rpm //注意,请用 yum localinstall 而不是 yum install
然后再安装desktop-integration下的openoffice.org3.4-redhat-menus-3.4-9593.noarch.rpm
注意可能需要重新安下openoffice.org-ure-3.4.1-9593.x86_64.rpm 这个rpm 在RPMS目录下
4.启动服务
进入安装目录/opt/openoffice.org3/program
执行命令:soffice-headless -accept="socket,host=127.0.0.1,port=8100;urp;"-nofirststartwizard &
安装如果报错: javaldx: Could not find a Java Runtime Environment!
可能遇到的问题1
[program~]$ soffice -headless-accept="socket,host=127.0.0.1,port=8100;urp;" -nofirststartwizard&
[1] 3094
[program~]$
/opt/openoffice.org3/program/soffice.bin: error while loading
sharedlibraries: libuno_sal.so.3: cannot open shared object file: No
such file ordirectory
[1]+ Exit 127 soffice -headless-accept="socket,host=127.0.0.1,port=8100;urp;" -nofirststartwizard
解决方法
重新装openoffice.org-ure-3.4.1-9593.x86_64.rpm
进入RPMS 目录
[program~]$ sudorpm -ivh openoffice.org-ure-3.4.1-9593.x86_64.rpm
Preparing... ########################################### [100%]
1:openoffice.org-ure ###########################################[100%]
然后重新进入
[keylogic@AY1303191548348936fe RPMS]$ cd/opt/ openoffice.org3/program/
可能遇到的问题2
Openoffice启动是要java支持的,所有系统要先安装java
第二步:安装swf
如果机器没有安装gcc
安装gcc
====================================
在阿里云安装gcc
[root~]# yum install gcc
遇到类似以下的错误
Error: Package:glibc-headers-2.12-1.80.el6_3.6.x86_64 (updates)
Requires: kernel-headers >= 2.2.1
Error: Package:glibc-headers-2.12-1.80.el6_3.6.x86_64 (updates)
Requires: kernel-headers
解决办法:
注释掉/etc/yum.conf中的
exclude=kernel*
这一行
=======================================
解决在CentOS5.5 64bit 下编译安装失败需要先安装如下软件。
# yum -y install giflib-devel libjpeg-develfreetype-devel t1lib-devel zlib
第一步:下载源文件
http://www.swftools.org/swftools-2013-04-09-1007.tar.gz
# tar xfswftools-2013-04-09-1007.tar.gz
# cdswftools-2013-04-09-1007
# ./configure
# make
# make install
遇到的问题
这个可能是 缺少gcc或者g++
[root~]# yum install gcc-c++
还可能有依赖包
yum-y install giflib-devel libjpeg-devel freetype-devel t1lib-devel zlib
还可能遇到的问题
modules/.././types.h:39:2: 错误:#error "no way to define 64 bit integer"
modules/.././types.h:42:2: 错误:#error "don't know how to define 32 bit integer"
modules/.././types.h:45:2: 错误:#error "don't know how to define 16 bit integer"
modules/.././types.h:48:2: 错误:#error "don't know how to define 8 bit integer"
解决方法:
[root~]# ldconfig /usr/local/lib
然后再执行
[root~]# ldconfig /usr/local/lib
[root~]# ./configure
解决字体问题
swftools 对中文乱码问题
需要把windows的字体复制到linux上。
字体位置:C:\Windows\Fonts
把字体文件打包传到服务器上。
============网上参考别人的东西 开始==============
# mkdir /usr/share/fonts/win
# chmod 644/usr/share/fonts/win/*将以上字体文件复制到/usr/share/fonts/win目录下执行
# mkfontscale
#mkfontdir # mkfont命令是生成win目录下所包含的字体的索引信息
#fc-cache #fc-cache命令更新字体缓存
# fc-cache -f –v
然后运行reboot 重启系统。字体美化就OK了!
============网上参考别人的东西 结束==============
以下是我的执行步骤
1:把 C:\Windows\Fonts 下的所有文件包。
2:把打包的fonts.zip 传到 /usr/share/fonts/
3:解压fonts.zip
4:进入这个目录执行 mkfontscale mkfontdir c-cache fc-cache -f –v
5:重新启动系统。
可能遇到的问题
没有mkfontscale 命令
解决方法
[]$sudo yum install mkfontscale
中文无法显示问题
jodconverter 转换不了中文
将Windows下的字体C:\Windows\Fonts\simsun.ttc 还有simhei.ttf黑体 拷贝到 openoffice 目录:eg: /usr/lib/openoffice.org1.9.104/share/fonts/truetype/simsun.ttc
安装xpdf语言包,解决中文无法显示问题
对于未安装xpdf的用户
pdf2swf在将pdf文件转换成swf文件时,如果pdf中有中文,那么pdf2swf就可能处理不了,这时就需要在pdf2swf生成时添加xpdf支持,接下来我们就来看看如何安装xpdf。
首先到xpdf网站:http://foolabs.com/xpdf/download.html上下载xpdf-chinese-simplified.tar.gz文件(ftp://ftp.foolabs.com/pub/xpdf/xpdf-chinese-simplified.tar.gz),windows与linux皆适用,下载下来后,解压到某一特定目录,然后将本文附件当中名为stsong.tar.gz文件下载下来,解压后将其中的STSONG.TTF字体文件放在xpdf-chinese-simplified所在目录下的CMap目录下,然后打开xpdf-chinese-simplified所在目录下add-to-xpdfrc文件,源文件内容如下:
#----- begin Chinese Simplified support package (2011-sep-02)cidToUnicode Adobe-GB1 /usr/local/share/xpdf/chinese-simplified/Adobe-GB1.cidToUnicodeunicodeMap ISO-2022-CN /usr/local/share/xpdf/chinese-simplified/ISO-2022-CN.unicodeMapunicodeMap EUC-CN /usr/local/share/xpdf/chinese-simplified/EUC-CN.unicodeMapunicodeMap GBK /usr/local/share/xpdf/chinese-simplified/GBK.unicodeMapcMapDir Adobe-GB1 /usr/local/share/xpdf/chinese-simplified/CMaptoUnicodeDir /usr/local/share/xpdf/chinese-simplified/CMap#fontFileCC Adobe-GB1 /usr/..../gkai00mp.ttf#----- end Chinese Simplified support package |
从原文件中可以看到,其中关于字体路径信息是基于linux的,所以如果要根据你的xpdf-chinese-simplified目录实际存放位置进行修改,
- 如linux下修改后的内容为:
#----- begin Chinese Simplified supportpackage(2011-sep-02)cidToUnicode Adobe-GB1 /usr/local/share/xpdf/chinese-simplified/Adobe-GB1.cidToUnicodeunicodeMap ISO-2022-CN /usr/local/share/xpdf/chinese-simplified/ISO-2022-CN.unicodeMapunicodeMap EUC-CN /usr/local/share/xpdf/chinese-simplified/EUC-CN.unicodeMapunicodeMap GBK /usr/local/share/xpdf/chinese-simplified/GBK.unicodeMapcMapDir Adobe-GB1 /usr/local/share/xpdf/chinese-simplified/CMaptoUnicodeDir /usr/local/share/xpdf/chinese-simplified/CMapdisplayCIDFontTT Adobe-GB1 /usr/share/xpdf-chinese-simplified/CMap/STSONG.TTF#fontFileCC Adobe-GB1 /usr/..../gkai00mp.ttf#----- end Chinese Simplified supportpackage可以看到这里除了修改标准信息名,还添加了名为displayCIDFontTT的了行信息,在该行信息中,我们指定了之前下载的STSONG.TTF文件的位置。
- 如果系统为windows,那么修改后的内容可能是下面的样子:
#----- begin Chinese Simplified supportpackage(2011-sep-02)cidToUnicode Adobe-GB1 D:/xpdf-chinese-simplified/Adobe-GB1.cidToUnicodeunicodeMap ISO-2022-CN D:/xpdf-chinese-simplified/ISO-2022-CN.unicodeMapunicodeMap EUC-CN D:/xpdf-chinese-simplified/EUC-CN.unicodeMapunicodeMap GBK D:/xpdf-chinese-simplified/GBK.unicodeMapcMapDir Adobe-GB1 D:/xpdf-chinese-simplified/CMaptoUnicodeDir D:/xpdf-chinese-simplified/CMapdisplayCIDFontTT Adobe-GB1 D:/xpdf-chinese-simplified/CMap/STSONG.TTF#fontFileCC Adobe-GB1 D:/xpdf-chinese-simplified/gkai00mp.ttf#----- end Chinese Simplified supportpackage可以看到,该文件同样指定了STSONG.TTF文件位置信息。
对于已安装xpdf的用户
已配置过 epel 源的CentOS为例,可以通过如下命令直接安装xpdf
yum install xpdf |
然后执行如下命令
ln -s /etc/xpdf/add-to-xpdfrc.chinese-simplified /usr/share/xpdf/chinese-simplified/add-to-xpdfrc |
上传字体到/usr/share/fonts/default/truetype/stsong/STSONG.TTF
修改/usr/share/xpdf/chinese-simplified/add-to-xpdfrc文件
#----- begin Chinese Simplified support package (2004-jul-27)cidToUnicode Adobe-GB1 /usr/share/xpdf/chinese-simplified/Adobe-GB1.cidToUnicodeunicodeMap ISO-2022-CN /usr/share/xpdf/chinese-simplified/ISO-2022-CN.unicodeMapunicodeMap EUC-CN /usr/share/xpdf/chinese-simplified/EUC-CN.unicodeMapunicodeMap GBK /usr/share/xpdf/chinese-simplified/GBK.unicodeMapcMapDir Adobe-GB1 /usr/share/xpdf/chinese-simplified/CMaptoUnicodeDir /usr/share/xpdf/chinese-simplified/CMap#displayCIDFontTT Adobe-GB1 /usr/..../gkai00mp.ttfdisplayCIDFontTT Adobe-GB1 /usr/share/fonts/default/truetype/stsong/STSONG.TTF#----- end Chinese Simplified support package |
上传xpdf-chinese-simplified.tar.gz压缩包的CMap目录到/usr/share/xpdf/chinese-simplified
即可。
使用命令
pdf2swf -s languagedir=/usr/local/xpdf-chinese-simplified -T 9 -s poly2bitmap -s zoom=150 -s flashversion=9 "/opt/123.pdf" -o "/opt/test/%.swf"
php 实现百度文库搭建的更多相关文章
- 百度文库下载器 V2.3.4.3 支持豆丁百度文库道客巴巴
支持豆丁百度文库道客巴巴免下载劵财富值导出word 下载地址: http://pan.baidu.com/s/1qYCmQde
- 在线预览Office文件【效果类似百度文库】
引言 结合上个项目和目前做的这个项目,其中都用到了Office文件在线预览,目前项目中是用到公司购买的Ntko控件,该控件每次浏览文件时则会提示安装信任插件,很繁琐,而且浏览效果不好. 提到Offic ...
- Silverlight类百度文库在线文档阅读器
百度文库阅读器是基于Flash的,用Silverlight其实也可以做. 我实现的在线阅读器可以应用于内网文档发布,在线阅览审批等.没有过多的堆积功能,专注于核心功能.主要有以下特性: 1. 基于XP ...
- Java+FlexPaper+swfTools仿百度文库文档在线预览系统设计与实现
笔者最近在给客户开发文档管理系统时,客户要求上传到管理系统的文档(包括ppt,word,excel,txt)只能预览不允许下载.笔者想到了百度文库和豆丁网,百度文库和豆丁网的在线预览都是利用flash ...
- 在线预览Office文件【效果类似百度文库】(转载)
转载地址:http://www.cnblogs.com/sword-successful/p/4031823.html 引言 结合上个项目和目前做的这个项目,其中都用到了Office文件在线预览,目前 ...
- java开发_模仿百度文库_OpenOffice2PDF_注意事项
在模仿百度文库的操作过程中,有很多朋友反映出来的一些问题,是我想起了写这篇blog. 主要是让大家在做的过程中注意一些东西,否则达不到想要的效果. 第一步:我们先从 java开发_模仿百度文库_Ope ...
- php大力力 [009节]php在百度文库的几个基础教程
2015-08-23 php大力力009. php在百度文库的几个基础教程 php大力力 [009节]php在百度文库的几个基础教程 PHP脚本中操作MySQL数据库3-猿代码平台 php基础教程-绝 ...
- php大力力 [001节]2015-08-21.php在百度文库的几个基础教程新手上路日记 大力力php 大力同学 2015-08-21 15:28
php大力力 [001节]2015-08-21.php在百度文库的几个基础教程新手上路日记 大力力php 大力同学 2015-08-21 15:28 话说,嗯嗯,就是我自己说,做事认真要用表格,学习技 ...
- 利用FlashPaper实现类似百度文库功能
最近需要实现一个类似百度文库的功能,在Google上淘了一段时间,发现FlashPaper还算能够不错的实现此需求. 首先讲下思路: 1>安装FlashPaper: 2>利用java代码将 ...
随机推荐
- matlab中double和im2double
uint8的图像里 im2double其实就是double(I/255); 像素值被标准化到0-1. 16位图像以此类推.
- 程序try-catch的绝对健壮性之嵌套
写程序的过程中,我们对try-catch在熟悉不过了,捕获异常进行处理,以保证程序的健壮性. 今日突发一想,如果我们catch中的代码异常了怎么办?我们做以下一种假设 static void Main ...
- opencv roi resize 会导致内存拷贝产生子图像
opencv roi区域 resize之后,roi的引用已不是原图的引用,而是内存拷贝产生的子图像. http://blog.csdn.net/qianqing13579/article/detail ...
- MpVue解析
前言 mpvue是一款使用Vue.js开发微信小程序的前端框架.使用此框架,开发者将得到完整的 Vue.js 开发体验,同时为H5和小程序提供了代码复用的能力.如果想将 H5 项目改造为小程序,或开发 ...
- 【面试季之三】IE6兼容问题
最近面试真的碰到很多基础的问题,平时在工作的时候往往可以直观的看到页面的问题,然后进行代码调试,调试不明白了还可以上网查一下.可是面试的时候,就是得当场反应出来,并且还得能系统的说出1.2.3.4.5 ...
- HTTP浅析
引言 HTTP是一个属于应用层的面向对象的协议,由于其简捷.快速的方式,适用于分布式超媒体信息系统.它于1990年提出,经过几年的使用与发展,得到不断地完善和扩展.目前在WWW中使用的是HTTP/1. ...
- 微软原版WINDOWS10-LTSB-X64位操作系统的全新安装与优化
原版WINDOWS10_LTSB_X64位操作系统,安装U盘的制作 1.在一台能正常运行的电脑上,下载原版WINDOWS10_LTSB_X64位操作系统镜像(ISO)文件: 2.运行UltraISO. ...
- 如何给 FastAdmin 单独设置域名
如何给 FastAdmin 单独设置域名 (声明:不建议给后台固定的域名,主要是安全问题) FastAdmin 是基于 ThinkPHP5 框架编写的,ThinkPHP 5 支持域名路由,可对模块单独 ...
- 无法建立目录wp-content/uploads/xxxx/xx。有没有上级目录的写权限?解决办法
首先小七已经搭建了n个wordpress网站之前没遇到过这坑爹的问题,有一天很奇怪无论是本地搭建的wp还是线上搭建的wp网站都出现了同样的问题 本地: 报错原因就是文件权限问题,所以首先就是更改wp- ...
- BufferedInputStream与BufferedOutputStream
BufferedInputStream是带缓冲区的输入流,默认缓冲区大小是8M,能够减少访问磁盘的次数,提高文件读取性能:BufferedOutputStream是带缓冲区的输出流,能够提高文件的写入 ...