转自:https://www.jb51.net/article/73528.htm 本文实例讲述了JSP生成WORD文档,EXCEL文档及PDF文档的方法.分享给大家供大家参考,具体如下: 在web-oa系统中,公文管理好象不可或缺,有时需要从数据库中查询一些数据以某种格式输出来,并以word文档的形式展现,有时许多word文档保存到数据库中的某个表的Blob字段里,服务器再把保存在Blob字段中的图片文件展现给用户.通过网上查找发现很少有关于此类的文章,现在整理起来供大家参考. 1 在clie…
1.jsp生成word文件,直接改动jsp格式: <%@ page contentType="application/vnd.ms-word;charset=GB2312"%> <%@ pagepageEncoding="GB2312"%> <% String fileName ="word.doc"; byte[] bt =fileName.getBytes("GB2312"); String…
新的 PDF 补丁丁开放了内部测试了很久的好用功能——自动书签. 这个功能可以在一分钟内快速生成文本型 PDF 文档的书签(说明:本功能分析文档中的文本,生成标题,故对扫描版的 PDF 文档无效). 使用方法 1.打开 PDF 文档. 2.将鼠标移到标题文字上面,点击鼠标右键,选择“设置自动书签标题格式”命令下的标题级别,如下图所示. 点击后,编辑器将弹出一个“自动生成书签”对话框,上面列出标题格式和标题级别的对应关系(调整列表项的设置可修改书签文本样式). 通常,我们文档中不同级别的标题,字体…
可使用OCR文字识别软件ABBYY PDF Transformer+从Microsoft Word.Microsoft Excel.Microsoft PowerPoint.HTML.RTF.Microsoft Visio和TXT文档及从图像文件创建PDF文档.下面小编给大家讲讲ABBYY PDF Transformer+从文件创建PDF文档. 1. 打开文件菜单并单击"从文件创建",可在新的ABBYY PDF Transformer+窗口中创建PDF文档. 或者单击"创建&…
ABBYY FineReader 15(Windows系统)新增智能PDF文档转换功能,可自动检测导入PDF数字文档的文本层质量,确保转变为可编辑格式后的准确结果:从表单字段和文本框中提取文本,准确保留交互式PDF形式字段. ABBYY FineReader 15 OCR文字识别软件中的OCR 编辑器可让用户检查识别区域.验证识别出的文本.预处理图像以提高 OCR精确性等等. 图-1 ABBYY FineReader 15 单击打开选项卡,然后左键单击转换为PDF.Microsoft Word.…
运用ABBYY FineReader OCR文字识别软件,用户能将各种格式的PDF文档保存为新的PDF文档.PDF/A格式文档,以及Microsoft Word.Excel.PPT等格式.在保存与导出的文档的过程中,ABBYY FineReader 15 OCR文字识别软件也配备了各种强大的功能供用户更好地进行文档的输出. 第一.缩小PDF文档的大小 当PDF文档中包含较多图片时,用户可以使用ABBYY FineReader 15 OCR文字识别软件中的"减小文件大小"的功能来缩小所需…
C# 复制PDF页面到另一个PDF文档 有时候我们可能有这样一个需求,那就是把PDF页面从一个PDF文档复制到另一个PDF文档中.由于PDF文档并不像word文档那样好编辑,因此复制也相对没有那么容易.写这篇文章主要是分享一个简单而且比较容易实现的方法 - 使用C#将一个PDF文档的页面,包括文字.图片和背景等复制到另一个PDF文档的指定位置. 下面是我准备的两个PDF文件: 目标:将左边的PDF文档的第一页复制到右边的PDF文档的第二页的位置. 代码实现: 步骤1:初始化一个PdfDocume…
通过使用 PowerPoint Automation Services,可以从 PowerPoint 二进制文件格式 (.ppt) 和 PowerPoint Open XML 文件格式 (.pptx) 转换为其他格式.例如,您可能需要将一批 PowerPoint 97–2003 文件升级到 Open XML 演示文稿文件.您还可以在“编辑”菜单中创建自定义操作,以允许用户按需创建 PDF 版本的演示文稿. 一.效果演示: 1.新建一个ppt文档(office 2013,后缀pptx),添加内容,…
转载请注明来源:http://blog.csdn.net/loongshawn/article/details/51542309 相关文章: <Apache PDFbox开发指南之PDF文本内容挖掘> < Apache PDFbox开发指南之PDF文档读取> 1.介绍 Apache PDFbox是一个开源的.基于Java的.支持PDF文档生成的工具库,它可以用于创建新的PDF文档,修改现有的PDF文档,还可以从PDF文档中提取所需的内容.Apache PDFBox还包含了数个命令行…
通常在使用爬虫时,爬取到网上的文章都是各式各样的格式处理起来比较麻烦,这里我们使用Apache-Tika来处理PDF格式的文章,如下: package com.mengyao.tika.app; import java.io.File; import java.io.FileInputStream; import org.apache.tika.metadata.Metadata; import org.apache.tika.parser.ParseContext; import org.ap…