ABBYY导出结果为PDF注意事项
使用ABBYY FineReader Pro for Mac OCR文字识别软件识别文档时,可以将已识别的文本保存到文件中,还可以通过电子邮件发送已识别的文本,只要输出格式受FineReader支持。那么如果想要将识别结果导出为PDF格式,有哪些信息需要注意的呢?本文具体给大家讲讲PDF导出参数。
ABBYY FineReader识别文档之PDF导出参数:

1、导出模式
•仅文本和图片
此模式可以保存已识别的文本和图片,可对页面进行全文搜索,PDF文件的大小也将变小,生成文档的外观可能与原始文档略有不同。
•页面图像上的文本
该选项可保存原始文档的背景和图片,并将已识别的文本置于其上。通常,该PDF类型比“仅文本和图片”需要更多的磁盘空间。可对生成的PDF文档进行全文搜索。在某些情况下,生成文档的外观可能与原始文档略有不同。
•页面图像下的文本
该选项可以保存整个页面图像,并将已识别的文本置于其下。使用该选项创建可进行全文搜索的文档,且该文档看上去几乎与原始文档相同。
•仅页面图像
该选项可精确保存页面上的图像。用户几乎很难区分这类 PDF 文档和原始文档的差别,但不能对其进行搜索。
注意:PDF导出参数取决于选择的导出模式。因此,在某些模式下部分参数可能无法使用。
2、保留布局
•保留页码、页眉和页脚
选中此选项之后,将可以保存页眉、页脚文本和页码。如果禁用了此选项,则页眉、页脚和页码将不会被保存。
•保留图片
选中此选项之后,将可以保存已识别文本中的图片。图片质量和结果文件的大小取决于在“图像质量”面板中所做的选择。
•使用 MRC 压缩图像
选中此选项之后,将可以在高度压缩的文档中保留文本和图片的显示质量。因此,目标文件将是较小的高质量文本与图片。
3、图像质量
如果已识别文本包含众多图片,或者选择了保存页面图像的模式,那么结果文件可能会非常大。可以调整输出图片的质量,以减小输出文件的大小。
•低
如果希望PDF文档很小,请选中此选项。页面图像和图片的分辨率将减至150 dpi,这会影响它们的质量。
•平衡
如果既希望文件较小,同时又希望页面图像和图片的质量较高,请选中此选项。
•高
选中此选项之后,页面图像和图片将保持原始质量。
4、纸张尺寸
在将结果导出至PDF时,可以设置所用纸张的尺寸。从下拉列表中选择一个系统支持的纸张尺寸,或者选中“自定义尺寸”,然后输入一个自己定义的尺寸。
5、文本设置
保留文本和背景颜色:选择该选项可在以PDF格式保存文档时,保留字体颜色和背景。
6、PDF选项
•制作兼容 PDF/A 的文档
选择该选项创建可进行全文搜索的PDF文档,这些文档看上去与原始文档相同,可用于存档。
•创建轮廓
选中此选项之后,可以创建一个PDF文档章节标题目录。
•启用PDF标记
选中此选项之后,可以将PDF标记添加到输出PDF文档中。
除了文字和图示,PDF文件还可包含有关文档结构的信息,如逻辑部分、照片和表格。这些信息用PDF标记编码。有PDF标记的PDF文档可重新载入以适合各种屏幕尺寸,在手持设备上显示效果也很好。
重要!如果已识别的文档包含希伯来语或意第续语文本,不能创建带标记的PDF文件。
•嵌入字体
选中此选项之后,可以将字体嵌入到PDF文档中。
本文转载于:http://www.abbyychina.com/FRshiyongjiqiao/frmac-pdf-canshu.html
ABBYY导出结果为PDF注意事项的更多相关文章
- 扫描仪扫描文件处理-ABBYY对扫描版PDF文字加黑加粗、去除背景漂白
1. 设置ABBYY自动歪斜矫正: 2. 设置导出PDF参数: 3. PDF文字加黑加粗.去除背景漂白步骤:3.1 ABBYY - 打开扫描版PDF文档3.2 ABBYY - 编辑图像3.3 等级 - ...
- 导出excel和PDF小结 vba
最近接触了一个关于Access工具的项目,所以整理下需要使用的方法. 功能要求简介: 1.将数据表中的数据导出到excel和PDF 2.并根据某个字段名称分sheet输出. 3.无模板方式 方案简介: ...
- 【转】Java通过IText导出word和pdf
原帖地址:http://blog.csdn.net/zwx19921215/article/details/34439851 最近做的项目中需要用到把Highcharts图表导出word和pdf的功能 ...
- BarTender 2016如何导出模板为pdf文件?
最近有小伙伴来问,BarTender 2016能不能导出模板为pdf文件?这个是可以的,之前针对BarTender 10.1就介绍过一种方法了.本文,小编再针对BarTender 2016给大家讲下如 ...
- jquery插件导出excel和pdf(解决中文乱码问题)
参考文件:http://jackyrong.iteye.com/blog/2169683 https://my.oschina.net/aruan/blog/418980 https://segmen ...
- Magicodes.IE已支持导出Word、Pdf和Html
关于Magicodes.IE 导入导出通用库,通过导入导出DTO模型来控制导入和导出,支持Excel.Word.Pdf和Html. GitHub地址:https://github.com/xin-la ...
- C#&.Net干货分享- iTextSharp导出数据源到PDF
namespace Frame.ITextSharp{ /// <summary> /// iTextSharp导出数据源到PDF /// </summary> ...
- FusionCharts V3图表导出图片和PDF属性说明(转)
百闻不如一见,狠狠点击,快快下载:(演示文档有错误,不提供下载了.待新的演示文档出来.) 许多朋友说上面的DEMO用不了.fusioncharts官方的演示非常不错,就是来不及整理,各位大侠们可以研究 ...
- Highcharts 本地导出图片和PDF asp.net mvc版
啰嗦: 现在大家利用Highcharts开发时,有时候会遇到导出的功能问题,但是highcharts默认是链接自己的服务器上进行处理,但是有时候我们会连不上他的服务器,所以我们要让他在我们的服务器上进 ...
随机推荐
- mycat启动后,用Navicat Premium 连接报 "2013"
最近在学习mycat,启动后,用Navicat Premium 连接报 "2013" Lost Connection During Query ,经过一顿百度也没发现是怎么回事, ...
- HttpApplication 类,HttpApplicationState 类
HttpApplication 类 定义 ASP.NET 应用程序中的所有应用程序对象共有的方法.属性和事件.此类是用户在 Global.asax 文件中所定义的应用程序的基类. https://ms ...
- 如何将内存图像数据封装成QImage
http://blog.csdn.net/lyc_daniel/article/details/9055787 当采用Qt开发相机数据采集软件时,势必会遇到采集内存图像并进行处理(如缩放.旋转)操作. ...
- python基础之模块之os模块
os模块 os模块的作用: os,语义为操作系统,所以肯定就是操作系统相关的功能了,可以处理文件和目录这些我们日常手动需要做的操作,就比如说:显示当前目录下所有文件/删除某个文件/获取文件大小…… 另 ...
- HDU 5045
http://acm.hdu.edu.cn/showproblem.php?pid=5045 题意:n个学生m道题,一个n*m的矩阵代表第n个学生解第m题AC的概率,任意两学生做题数差距不能大于1,问 ...
- IDataReader转换成list通用方法
public static IList<T> ReaderToList<T>(this IDataReader dr) { //DateTime dt = DateTime.N ...
- esayui-datagrid的使用
第一步:在页面上引入easyui的jQuery链接 <script src="../../Scripts/easyUI/jquery-1.7.2.min.js" type=& ...
- [转]Golang之struct类型
http://blog.chinaunix.net/xmlrpc.php?r=blog/article&uid=22312037&id=3756923 一.struct ...
- 深入理解JVM内部结构(转)
图中显示的组件将会在下面两部分中进行逐一的解释.第一部分涉及JVM为每一个线程都会创建的组件:第二部分则是独立于线程进行创建的组件. 1. Thread Thread是一个程序中的一个 ...
- web app 变革之rem
rem这是个低调的css单位,近一两年开始崭露头角,有许多同学对rem的评价不一,有的在尝试使用,有的在使用过程中遇到坑就弃用了.但是我对rem综合评价是用来做web app它绝对是最合适的人选之一. ...