使用ABBYY FineReader Pro for Mac OCR文字识别软件识别文档时,可以将已识别的文本保存到文件中,还可以通过电子邮件发送已识别的文本,只要输出格式受FineReader支持。那么如果想要将识别结果导出为PDF格式,有哪些信息需要注意的呢?本文具体给大家讲讲PDF导出参数。

ABBYY FineReader识别文档之PDF导出参数:

1、导出模式

•仅文本和图片

此模式可以保存已识别的文本和图片,可对页面进行全文搜索,PDF文件的大小也将变小,生成文档的外观可能与原始文档略有不同。

•页面图像上的文本

该选项可保存原始文档的背景和图片,并将已识别的文本置于其上。通常,该PDF类型比“仅文本和图片”需要更多的磁盘空间。可对生成的PDF文档进行全文搜索。在某些情况下,生成文档的外观可能与原始文档略有不同。

•页面图像下的文本

该选项可以保存整个页面图像,并将已识别的文本置于其下。使用该选项创建可进行全文搜索的文档,且该文档看上去几乎与原始文档相同。

•仅页面图像

该选项可精确保存页面上的图像。用户几乎很难区分这类 PDF 文档和原始文档的差别,但不能对其进行搜索。

注意:PDF导出参数取决于选择的导出模式。因此,在某些模式下部分参数可能无法使用。

2、保留布局

•保留页码、页眉和页脚

选中此选项之后,将可以保存页眉、页脚文本和页码。如果禁用了此选项,则页眉、页脚和页码将不会被保存。

•保留图片

选中此选项之后,将可以保存已识别文本中的图片。图片质量和结果文件的大小取决于在“图像质量”面板中所做的选择。

•使用 MRC 压缩图像

选中此选项之后,将可以在高度压缩的文档中保留文本和图片的显示质量。因此,目标文件将是较小的高质量文本与图片。

3、图像质量

如果已识别文本包含众多图片,或者选择了保存页面图像的模式,那么结果文件可能会非常大。可以调整输出图片的质量,以减小输出文件的大小。

•低

如果希望PDF文档很小,请选中此选项。页面图像和图片的分辨率将减至150 dpi,这会影响它们的质量。

•平衡

如果既希望文件较小,同时又希望页面图像和图片的质量较高,请选中此选项。

•高

选中此选项之后,页面图像和图片将保持原始质量。

4、纸张尺寸

在将结果导出至PDF时,可以设置所用纸张的尺寸。从下拉列表中选择一个系统支持的纸张尺寸,或者选中“自定义尺寸”,然后输入一个自己定义的尺寸。

5、文本设置

保留文本和背景颜色:选择该选项可在以PDF格式保存文档时,保留字体颜色和背景。

6、PDF选项

•制作兼容 PDF/A 的文档

选择该选项创建可进行全文搜索的PDF文档,这些文档看上去与原始文档相同,可用于存档。

•创建轮廓

选中此选项之后,可以创建一个PDF文档章节标题目录。

•启用PDF标记

选中此选项之后,可以将PDF标记添加到输出PDF文档中。

除了文字和图示,PDF文件还可包含有关文档结构的信息,如逻辑部分、照片和表格。这些信息用PDF标记编码。有PDF标记的PDF文档可重新载入以适合各种屏幕尺寸,在手持设备上显示效果也很好。

重要!如果已识别的文档包含希伯来语或意第续语文本,不能创建带标记的PDF文件。

•嵌入字体

选中此选项之后,可以将字体嵌入到PDF文档中。

本文转载于:http://www.abbyychina.com/FRshiyongjiqiao/frmac-pdf-canshu.html

ABBYY导出结果为PDF注意事项的更多相关文章

  1. 扫描仪扫描文件处理-ABBYY对扫描版PDF文字加黑加粗、去除背景漂白

    1. 设置ABBYY自动歪斜矫正: 2. 设置导出PDF参数: 3. PDF文字加黑加粗.去除背景漂白步骤:3.1 ABBYY - 打开扫描版PDF文档3.2 ABBYY - 编辑图像3.3 等级 - ...

  2. 导出excel和PDF小结 vba

    最近接触了一个关于Access工具的项目,所以整理下需要使用的方法. 功能要求简介: 1.将数据表中的数据导出到excel和PDF 2.并根据某个字段名称分sheet输出. 3.无模板方式 方案简介: ...

  3. 【转】Java通过IText导出word和pdf

    原帖地址:http://blog.csdn.net/zwx19921215/article/details/34439851 最近做的项目中需要用到把Highcharts图表导出word和pdf的功能 ...

  4. BarTender 2016如何导出模板为pdf文件?

    最近有小伙伴来问,BarTender 2016能不能导出模板为pdf文件?这个是可以的,之前针对BarTender 10.1就介绍过一种方法了.本文,小编再针对BarTender 2016给大家讲下如 ...

  5. jquery插件导出excel和pdf(解决中文乱码问题)

    参考文件:http://jackyrong.iteye.com/blog/2169683 https://my.oschina.net/aruan/blog/418980 https://segmen ...

  6. Magicodes.IE已支持导出Word、Pdf和Html

    关于Magicodes.IE 导入导出通用库,通过导入导出DTO模型来控制导入和导出,支持Excel.Word.Pdf和Html. GitHub地址:https://github.com/xin-la ...

  7. C#&.Net干货分享- iTextSharp导出数据源到PDF

    namespace Frame.ITextSharp{    /// <summary>    /// iTextSharp导出数据源到PDF    /// </summary> ...

  8. FusionCharts V3图表导出图片和PDF属性说明(转)

    百闻不如一见,狠狠点击,快快下载:(演示文档有错误,不提供下载了.待新的演示文档出来.) 许多朋友说上面的DEMO用不了.fusioncharts官方的演示非常不错,就是来不及整理,各位大侠们可以研究 ...

  9. Highcharts 本地导出图片和PDF asp.net mvc版

    啰嗦: 现在大家利用Highcharts开发时,有时候会遇到导出的功能问题,但是highcharts默认是链接自己的服务器上进行处理,但是有时候我们会连不上他的服务器,所以我们要让他在我们的服务器上进 ...

随机推荐

  1. hdu5853 (后缀自动机)

    Problem Jong Hyok and String 题目大意 给你n个字符串,有q个询问. 定义set(s)={(i,j)} 表示 s在第i个字符串中出现,且末尾位置为j. 对于一个询问,求se ...

  2. WPF入门教程系列(二) 深入剖析WPF Binding的使用方法

    WPF入门教程系列(二) 深入剖析WPF Binding的使用方法 同一个对象(特指System.Windows.DependencyObject的子类)的同一种属性(特指DependencyProp ...

  3. PAT (Basic Level) Practise:1040. 有几个PAT

    [题目链接] 字符串APPAPT中包含了两个单词“PAT”,其中第一个PAT是第2位(P),第4位(A),第6位(T):第二个PAT是第3位(P),第4位(A),第6位(T). 现给定字符串,问一共可 ...

  4. 【转】7 Tips to Speed Up Eclipse

    技巧一:运行最新版本的JDK和Eclipse 通常,新版本的JDK和Eclipse都会有性能上的优化.请确保你使用的是64位Eclipse并且使用了Oracle的JDK.对于网络开发,需要使用Ecli ...

  5. form表单验证

    <script> $(document).ready(function(){ $('.pinglunform').submit(function(){ var issubmit = 0; ...

  6. Web上下文配置【MvcConfig】

    基于Servlet3.0规范和SpringMVC4注解式配置方式,实现零xml配置,弄了个小demo,供交流讨论. 项目说明如下: 1.db.sql是项目中用到的表,数据库使用的是oracle11g ...

  7. C++ Primer : 第九章 : vector变长、string的其他操作以及容器适配器

    vector变长机制.string的其他构造方法,添加.替换和搜索操作,string比较和数值转换,最后是容器适配器. vector对象是如何增长的 vector和string类型提供了一些成员函数, ...

  8. eoe资料

     -------------------------------https://github.com/waylau/vpngate-mirrors   FQ软件.方法 android优化: http: ...

  9. PocketSphinx语音识别和turtlebot的语音控制--18

    摘要: 原创博客:转载请表明出处:http://www.cnblogs.com/zxouxuewei/ 1.首先安装 PocketSphinx 语音识别: $ sudo apt--pocketsphi ...

  10. html部分---认识html静态网页;

    html分类:1.静态网页(html/htm)               2.动态网页              区别:动态网页不需要改动源代码,容易修改 css样式表:美化网页 js:脚本语言,增 ...