ABBYY导出结果为PDF注意事项
使用ABBYY FineReader Pro for Mac OCR文字识别软件识别文档时,可以将已识别的文本保存到文件中,还可以通过电子邮件发送已识别的文本,只要输出格式受FineReader支持。那么如果想要将识别结果导出为PDF格式,有哪些信息需要注意的呢?本文具体给大家讲讲PDF导出参数。
ABBYY FineReader识别文档之PDF导出参数:

1、导出模式
•仅文本和图片
此模式可以保存已识别的文本和图片,可对页面进行全文搜索,PDF文件的大小也将变小,生成文档的外观可能与原始文档略有不同。
•页面图像上的文本
该选项可保存原始文档的背景和图片,并将已识别的文本置于其上。通常,该PDF类型比“仅文本和图片”需要更多的磁盘空间。可对生成的PDF文档进行全文搜索。在某些情况下,生成文档的外观可能与原始文档略有不同。
•页面图像下的文本
该选项可以保存整个页面图像,并将已识别的文本置于其下。使用该选项创建可进行全文搜索的文档,且该文档看上去几乎与原始文档相同。
•仅页面图像
该选项可精确保存页面上的图像。用户几乎很难区分这类 PDF 文档和原始文档的差别,但不能对其进行搜索。
注意:PDF导出参数取决于选择的导出模式。因此,在某些模式下部分参数可能无法使用。
2、保留布局
•保留页码、页眉和页脚
选中此选项之后,将可以保存页眉、页脚文本和页码。如果禁用了此选项,则页眉、页脚和页码将不会被保存。
•保留图片
选中此选项之后,将可以保存已识别文本中的图片。图片质量和结果文件的大小取决于在“图像质量”面板中所做的选择。
•使用 MRC 压缩图像
选中此选项之后,将可以在高度压缩的文档中保留文本和图片的显示质量。因此,目标文件将是较小的高质量文本与图片。
3、图像质量
如果已识别文本包含众多图片,或者选择了保存页面图像的模式,那么结果文件可能会非常大。可以调整输出图片的质量,以减小输出文件的大小。
•低
如果希望PDF文档很小,请选中此选项。页面图像和图片的分辨率将减至150 dpi,这会影响它们的质量。
•平衡
如果既希望文件较小,同时又希望页面图像和图片的质量较高,请选中此选项。
•高
选中此选项之后,页面图像和图片将保持原始质量。
4、纸张尺寸
在将结果导出至PDF时,可以设置所用纸张的尺寸。从下拉列表中选择一个系统支持的纸张尺寸,或者选中“自定义尺寸”,然后输入一个自己定义的尺寸。
5、文本设置
保留文本和背景颜色:选择该选项可在以PDF格式保存文档时,保留字体颜色和背景。
6、PDF选项
•制作兼容 PDF/A 的文档
选择该选项创建可进行全文搜索的PDF文档,这些文档看上去与原始文档相同,可用于存档。
•创建轮廓
选中此选项之后,可以创建一个PDF文档章节标题目录。
•启用PDF标记
选中此选项之后,可以将PDF标记添加到输出PDF文档中。
除了文字和图示,PDF文件还可包含有关文档结构的信息,如逻辑部分、照片和表格。这些信息用PDF标记编码。有PDF标记的PDF文档可重新载入以适合各种屏幕尺寸,在手持设备上显示效果也很好。
重要!如果已识别的文档包含希伯来语或意第续语文本,不能创建带标记的PDF文件。
•嵌入字体
选中此选项之后,可以将字体嵌入到PDF文档中。
本文转载于:http://www.abbyychina.com/FRshiyongjiqiao/frmac-pdf-canshu.html
ABBYY导出结果为PDF注意事项的更多相关文章
- 扫描仪扫描文件处理-ABBYY对扫描版PDF文字加黑加粗、去除背景漂白
1. 设置ABBYY自动歪斜矫正: 2. 设置导出PDF参数: 3. PDF文字加黑加粗.去除背景漂白步骤:3.1 ABBYY - 打开扫描版PDF文档3.2 ABBYY - 编辑图像3.3 等级 - ...
- 导出excel和PDF小结 vba
最近接触了一个关于Access工具的项目,所以整理下需要使用的方法. 功能要求简介: 1.将数据表中的数据导出到excel和PDF 2.并根据某个字段名称分sheet输出. 3.无模板方式 方案简介: ...
- 【转】Java通过IText导出word和pdf
原帖地址:http://blog.csdn.net/zwx19921215/article/details/34439851 最近做的项目中需要用到把Highcharts图表导出word和pdf的功能 ...
- BarTender 2016如何导出模板为pdf文件?
最近有小伙伴来问,BarTender 2016能不能导出模板为pdf文件?这个是可以的,之前针对BarTender 10.1就介绍过一种方法了.本文,小编再针对BarTender 2016给大家讲下如 ...
- jquery插件导出excel和pdf(解决中文乱码问题)
参考文件:http://jackyrong.iteye.com/blog/2169683 https://my.oschina.net/aruan/blog/418980 https://segmen ...
- Magicodes.IE已支持导出Word、Pdf和Html
关于Magicodes.IE 导入导出通用库,通过导入导出DTO模型来控制导入和导出,支持Excel.Word.Pdf和Html. GitHub地址:https://github.com/xin-la ...
- C#&.Net干货分享- iTextSharp导出数据源到PDF
namespace Frame.ITextSharp{ /// <summary> /// iTextSharp导出数据源到PDF /// </summary> ...
- FusionCharts V3图表导出图片和PDF属性说明(转)
百闻不如一见,狠狠点击,快快下载:(演示文档有错误,不提供下载了.待新的演示文档出来.) 许多朋友说上面的DEMO用不了.fusioncharts官方的演示非常不错,就是来不及整理,各位大侠们可以研究 ...
- Highcharts 本地导出图片和PDF asp.net mvc版
啰嗦: 现在大家利用Highcharts开发时,有时候会遇到导出的功能问题,但是highcharts默认是链接自己的服务器上进行处理,但是有时候我们会连不上他的服务器,所以我们要让他在我们的服务器上进 ...
随机推荐
- html5 placeholder
placeholder是html5<input>标签的一个属性,placeholder 属性提供可描述输入字段预期值的提示信息(hint).该提示会在输入字段为空时显示,并会在字段获得焦点 ...
- 团队开发——冲刺1.a
冲刺阶段一(第一天) 1.今天准备做什么? 在了解C#的基础上,深入熟悉Windows窗体应用程序,熟练掌握基本功能. 2.明天做什么:简单设计界面.
- 黑马程序员——【Java基础】——面向对象(一)概述、类与对象、继承、抽象类、接口、多态、内部类
---------- android培训.java培训.期待与您交流! ---------- 一.面向对象概述 1.面向对象:是一个很抽象的概念,它相对面向过程而言,是一种程序设计的思想. 2.面向对 ...
- 链表(C++语言实现)
我使用的是严蔚敏的数据结构C语言版,很反感里面的全是伪代码,平常也没怎么敲代码,链表和顺序表是数据结构的第一个实验课程,顺序表还好,但是链表就有点困难了,因为里面涉及指针的运用.我对于指针并不是很精通 ...
- webservice发布在外网上的在system.web中加入这个就好使了
<webServices> <protocols> <add name="HttpSoap"/> ...
- Java 集合深入理解(15):AbstractMap
点击查看 Java 集合框架深入理解 系列, - ( ゜- ゜)つロ 乾杯~ 今天来了解下 AbstractMap. 什么是 AbstractMap AbstractMap 是 Map 接口的的实现类 ...
- HDU 3351
http://acm.hdu.edu.cn/showproblem.php?pid=3351 乍一看很像经典的括号匹配问题,其实不然,因为操作并非增加括号,而是翻转括号 只需记录多余的左括号的数量即可 ...
- Bat脚本处理ftp超强案例解说
Bat脚本处理ftp超强案例解说 原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 .作者信息和本声明.否则将追究法律责任.http://369369.blog.51cto.com/31 ...
- Exploratory Software Testing
最近找到去年上半年看过一本关于测试方面书籍的总结笔记,一直放在我的个人U盘里,当时是用Xmind记录的,现在重新整理下分享给大家了! James A.Whittaker [美] 詹姆斯·惠特克(软件测 ...
- Python 新手常犯错误(第二部分)
转发自:http://blog.jobbole.com/43826/ 在之前几个月里,我教一些不了解Python的孩子来慢慢熟悉这门语言.渐渐地,我发现了一些几乎所有Python初学者都会犯的错误,所 ...