ABBYY导出结果为PDF注意事项
使用ABBYY FineReader Pro for Mac OCR文字识别软件识别文档时,可以将已识别的文本保存到文件中,还可以通过电子邮件发送已识别的文本,只要输出格式受FineReader支持。那么如果想要将识别结果导出为PDF格式,有哪些信息需要注意的呢?本文具体给大家讲讲PDF导出参数。
ABBYY FineReader识别文档之PDF导出参数:
1、导出模式
•仅文本和图片
此模式可以保存已识别的文本和图片,可对页面进行全文搜索,PDF文件的大小也将变小,生成文档的外观可能与原始文档略有不同。
•页面图像上的文本
该选项可保存原始文档的背景和图片,并将已识别的文本置于其上。通常,该PDF类型比“仅文本和图片”需要更多的磁盘空间。可对生成的PDF文档进行全文搜索。在某些情况下,生成文档的外观可能与原始文档略有不同。
•页面图像下的文本
该选项可以保存整个页面图像,并将已识别的文本置于其下。使用该选项创建可进行全文搜索的文档,且该文档看上去几乎与原始文档相同。
•仅页面图像
该选项可精确保存页面上的图像。用户几乎很难区分这类 PDF 文档和原始文档的差别,但不能对其进行搜索。
注意:PDF导出参数取决于选择的导出模式。因此,在某些模式下部分参数可能无法使用。
2、保留布局
•保留页码、页眉和页脚
选中此选项之后,将可以保存页眉、页脚文本和页码。如果禁用了此选项,则页眉、页脚和页码将不会被保存。
•保留图片
选中此选项之后,将可以保存已识别文本中的图片。图片质量和结果文件的大小取决于在“图像质量”面板中所做的选择。
•使用 MRC 压缩图像
选中此选项之后,将可以在高度压缩的文档中保留文本和图片的显示质量。因此,目标文件将是较小的高质量文本与图片。
3、图像质量
如果已识别文本包含众多图片,或者选择了保存页面图像的模式,那么结果文件可能会非常大。可以调整输出图片的质量,以减小输出文件的大小。
•低
如果希望PDF文档很小,请选中此选项。页面图像和图片的分辨率将减至150 dpi,这会影响它们的质量。
•平衡
如果既希望文件较小,同时又希望页面图像和图片的质量较高,请选中此选项。
•高
选中此选项之后,页面图像和图片将保持原始质量。
4、纸张尺寸
在将结果导出至PDF时,可以设置所用纸张的尺寸。从下拉列表中选择一个系统支持的纸张尺寸,或者选中“自定义尺寸”,然后输入一个自己定义的尺寸。
5、文本设置
保留文本和背景颜色:选择该选项可在以PDF格式保存文档时,保留字体颜色和背景。
6、PDF选项
•制作兼容 PDF/A 的文档
选择该选项创建可进行全文搜索的PDF文档,这些文档看上去与原始文档相同,可用于存档。
•创建轮廓
选中此选项之后,可以创建一个PDF文档章节标题目录。
•启用PDF标记
选中此选项之后,可以将PDF标记添加到输出PDF文档中。
除了文字和图示,PDF文件还可包含有关文档结构的信息,如逻辑部分、照片和表格。这些信息用PDF标记编码。有PDF标记的PDF文档可重新载入以适合各种屏幕尺寸,在手持设备上显示效果也很好。
重要!如果已识别的文档包含希伯来语或意第续语文本,不能创建带标记的PDF文件。
•嵌入字体
选中此选项之后,可以将字体嵌入到PDF文档中。
本文转载于:http://www.abbyychina.com/FRshiyongjiqiao/frmac-pdf-canshu.html
ABBYY导出结果为PDF注意事项的更多相关文章
- 扫描仪扫描文件处理-ABBYY对扫描版PDF文字加黑加粗、去除背景漂白
1. 设置ABBYY自动歪斜矫正: 2. 设置导出PDF参数: 3. PDF文字加黑加粗.去除背景漂白步骤:3.1 ABBYY - 打开扫描版PDF文档3.2 ABBYY - 编辑图像3.3 等级 - ...
- 导出excel和PDF小结 vba
最近接触了一个关于Access工具的项目,所以整理下需要使用的方法. 功能要求简介: 1.将数据表中的数据导出到excel和PDF 2.并根据某个字段名称分sheet输出. 3.无模板方式 方案简介: ...
- 【转】Java通过IText导出word和pdf
原帖地址:http://blog.csdn.net/zwx19921215/article/details/34439851 最近做的项目中需要用到把Highcharts图表导出word和pdf的功能 ...
- BarTender 2016如何导出模板为pdf文件?
最近有小伙伴来问,BarTender 2016能不能导出模板为pdf文件?这个是可以的,之前针对BarTender 10.1就介绍过一种方法了.本文,小编再针对BarTender 2016给大家讲下如 ...
- jquery插件导出excel和pdf(解决中文乱码问题)
参考文件:http://jackyrong.iteye.com/blog/2169683 https://my.oschina.net/aruan/blog/418980 https://segmen ...
- Magicodes.IE已支持导出Word、Pdf和Html
关于Magicodes.IE 导入导出通用库,通过导入导出DTO模型来控制导入和导出,支持Excel.Word.Pdf和Html. GitHub地址:https://github.com/xin-la ...
- C#&.Net干货分享- iTextSharp导出数据源到PDF
namespace Frame.ITextSharp{ /// <summary> /// iTextSharp导出数据源到PDF /// </summary> ...
- FusionCharts V3图表导出图片和PDF属性说明(转)
百闻不如一见,狠狠点击,快快下载:(演示文档有错误,不提供下载了.待新的演示文档出来.) 许多朋友说上面的DEMO用不了.fusioncharts官方的演示非常不错,就是来不及整理,各位大侠们可以研究 ...
- Highcharts 本地导出图片和PDF asp.net mvc版
啰嗦: 现在大家利用Highcharts开发时,有时候会遇到导出的功能问题,但是highcharts默认是链接自己的服务器上进行处理,但是有时候我们会连不上他的服务器,所以我们要让他在我们的服务器上进 ...
随机推荐
- hdu5853 (后缀自动机)
Problem Jong Hyok and String 题目大意 给你n个字符串,有q个询问. 定义set(s)={(i,j)} 表示 s在第i个字符串中出现,且末尾位置为j. 对于一个询问,求se ...
- WPF入门教程系列(二) 深入剖析WPF Binding的使用方法
WPF入门教程系列(二) 深入剖析WPF Binding的使用方法 同一个对象(特指System.Windows.DependencyObject的子类)的同一种属性(特指DependencyProp ...
- PAT (Basic Level) Practise:1040. 有几个PAT
[题目链接] 字符串APPAPT中包含了两个单词“PAT”,其中第一个PAT是第2位(P),第4位(A),第6位(T):第二个PAT是第3位(P),第4位(A),第6位(T). 现给定字符串,问一共可 ...
- 【转】7 Tips to Speed Up Eclipse
技巧一:运行最新版本的JDK和Eclipse 通常,新版本的JDK和Eclipse都会有性能上的优化.请确保你使用的是64位Eclipse并且使用了Oracle的JDK.对于网络开发,需要使用Ecli ...
- form表单验证
<script> $(document).ready(function(){ $('.pinglunform').submit(function(){ var issubmit = 0; ...
- Web上下文配置【MvcConfig】
基于Servlet3.0规范和SpringMVC4注解式配置方式,实现零xml配置,弄了个小demo,供交流讨论. 项目说明如下: 1.db.sql是项目中用到的表,数据库使用的是oracle11g ...
- C++ Primer : 第九章 : vector变长、string的其他操作以及容器适配器
vector变长机制.string的其他构造方法,添加.替换和搜索操作,string比较和数值转换,最后是容器适配器. vector对象是如何增长的 vector和string类型提供了一些成员函数, ...
- eoe资料
-------------------------------https://github.com/waylau/vpngate-mirrors FQ软件.方法 android优化: http: ...
- PocketSphinx语音识别和turtlebot的语音控制--18
摘要: 原创博客:转载请表明出处:http://www.cnblogs.com/zxouxuewei/ 1.首先安装 PocketSphinx 语音识别: $ sudo apt--pocketsphi ...
- html部分---认识html静态网页;
html分类:1.静态网页(html/htm) 2.动态网页 区别:动态网页不需要改动源代码,容易修改 css样式表:美化网页 js:脚本语言,增 ...