如何使用ABBYY FineReader处理文档图像的缺陷？

通过扫描仪或者数码相机获取的图像文件，容易出现文本扭曲、页面歪斜等缺陷，会影响到OCR的识别质量。此时，用户可使用ABBYY FineReader 15（Windows系统）OCR文字识别软件的自动和手动的图像编辑工具来调整，这项功能将在OCR编辑器中实现。

图1：OCR编辑器

第一、自动处理图像

当使用扫描仪或者数码相机等将图像导入ABBYY FineReader 15 OCR文字识别软件的OCR编辑器中时，软件会自动对图像进行识别、更改。默认情况下，图像的预处理会处理以下三个推荐选项（单击“工具”中的“选项”面板）：

·拆分对开页，自动将包含对页的图像拆分为两个只包含一个页面的图像。

·纠正页面方向，自动检测和纠正图像的页面方向。

·使用建议值获得更准确的OCR。

图2：自动处理图像

第二、手动图像处理

如果用户希望对图像进行更为细致的调整，可在导入图像前禁用自动预处理功能，利用BBYY FineReader 15 的各种强大的图像处理功能，手动去除图像存在的各种缺陷，提高OCR的识别质量。

单击“工具”中的“选项”，不勾选“将页面添加至 OCR 编辑器时自动处理页面图像”，即可禁用自动预处理。

图3：禁用自动预处理

·如何进行手动编辑图像

在OCR编辑器中导入图像，然后选中需要处理的图像，单击工具栏的“编辑图像”即可对图像进行详细的调整处理。单击右边的工具，然后将其应用到图像中。

在手动编辑图像时，用户可使用顶部工具栏指定需要编辑的图像，或者在具体工具面板中指定应用的奇数页、偶数页、当前页等。

完成了图像编辑后，可点击图像处理面板顶部的“退出图像编辑器”退出图像处理状态，返回到OCR编辑器。

图4：手动编辑图像

·图像编辑器工具

·图像编辑器中的右边包含了各种图像编辑工具，其中包括：

·建议的预处理，其中包括消除噪声和模糊、反转颜色、校正歪斜等基本调整，适合新手用户或者简单调整图像使用。

·照片校正，包含矫直文本行、消除噪音和模糊等，也是一项基础的多项调整。

·歪斜校正，修正图像的歪斜。

·矫直文本行，矫直图像上任何弯曲的文本行。

·校正梯形失真，校正梯形失真和删除无数据的图像边缘。

·旋转与翻转，垂直或水平旋转和翻转图像，修正图像上的文本方向。

·分割，将图像拆分，适用于图书图像和其他需要拆分对页的图像。

·修剪，删除不包含任何有用信息的图像边缘。

·反转，反转图像颜色，当文本颜色浅而背景色深，该工具很适用。

·分辨率，更改图像分辨率。

·亮度与对比度，更改图像亮度和对比度。

·等级，改变阴影、光和中间色的强度。

·橡皮擦，清除图像的某个部分。

·删除颜色标记，清除用笔做出的任何彩色戳记和标记，以识别被这些标记遮住的文本。

图5：调整前

图6：调整后

当通过扫描仪或者数码相机获取的图像文件出现各种缺陷时，ABBYY FineReader 15 OCR文字识别软件可以帮助用户更好地处理图像的各种缺陷，实现更好的OCR识别质量。处理的方式简单易操作，调整的过程也是直观可见。

有了这么强大的文字识别软件，还用担心办公效率无法提高吗？现在就点击ABBYY FineReader下载去体验一下吧。

如何使用ABBYY FineReader处理文档图像的缺陷？的更多相关文章

拆分ABBYY FineReader 12文档的方法
处理大量多页文档时,通常都会首先扫描所有文档,然后才进行分析和识别.但是,要正确保留每个纸质文档的原始格式,ABBYY FineReader 12必须将每个文档作为单独 FineReader 文档进行 ...
如何用ABBYY解决文档图像存在缺陷，OCR 准确性低的问题
扭曲的文本行.歪斜.噪声及扫描图像和数码照片中常见的其他缺陷可能会降低识别质量.ABBYY FineReader,提供各种自动和手动工具去除这些缺陷. 如何手动编辑图像如果您禁用了自动预处理功能或 ...
ABBYY FineReader 15 文档转换功能
我们平常工作的时候总会固定地只用某几个文档格式,有的人经常使用office,所以电脑内就没安装PDF阅读器,这个时候就需要文档转换器了,ABBYY FineReader 15 也能够帮助我们实现快速的 ...
使用ABBYY FineReader将文档保存为电子书形式
运用ABBYY FineReader 15的OCR识别技术,不仅能将PDF文档.图像.扫描页面等保存为可编辑的格式,方便用户的进一步编辑使用:而且还能直接转换为电子书的格式,方便用户使用更为便携的电子 ...
从单一图像中提取文档图像：ICCV2019论文解读
从单一图像中提取文档图像:ICCV2019论文解读 DewarpNet: Single-Image Document Unwarping With Stacked 3D and 2D Regressi ...
怎么用ABBYY打开PDF文档
我们日常工作中接触的文档大多都是PDF格式的,这种格式的文件需要借助工具才能打开,大家最熟悉的无非就是Adobe了,但你知道吗?除了Adobe,OCR文字识别软件也可以打开PDF文档,比如ABBYY ...
怎么用ABBYY重组PDF文档
ABBYY PDF Transformer+是一款可创建.编辑以及将PDF文件转换为其他可编辑格式的通用工具,除此之外,还可以使用ABBYY PDF Transformer+重新组织PDF文档,如在文 ...
怎么给ABBYY FineReader Mac导入图像
ABBYY FineReader Pro for Mac作为ABBYY旗下重要的OCR文字识别软件之一,专为Mac用户定制,为各种各样的任务提供了单一.全面的解决方案,它是所有需要扫描和处理数字纸质文 ...
如何用OCR图文识别软件在文档里复制内容
ABBYY FineReader 12是一款OCR图文识别软件,可从文档中复制文本.图片和表格,粘贴到其他应用程序中.无需识别整个文档(关于ABBYY FineReader识别文档的文章,请参考解析A ...

随机推荐

git学习(十一) idea git pull 解决冲突
测试如下: 先将远程的代码修改,之后更新: 之后将工作区修改的代码(这里修改的代码跟远程修改的位置一样)提交到本地,之后拉取远程的代码,会发现有冲突: Accept Yours 就是直接选取本地的代码 ...
java 第五课异常
1.为什么使用异常? 若没有异常处理机制,会使用流程控制语句if switch等来处理异常情况,程序复杂 2.捕捉异常try catch finally 3.方法中抛出异常throw(throw 可 ...
Lombda表达式（四）
/* * 自定义函数式接口: * 1.声明一个接口,只能包含一个抽象方法 * 2.给这个接口加@FunctionalInterface */ public class Test { public st ...
gulp + angularjs
示例项目介绍文中使用的例子是一个基于 Angular.js 实现的网页版 Todo App,在 Github 中下载angular-quickstart.项目代码结构如下清单 5. 项目目录结构 ...
Kubernetes 配置私有镜像仓库时，没有权限访问的问题
使用 K8S 部署服务时,如果指定的镜像地址是内部镜像仓库,那么在下载镜像的时候可能会报权限错误.这是由于在 K8S 中部署服务时,K8S 需要到 Harbor 中进行一次验证,这个验证与节点中使用 ...
Bootstrap Blazor 初体验
自微软去年发布blazor以来,我也一直关注着blazor的动态,从net core 3.1 到 net 5,从 server side 到 wasm client , 点点滴滴印证了 blazor ...
如何k个一组反转链表
之前的文章「递归反转链表的一部分」讲了如何递归地反转一部分链表,有读者就问如何迭代地反转链表,这篇文章解决的问题也需要反转链表的函数,我们不妨就用迭代方式来解决. 本文要解决「K 个一组反转链表」,不 ...
CSS取消鼠标点击事件
pointer-events: none; 大致意思是让鼠标失去事件, 就比如我的'血小板'看板上的那个提示, 可以按F12来查看.
（五）F5和CTRL+F5两种刷新的区别
一.刷新原理不同: F5触发的HTTP请求的请求头中通常包含了If-Modified-Since 或 If-None-Match字段,或者两者兼有. CTRL+F5触发的HTTP请求的请求头中没有上面 ...
面向初学者的Python爬虫程序教程之动态网页抓取
目的是对所有注释进行爬网. 下面列出了已爬网链接.如果您使用AJAX加载动态网页,则有两种方式对其进行爬网. 分别介绍了两种方法:(如果对代码有任何疑问,请提出改进建议)解析真实地址爬网示例是参考链接 ...

如何使用ABBYY FineReader处理文档图像的缺陷？

如何使用ABBYY FineReader处理文档图像的缺陷？的更多相关文章

随机推荐

热门专题