扭曲的文本行、歪斜、噪声及扫描图像和数码照片中常见的其他缺陷可能会降低识别质量。ABBYY FineReader,提供各种 自动和手动工具去除这些缺陷。

如何手动编辑图像

如果您禁用了自动预处理功能或者想预处理特定页面,您可以使用图像编辑器,手动编辑页面图像。

按照下列说明手动编辑图像:

1. 打开 OCR 编辑器,然后打开图像编辑器:

2. 单击“编辑图像”图像面板工具栏,或者单击“编辑>编辑页面图像...”。

4. 窗口“图像编辑器”将打开,显示当前选择的页面。 图像编辑器最右边的面板上有编辑图像用的工具。

5. 单击您想使用的工具,然后将其应用于图像。 产生的变更将显示在“图像”面板上。 大多数工具既可以应用到特定页面,也可以应用到文档的所有页面。 您可以使用工具栏上的下拉列表“选定内容”指定您想编辑的页面,在该下拉列表中您可以选择所有奇数/偶数页、当前页面,或者所选页面(如果在面板上“页面”选择了多页)。

6. 完成图像编辑后,单击“退出图像编辑器”图像编辑器最上方的按钮。

图像编辑器包含下列工具:

• 建议的预处理

根据您图像的类型,程序将自动确定和进行必要的校正。 可以进行的校正包括消除噪声和模糊、反转颜色以使背景色比文本颜色浅、校正歪斜、矫直文本行、校正梯形失真和修剪图像边缘。

• 歪斜校正

校正图像歪斜。

• 矫直文本行

矫直图像上任何弯曲的文本行。

• 照片校正

此组中的工具可以让您矫直文本行、消除噪音和模糊,以及将文档背景色变成白色。

• 校正梯形失真

校正梯形失真和删除不包含任何有用数据的图像边缘。

选中此工具时,图像上将出现一个蓝色小框。拖动框角到图像相应角上,使小框的水平线与文本行平行。 单击“修正”按钮应用此变更。

• 旋转与翻转

此组中的工具可以让您垂直或水平旋转和翻转图像,使图像上的文本面向正确的方向。

• 分割

此组中的工具可以让您将图像拆分成几个部分。 当您扫描图书和需要拆分对页时,此工具非常有用。

• 修剪

删除不包含任何有用信息的图像边缘。

• 反转

反转图像颜色。 如果您处理的文本呈非标准颜色(文本颜色浅而背景色深),该工具非常有用。

• 分辨率

更改图像分辨率。

• 亮度与对比度

更改图像的亮度和对比度。

• 等级

此工具可以让您改变阴影、光和中间色的强度从而调整图像的色阶。

若要增加图像的对比度,可移动输入级别直方图上的左右滑块。 颜色范围从最浅到最深分为255个等级。 左滑块会将图像颜色设置成最黑,右滑块会将图像颜色设置成最白。 将中间的滑块向右移动会使图像颜色加深,向左移动会使之变浅。

调整输出级别滑块会降低图像的对比度。

• 橡皮擦

清除图像的某个部分。

• 删除颜色标记

清除用笔做出的任何彩色戳记和标记,以识别被这些标记遮住的文本。 该工具主要针对背景色为白色的扫描文档,不适合于数码照片和背景色为彩色的文档。

想要了解关于ABBYY FineReader 14的更多内容可点击进入ABBYY中文网站,查您所需。

 

如何用ABBYY解决文档图像存在缺陷,OCR 准确性低的问题的更多相关文章

  1. 如何使用ABBYY FineReader处理文档图像的缺陷?

    通过扫描仪或者数码相机获取的图像文件,容易出现文本扭曲.页面歪斜等缺陷,会影响到OCR的识别质量.此时,用户可使用ABBYY FineReader 15(Windows系统)OCR文字识别软件的自动和 ...

  2. 从单一图像中提取文档图像:ICCV2019论文解读

    从单一图像中提取文档图像:ICCV2019论文解读 DewarpNet: Single-Image Document Unwarping With Stacked 3D and 2D Regressi ...

  3. ABBYY FineReader文档对比实例讲解

    ABBYY FineReader企业版与标准版有一个重大的区别,就是企业版有对比文档的功能,今天通过下面的文档对比实例,来向大家展示一下OCR文字识别工具ABBYY FineReader的使用技巧. ...

  4. 微众api文档,身份证识别,ocr等人脸识别等

    https://cloud.tencent.com/document/product/655/14369 https://cloud.tencent.com/document/product/655/ ...

  5. 图像添加到ABBYY 文档有什么方法

    ABBYY FineReader 12作为一款功能全面的OCR图文识别软件,我们自是可以在其中将图像添加到FineReader文档中去,且添加在文档尾部,否则将会创建一个新的FineReader文档. ...

  6. ABBYY 识别结果的文档怎么导出

    使用ABBYY FineReader Pro for Mac OCR文字识别软件识别文档时,识别结果可以保存至一个文件.复制到剪贴板或通过电子邮件发送.可以执行下列操作:导出整个文档.仅导出所选页面. ...

  7. ABBYY FineReader 15 文档转换功能

    我们平常工作的时候总会固定地只用某几个文档格式,有的人经常使用office,所以电脑内就没安装PDF阅读器,这个时候就需要文档转换器了,ABBYY FineReader 15 也能够帮助我们实现快速的 ...

  8. 拆分ABBYY FineReader 12文档的方法

    处理大量多页文档时,通常都会首先扫描所有文档,然后才进行分析和识别.但是,要正确保留每个纸质文档的原始格式,ABBYY FineReader 12必须将每个文档作为单独 FineReader 文档进行 ...

  9. ABBYY FineReader 15如何比较文档?

    ABBYY FineReader 15 OCR文字识别软件能帮助用户快速地对比两个文档间的差异,适合用于审阅.修改文档,发现新旧版本差异,预防输出错误版本等情况.此功能既能用于对比同一格式文档的不同版 ...

随机推荐

  1. kettle学习笔记(三)— 定时任务的脚本执行

    kettle-定时任务 Kettle 的定时任务可以用kettle中的job工作来定时转换(缺点窗口不可关闭),同时也可以使用bat脚本来启动kettle的 '.ktr'转换. 注:这里对定时任务的时 ...

  2. 感知机vs支持向量机

    感知机原理:二维空间中找到一条直线可以把所有二元类别分离开,三维或多维空间中,找到一个分离超平面把所有二元类别分离开.而可把所有二元类别分离开的超平面不止一个,哪个是最好的呢?损失函数:所有误分类的点 ...

  3. 创建本地yum源

    1. 环境准备 在准备搭建yum源的服务器上安装createrepo,打开防火墙的80端口或者关闭防火墙. 注:createrepo命令只要不是最小化安装,都是支持的.如果是最小化安装,下载下图下载r ...

  4. POI CellStyle 中样式覆盖问题

    问题描述 在使用 Apache POI-3.8的时候,需要一个功能,就是处理上传得 Excel的 cell style.如果数据有错误,则标红或者加上其他 style 标识.但是当直接获取到 cell ...

  5. Docker学习—DockerFile

    前言: 上一篇文章简单使用了docker 拉取镜像.启动容器.编译镜像:其中编译镜像时,使用到了Dockerfile,那么接下来我们就详细的来说说Dockerfile DockerFile是什么: D ...

  6. MySQL索引分析及使用

    一.索引介绍 1.1.什么是索引? 一般的应用系统,读写比例在10:1左右,而且插入操作和一般的更新操作很少出现性能问题,在生产环境中,我们遇到最多的,也是最容易出问题的,还是一些复杂的查询操作,因此 ...

  7. 给萌新HTML5 入门指南(二)

    本文由葡萄城技术团队原创并首发 转载请注明出处:葡萄城官网,葡萄城为开发者提供专业的开发工具.解决方案和服务,赋能开发者. 上一篇我们已经为大家介绍了HTML5新增的内容和基础页面布局,这篇会继续向大 ...

  8. GDB调试基础使用方法

    尽管目前使用的VS code可以使用插件一键构建和运行程序,但GDB作为调试利器,还是值得花时间去学习的. 概述 GDB(GNU Debugger) 是一个由GNU开源组织发布的.UNIX/LINUX ...

  9. ros启动节点Error: package 'chapter2_tutorials' not found问题

    在学习ROS时,实现节点之间的通信时,参考ROS机器人高效编程,每次启动节点的时候 $ rosrun chapter2_tutorials example1_a 都会提示 Error: package ...

  10. Hangfire只允许同时运行同一个任务

    Hangfire有个机制可以确保所有任务都会被执行,如果当服务器停机了一段时间重新启动时,在此期间的周期任务会几乎同时执行.而大部分时候,我们希望同个周期任务每段时间只运行一个就行了. 或者是如果周期 ...