通过扫描仪或者数码相机获取的图像文件,容易出现文本扭曲、页面歪斜等缺陷,会影响到OCR的识别质量。此时,用户可使用ABBYY FineReader 15(Windows系统)OCR文字识别软件的自动和手动的图像编辑工具来调整,这项功能将在OCR编辑器中实现。

图1:OCR编辑器

第一、自动处理图像

当使用扫描仪或者数码相机等将图像导入ABBYY FineReader 15 OCR文字识别软件的OCR编辑器中时,软件会自动对图像进行识别、更改。默认情况下,图像的预处理会处理以下三个推荐选项(单击“工具”中的“选项”面板):

·拆分对开页,自动将包含对页的图像拆分为两个只包含一个页面的图像。

·纠正页面方向,自动检测和纠正图像的页面方向。

·使用建议值获得更准确的OCR。

图2:自动处理图像

第二、手动图像处理

如果用户希望对图像进行更为细致的调整,可在导入图像前禁用自动预处理功能,利用BBYY FineReader 15 的各种强大的图像处理功能,手动去除图像存在的各种缺陷,提高OCR的识别质量。

单击“工具”中的“选项”,不勾选“将页面添加至 OCR 编辑器时自动处理页面图像”,即可禁用自动预处理。

图3:禁用自动预处理

·如何进行手动编辑图像

在OCR编辑器中导入图像,然后选中需要处理的图像,单击工具栏的“编辑图像”即可对图像进行详细的调整处理。单击右边的工具,然后将其应用到图像中。

在手动编辑图像时,用户可使用顶部工具栏指定需要编辑的图像,或者在具体工具面板中指定应用的奇数页、偶数页、当前页等。

完成了图像编辑后,可点击图像处理面板顶部的“退出图像编辑器”退出图像处理状态,返回到OCR编辑器。

图4:手动编辑图像

·图像编辑器工具

·图像编辑器中的右边包含了各种图像编辑工具,其中包括:

·建议的预处理,其中包括消除噪声和模糊、反转颜色、校正歪斜等基本调整,适合新手用户或者简单调整图像使用。

·照片校正,包含矫直文本行、消除噪音和模糊等,也是一项基础的多项调整。

·歪斜校正,修正图像的歪斜。

·矫直文本行,矫直图像上任何弯曲的文本行。

·校正梯形失真,校正梯形失真和删除无数据的图像边缘。

·旋转与翻转,垂直或水平旋转和翻转图像,修正图像上的文本方向。

·分割,将图像拆分,适用于图书图像和其他需要拆分对页的图像。

·修剪,删除不包含任何有用信息的图像边缘。

·反转,反转图像颜色,当文本颜色浅而背景色深,该工具很适用。

·分辨率,更改图像分辨率。

·亮度与对比度,更改图像亮度和对比度。

·等级,改变阴影、光和中间色的强度。

·橡皮擦,清除图像的某个部分。

·删除颜色标记,清除用笔做出的任何彩色戳记和标记,以识别被这些标记遮住的文本。

图5:调整前

图6:调整后

当通过扫描仪或者数码相机获取的图像文件出现各种缺陷时,ABBYY FineReader 15 OCR文字识别软件可以帮助用户更好地处理图像的各种缺陷,实现更好的OCR识别质量。处理的方式简单易操作,调整的过程也是直观可见。

有了这么强大的文字识别软件,还用担心办公效率无法提高吗?现在就点击ABBYY FineReader下载去体验一下吧。

如何使用ABBYY FineReader处理文档图像的缺陷?的更多相关文章

  1. 拆分ABBYY FineReader 12文档的方法

    处理大量多页文档时,通常都会首先扫描所有文档,然后才进行分析和识别.但是,要正确保留每个纸质文档的原始格式,ABBYY FineReader 12必须将每个文档作为单独 FineReader 文档进行 ...

  2. 如何用ABBYY解决文档图像存在缺陷,OCR 准确性低的问题

    扭曲的文本行.歪斜.噪声及扫描图像和数码照片中常见的其他缺陷可能会降低识别质量.ABBYY FineReader,提供各种 自动和手动工具去除这些缺陷. 如何手动编辑图像 如果您禁用了自动预处理功能或 ...

  3. ABBYY FineReader 15 文档转换功能

    我们平常工作的时候总会固定地只用某几个文档格式,有的人经常使用office,所以电脑内就没安装PDF阅读器,这个时候就需要文档转换器了,ABBYY FineReader 15 也能够帮助我们实现快速的 ...

  4. 使用ABBYY FineReader将文档保存为电子书形式

    运用ABBYY FineReader 15的OCR识别技术,不仅能将PDF文档.图像.扫描页面等保存为可编辑的格式,方便用户的进一步编辑使用:而且还能直接转换为电子书的格式,方便用户使用更为便携的电子 ...

  5. 从单一图像中提取文档图像:ICCV2019论文解读

    从单一图像中提取文档图像:ICCV2019论文解读 DewarpNet: Single-Image Document Unwarping With Stacked 3D and 2D Regressi ...

  6. 怎么用ABBYY打开PDF文档

    我们日常工作中接触的文档大多都是PDF格式的,这种格式的文件需要借助工具才能打开,大家最熟悉的无非就是Adobe了,但你知道吗?除了Adobe,OCR文字识别软件也可以打开PDF文档,比如ABBYY ...

  7. 怎么用ABBYY重组PDF文档

    ABBYY PDF Transformer+是一款可创建.编辑以及将PDF文件转换为其他可编辑格式的通用工具,除此之外,还可以使用ABBYY PDF Transformer+重新组织PDF文档,如在文 ...

  8. 怎么给ABBYY FineReader Mac导入图像

    ABBYY FineReader Pro for Mac作为ABBYY旗下重要的OCR文字识别软件之一,专为Mac用户定制,为各种各样的任务提供了单一.全面的解决方案,它是所有需要扫描和处理数字纸质文 ...

  9. 如何用OCR图文识别软件在文档里复制内容

    ABBYY FineReader 12是一款OCR图文识别软件,可从文档中复制文本.图片和表格,粘贴到其他应用程序中.无需识别整个文档(关于ABBYY FineReader识别文档的文章,请参考解析A ...

随机推荐

  1. Windows下mysql5.6升级到5.7的方法

    Mysql的升级方式分为两种:原地升级和逻辑升级.这两种升级方式,本质没有什么区别的. 只是在对数据文件的处理上有些区别而已.原地升级是直接将数据文件进行拷贝,而逻辑升级对数据文件的处理方式是通过逻辑 ...

  2. java 第五课 异常

    1.为什么使用异常? 若没有异常处理机制,会使用流程控制语句if  switch等来处理异常情况,程序复杂 2.捕捉异常try catch finally 3.方法中抛出异常throw(throw 可 ...

  3. 彻底理解RSA加密算法

    RSA是非常典型的非对称加密算法 它的算法是这样的 加密是我们把明文M转化成密文C 需要用到加密运算 而解密时我们要用解密运算将密文C转化成M 从表达式中 可以看出 e和d使我们需要确定的参数 而N是 ...

  4. Phoenix的一些问题

    date: 2020-09-10 13:50:00 updated: 2020-09-14 16:30:00 1. Phoenix索引 全局索引:适合读多写少的场景.写数据时因为索引表分布在不同数据节 ...

  5. 利用transformer进行中文文本分类(数据集是复旦中文语料)

    利用TfidfVectorizer进行中文文本分类(数据集是复旦中文语料) 利用RNN进行中文文本分类(数据集是复旦中文语料) 利用CNN进行中文文本分类(数据集是复旦中文语料) 和之前介绍的不同,重 ...

  6. mshadow入门指南

    mshadow是一个基于表达式模板实现的张量库,在MXNet框架中被广泛使用.这篇文章简单介绍了mshadow的基本用法和特性,文章主要翻译自mshadow/guide/README. 张量数据结构 ...

  7. centos8 curl: (35) error:141A318A:SSL routines:tls_process_ske_dhe:dh key too small

    centos8操作系统,curl -k https:/www.xxx.com 报错  curl: (35) error:141A318A:SSL routines:tls_process_ske_dh ...

  8. 【CF1443E】Long Permutation 题解(排列生成模板)

    原题链接 题意简介 给定一个长度为 n 的排列 {1,2,3,...,n} .现有两种操作: 对某个区间 [l,r] 求和 将排列往后推 x 次 (按字典序) 其中 \(n,q \leq 2\time ...

  9. 什么是 RedLock

    Redis 官方站这篇文章提出了一种权威的基于 Redis 实现分布式锁的方式名叫 Redlock,此种方式比原先的单节点的方法更安全.它可以保证以下特性: 安全特性:互斥访问,即永远只有一个 cli ...

  10. 测试流程规范--测试准入、准出、停止标准、bug优先级定义

    一.背景 最近在推进组内流程规范专项建设,从"研发测试流程"."提测规范"."测试准入标准"."bug优先级标准".&q ...