如何用ABBYY解决文档图像存在缺陷,OCR 准确性低的问题
扭曲的文本行、歪斜、噪声及扫描图像和数码照片中常见的其他缺陷可能会降低识别质量。ABBYY FineReader,提供各种 自动和手动工具去除这些缺陷。
如何手动编辑图像
如果您禁用了自动预处理功能或者想预处理特定页面,您可以使用图像编辑器,手动编辑页面图像。
按照下列说明手动编辑图像:
1. 打开 OCR 编辑器,然后打开图像编辑器:
2. 单击“编辑图像”图像面板工具栏,或者单击“编辑>编辑页面图像...”。

4. 窗口“图像编辑器”将打开,显示当前选择的页面。 图像编辑器最右边的面板上有编辑图像用的工具。
5. 单击您想使用的工具,然后将其应用于图像。 产生的变更将显示在“图像”面板上。 大多数工具既可以应用到特定页面,也可以应用到文档的所有页面。 您可以使用工具栏上的下拉列表“选定内容”指定您想编辑的页面,在该下拉列表中您可以选择所有奇数/偶数页、当前页面,或者所选页面(如果在面板上“页面”选择了多页)。
6. 完成图像编辑后,单击“退出图像编辑器”图像编辑器最上方的按钮。
图像编辑器包含下列工具:
• 建议的预处理
根据您图像的类型,程序将自动确定和进行必要的校正。 可以进行的校正包括消除噪声和模糊、反转颜色以使背景色比文本颜色浅、校正歪斜、矫直文本行、校正梯形失真和修剪图像边缘。
• 歪斜校正
校正图像歪斜。
• 矫直文本行
矫直图像上任何弯曲的文本行。
• 照片校正
此组中的工具可以让您矫直文本行、消除噪音和模糊,以及将文档背景色变成白色。
• 校正梯形失真
校正梯形失真和删除不包含任何有用数据的图像边缘。
选中此工具时,图像上将出现一个蓝色小框。拖动框角到图像相应角上,使小框的水平线与文本行平行。 单击“修正”按钮应用此变更。
• 旋转与翻转
此组中的工具可以让您垂直或水平旋转和翻转图像,使图像上的文本面向正确的方向。
• 分割
此组中的工具可以让您将图像拆分成几个部分。 当您扫描图书和需要拆分对页时,此工具非常有用。
• 修剪
删除不包含任何有用信息的图像边缘。
• 反转
反转图像颜色。 如果您处理的文本呈非标准颜色(文本颜色浅而背景色深),该工具非常有用。
• 分辨率
更改图像分辨率。
• 亮度与对比度
更改图像的亮度和对比度。
• 等级
此工具可以让您改变阴影、光和中间色的强度从而调整图像的色阶。
若要增加图像的对比度,可移动输入级别直方图上的左右滑块。 颜色范围从最浅到最深分为255个等级。 左滑块会将图像颜色设置成最黑,右滑块会将图像颜色设置成最白。 将中间的滑块向右移动会使图像颜色加深,向左移动会使之变浅。
调整输出级别滑块会降低图像的对比度。
• 橡皮擦
清除图像的某个部分。
• 删除颜色标记
清除用笔做出的任何彩色戳记和标记,以识别被这些标记遮住的文本。 该工具主要针对背景色为白色的扫描文档,不适合于数码照片和背景色为彩色的文档。
想要了解关于ABBYY FineReader 14的更多内容可点击进入ABBYY中文网站,查您所需。
如何用ABBYY解决文档图像存在缺陷,OCR 准确性低的问题的更多相关文章
- 如何使用ABBYY FineReader处理文档图像的缺陷?
通过扫描仪或者数码相机获取的图像文件,容易出现文本扭曲.页面歪斜等缺陷,会影响到OCR的识别质量.此时,用户可使用ABBYY FineReader 15(Windows系统)OCR文字识别软件的自动和 ...
- 从单一图像中提取文档图像:ICCV2019论文解读
从单一图像中提取文档图像:ICCV2019论文解读 DewarpNet: Single-Image Document Unwarping With Stacked 3D and 2D Regressi ...
- ABBYY FineReader文档对比实例讲解
ABBYY FineReader企业版与标准版有一个重大的区别,就是企业版有对比文档的功能,今天通过下面的文档对比实例,来向大家展示一下OCR文字识别工具ABBYY FineReader的使用技巧. ...
- 微众api文档,身份证识别,ocr等人脸识别等
https://cloud.tencent.com/document/product/655/14369 https://cloud.tencent.com/document/product/655/ ...
- 图像添加到ABBYY 文档有什么方法
ABBYY FineReader 12作为一款功能全面的OCR图文识别软件,我们自是可以在其中将图像添加到FineReader文档中去,且添加在文档尾部,否则将会创建一个新的FineReader文档. ...
- ABBYY 识别结果的文档怎么导出
使用ABBYY FineReader Pro for Mac OCR文字识别软件识别文档时,识别结果可以保存至一个文件.复制到剪贴板或通过电子邮件发送.可以执行下列操作:导出整个文档.仅导出所选页面. ...
- ABBYY FineReader 15 文档转换功能
我们平常工作的时候总会固定地只用某几个文档格式,有的人经常使用office,所以电脑内就没安装PDF阅读器,这个时候就需要文档转换器了,ABBYY FineReader 15 也能够帮助我们实现快速的 ...
- 拆分ABBYY FineReader 12文档的方法
处理大量多页文档时,通常都会首先扫描所有文档,然后才进行分析和识别.但是,要正确保留每个纸质文档的原始格式,ABBYY FineReader 12必须将每个文档作为单独 FineReader 文档进行 ...
- ABBYY FineReader 15如何比较文档?
ABBYY FineReader 15 OCR文字识别软件能帮助用户快速地对比两个文档间的差异,适合用于审阅.修改文档,发现新旧版本差异,预防输出错误版本等情况.此功能既能用于对比同一格式文档的不同版 ...
随机推荐
- 子父类存在同名成员时super的使用条件
1.子父类存在同名成员时,子类中默认访问子类的成员,可通过super指定访问父类的成员,格式:super.xx (注:xx是成员名): 2.创建子类对象时,默认会调用父类的无参构造方法,可通过sup ...
- WSL2和CUDA踩坑
WSL2和CUDA踩坑 WSL2里可以直接跑cuda了, 目前(2020年10月) 功能可用, 但bug很多, 不够完善 1. 安装 主要参考: https://docs.nvid ...
- # ThreeJS学习7_裁剪平面(clipping)
ThreeJS学习7_裁剪平面(clipping) 目录 ThreeJS学习7_裁剪平面(clipping) 1. 裁剪平面简介 2. 全局裁剪和局部裁剪 3. 被多个裁剪平面裁剪后 4. 被多个裁剪 ...
- 创建Sqlite数据库(二)
先创建一个数据库表,然后在主activity中执行删除更新操作 public class MainActivity extends AppCompatActivity { @Override prot ...
- Java面试题集(一)答案汇总(1-22)
java基础篇: 1.1.Java基础 (1)面向对象的特性:继承.封装和多态 以下都是查阅大神的博客后,摘录的内容:来源http://www.cnblogs.com/chenssy 1.继承 继承是 ...
- 前端-jstree 一些常用功能
最近使用到了jstree(v3.3.4)这个插件(官网:https://www.jstree.com/),在这里记录下我的使用过程的一些技巧和问题. 1. 获取数据 一般实际项目中用到的数据都是aja ...
- python中,*args和**kwargs这两个参数的作用是什么?
*args和**kwargs这两个都是不定长参数,可以解决函数中参数不固定的问题,*args可以把位置参数转化成元组,**kwagrs可以把关键字参数转化成字段
- Linux下如何使用X86 CPU的GPIO
目录 1.前言 2.linux pinctrl子系统 3. pin controller driver 4.手动构造device 1.前言 在arm嵌入式开发中,各个外设具有固定的物理地址,我们可以直 ...
- debian 安裝SSH 增加新用戶 并使用sudo
1 新建新用戶user 2 3 adduser user 4 5 passwd 123654 6 7 exit 刚安装好的Debian默认还没有sudo功能. 1.安装sudo # apt-get i ...
- python中可迭代对象、迭代器、生成器
可迭代对象 关注公众号"轻松学编程"了解更多. 1.列表生成式 list = [result for x in range(m, n)] g1 = (i for i in rang ...