如何用ABBYY解决文档图像存在缺陷,OCR 准确性低的问题
扭曲的文本行、歪斜、噪声及扫描图像和数码照片中常见的其他缺陷可能会降低识别质量。ABBYY FineReader,提供各种 自动和手动工具去除这些缺陷。
如何手动编辑图像
如果您禁用了自动预处理功能或者想预处理特定页面,您可以使用图像编辑器,手动编辑页面图像。
按照下列说明手动编辑图像:
1. 打开 OCR 编辑器,然后打开图像编辑器:
2. 单击“编辑图像”图像面板工具栏,或者单击“编辑>编辑页面图像...”。

4. 窗口“图像编辑器”将打开,显示当前选择的页面。 图像编辑器最右边的面板上有编辑图像用的工具。
5. 单击您想使用的工具,然后将其应用于图像。 产生的变更将显示在“图像”面板上。 大多数工具既可以应用到特定页面,也可以应用到文档的所有页面。 您可以使用工具栏上的下拉列表“选定内容”指定您想编辑的页面,在该下拉列表中您可以选择所有奇数/偶数页、当前页面,或者所选页面(如果在面板上“页面”选择了多页)。
6. 完成图像编辑后,单击“退出图像编辑器”图像编辑器最上方的按钮。
图像编辑器包含下列工具:
• 建议的预处理
根据您图像的类型,程序将自动确定和进行必要的校正。 可以进行的校正包括消除噪声和模糊、反转颜色以使背景色比文本颜色浅、校正歪斜、矫直文本行、校正梯形失真和修剪图像边缘。
• 歪斜校正
校正图像歪斜。
• 矫直文本行
矫直图像上任何弯曲的文本行。
• 照片校正
此组中的工具可以让您矫直文本行、消除噪音和模糊,以及将文档背景色变成白色。
• 校正梯形失真
校正梯形失真和删除不包含任何有用数据的图像边缘。
选中此工具时,图像上将出现一个蓝色小框。拖动框角到图像相应角上,使小框的水平线与文本行平行。 单击“修正”按钮应用此变更。
• 旋转与翻转
此组中的工具可以让您垂直或水平旋转和翻转图像,使图像上的文本面向正确的方向。
• 分割
此组中的工具可以让您将图像拆分成几个部分。 当您扫描图书和需要拆分对页时,此工具非常有用。
• 修剪
删除不包含任何有用信息的图像边缘。
• 反转
反转图像颜色。 如果您处理的文本呈非标准颜色(文本颜色浅而背景色深),该工具非常有用。
• 分辨率
更改图像分辨率。
• 亮度与对比度
更改图像的亮度和对比度。
• 等级
此工具可以让您改变阴影、光和中间色的强度从而调整图像的色阶。
若要增加图像的对比度,可移动输入级别直方图上的左右滑块。 颜色范围从最浅到最深分为255个等级。 左滑块会将图像颜色设置成最黑,右滑块会将图像颜色设置成最白。 将中间的滑块向右移动会使图像颜色加深,向左移动会使之变浅。
调整输出级别滑块会降低图像的对比度。
• 橡皮擦
清除图像的某个部分。
• 删除颜色标记
清除用笔做出的任何彩色戳记和标记,以识别被这些标记遮住的文本。 该工具主要针对背景色为白色的扫描文档,不适合于数码照片和背景色为彩色的文档。
想要了解关于ABBYY FineReader 14的更多内容可点击进入ABBYY中文网站,查您所需。
如何用ABBYY解决文档图像存在缺陷,OCR 准确性低的问题的更多相关文章
- 如何使用ABBYY FineReader处理文档图像的缺陷?
通过扫描仪或者数码相机获取的图像文件,容易出现文本扭曲.页面歪斜等缺陷,会影响到OCR的识别质量.此时,用户可使用ABBYY FineReader 15(Windows系统)OCR文字识别软件的自动和 ...
- 从单一图像中提取文档图像:ICCV2019论文解读
从单一图像中提取文档图像:ICCV2019论文解读 DewarpNet: Single-Image Document Unwarping With Stacked 3D and 2D Regressi ...
- ABBYY FineReader文档对比实例讲解
ABBYY FineReader企业版与标准版有一个重大的区别,就是企业版有对比文档的功能,今天通过下面的文档对比实例,来向大家展示一下OCR文字识别工具ABBYY FineReader的使用技巧. ...
- 微众api文档,身份证识别,ocr等人脸识别等
https://cloud.tencent.com/document/product/655/14369 https://cloud.tencent.com/document/product/655/ ...
- 图像添加到ABBYY 文档有什么方法
ABBYY FineReader 12作为一款功能全面的OCR图文识别软件,我们自是可以在其中将图像添加到FineReader文档中去,且添加在文档尾部,否则将会创建一个新的FineReader文档. ...
- ABBYY 识别结果的文档怎么导出
使用ABBYY FineReader Pro for Mac OCR文字识别软件识别文档时,识别结果可以保存至一个文件.复制到剪贴板或通过电子邮件发送.可以执行下列操作:导出整个文档.仅导出所选页面. ...
- ABBYY FineReader 15 文档转换功能
我们平常工作的时候总会固定地只用某几个文档格式,有的人经常使用office,所以电脑内就没安装PDF阅读器,这个时候就需要文档转换器了,ABBYY FineReader 15 也能够帮助我们实现快速的 ...
- 拆分ABBYY FineReader 12文档的方法
处理大量多页文档时,通常都会首先扫描所有文档,然后才进行分析和识别.但是,要正确保留每个纸质文档的原始格式,ABBYY FineReader 12必须将每个文档作为单独 FineReader 文档进行 ...
- ABBYY FineReader 15如何比较文档?
ABBYY FineReader 15 OCR文字识别软件能帮助用户快速地对比两个文档间的差异,适合用于审阅.修改文档,发现新旧版本差异,预防输出错误版本等情况.此功能既能用于对比同一格式文档的不同版 ...
随机推荐
- linux ssh自动输入密码,expect使用
想搞一个使用ssh登录批量ip地址执行命令,自动输入密码的脚本,但是ssh不能使用标准输入来实现自动输入密码,于是了解到了expect这个可以交互的命令 是什么 查看使用man查看expect,是这么 ...
- 洛谷 P2503 [HAOI2006]均分数据 随机化贪心
洛谷P2503 [HAOI2006]均分数据(随机化贪心) 现在来看这个题就是水题,但模拟赛时想了1个小时贪心,推了一堆结论,最后发现贪心做 不了, 又想了半个小时dp 发现dp好像也做不了,在随机化 ...
- 503. 下一个更大元素 II
503. 下一个更大元素 II 给定一个循环数组(最后一个元素的下一个元素是数组的第一个元素),输出每个元素的下一个更大元素.数字 x 的下一个更大的元素是按数组遍历顺序,这个数字之后的第一个比它更大 ...
- APP后台架构20191205
1.架构,架构与业务紧密相关,是有业务驱动的. 2.APP后台演进原则. App后台的架构是由业务规模驱动而演进的,App后台是为业务服务的,App后台的价值在于能为业务提供其所需要的功能,不应过度设 ...
- SpringBoot整合Logback日志框架配置全解析
目录 本篇要点 一.Logback日志框架介绍 二.SpringBoot与Logback 1.默认日志格式 2.控制台输出 3.文件输出 4.日志级别 5.日志组 6.自定义log配置 三.logba ...
- 【Luogu】 P6274 [eJOI2017]六 题解
首先,题目说了最多\(6\)个质因数. 如此小的数据范围,不是状压还是啥? 然后,我们可以发现一个性质:只要两个因数有相同的质因数(不管次数是多少),两者就不互质. 这启示我们用一个二进制数来表示一类 ...
- 3.4 MyArrayList 类的实现
3.4 MyArrayList 类的实现 这节提供一个便于使用的 MyArrayList 泛型类的实现,这里不检测可能使得迭代器无效的结构上的修改,也不检测非法的迭代器 remove 方法. MyAr ...
- linux + MongoDB 安装 + 部署 + 讲解 (满满干货看完记得收藏噢)
话不多说开始了! 安装 安装就依据菜鸟教程的进行安装 传送门 => https://www.runoob.com/mongodb/mongodb-linux-install.html 好啦!现在 ...
- SLAM笔记
1.matrix.preTranslate()和matrix.postTranslate()的区别 matrix.preTranslate(matrix_1); matrix.postTranslat ...
- 重置GrindConrol焦点行FocusedRowHandle
List<model> list=this.CurrentList; var selectModel=tempselectmodel; //找selectModel在list中得位置 va ...