如何用ABBYY解决文档图像存在缺陷,OCR 准确性低的问题
扭曲的文本行、歪斜、噪声及扫描图像和数码照片中常见的其他缺陷可能会降低识别质量。ABBYY FineReader,提供各种 自动和手动工具去除这些缺陷。
如何手动编辑图像
如果您禁用了自动预处理功能或者想预处理特定页面,您可以使用图像编辑器,手动编辑页面图像。
按照下列说明手动编辑图像:
1. 打开 OCR 编辑器,然后打开图像编辑器:
2. 单击“编辑图像”图像面板工具栏,或者单击“编辑>编辑页面图像...”。

4. 窗口“图像编辑器”将打开,显示当前选择的页面。 图像编辑器最右边的面板上有编辑图像用的工具。
5. 单击您想使用的工具,然后将其应用于图像。 产生的变更将显示在“图像”面板上。 大多数工具既可以应用到特定页面,也可以应用到文档的所有页面。 您可以使用工具栏上的下拉列表“选定内容”指定您想编辑的页面,在该下拉列表中您可以选择所有奇数/偶数页、当前页面,或者所选页面(如果在面板上“页面”选择了多页)。
6. 完成图像编辑后,单击“退出图像编辑器”图像编辑器最上方的按钮。
图像编辑器包含下列工具:
• 建议的预处理
根据您图像的类型,程序将自动确定和进行必要的校正。 可以进行的校正包括消除噪声和模糊、反转颜色以使背景色比文本颜色浅、校正歪斜、矫直文本行、校正梯形失真和修剪图像边缘。
• 歪斜校正
校正图像歪斜。
• 矫直文本行
矫直图像上任何弯曲的文本行。
• 照片校正
此组中的工具可以让您矫直文本行、消除噪音和模糊,以及将文档背景色变成白色。
• 校正梯形失真
校正梯形失真和删除不包含任何有用数据的图像边缘。
选中此工具时,图像上将出现一个蓝色小框。拖动框角到图像相应角上,使小框的水平线与文本行平行。 单击“修正”按钮应用此变更。
• 旋转与翻转
此组中的工具可以让您垂直或水平旋转和翻转图像,使图像上的文本面向正确的方向。
• 分割
此组中的工具可以让您将图像拆分成几个部分。 当您扫描图书和需要拆分对页时,此工具非常有用。
• 修剪
删除不包含任何有用信息的图像边缘。
• 反转
反转图像颜色。 如果您处理的文本呈非标准颜色(文本颜色浅而背景色深),该工具非常有用。
• 分辨率
更改图像分辨率。
• 亮度与对比度
更改图像的亮度和对比度。
• 等级
此工具可以让您改变阴影、光和中间色的强度从而调整图像的色阶。
若要增加图像的对比度,可移动输入级别直方图上的左右滑块。 颜色范围从最浅到最深分为255个等级。 左滑块会将图像颜色设置成最黑,右滑块会将图像颜色设置成最白。 将中间的滑块向右移动会使图像颜色加深,向左移动会使之变浅。
调整输出级别滑块会降低图像的对比度。
• 橡皮擦
清除图像的某个部分。
• 删除颜色标记
清除用笔做出的任何彩色戳记和标记,以识别被这些标记遮住的文本。 该工具主要针对背景色为白色的扫描文档,不适合于数码照片和背景色为彩色的文档。
想要了解关于ABBYY FineReader 14的更多内容可点击进入ABBYY中文网站,查您所需。
如何用ABBYY解决文档图像存在缺陷,OCR 准确性低的问题的更多相关文章
- 如何使用ABBYY FineReader处理文档图像的缺陷?
通过扫描仪或者数码相机获取的图像文件,容易出现文本扭曲.页面歪斜等缺陷,会影响到OCR的识别质量.此时,用户可使用ABBYY FineReader 15(Windows系统)OCR文字识别软件的自动和 ...
- 从单一图像中提取文档图像:ICCV2019论文解读
从单一图像中提取文档图像:ICCV2019论文解读 DewarpNet: Single-Image Document Unwarping With Stacked 3D and 2D Regressi ...
- ABBYY FineReader文档对比实例讲解
ABBYY FineReader企业版与标准版有一个重大的区别,就是企业版有对比文档的功能,今天通过下面的文档对比实例,来向大家展示一下OCR文字识别工具ABBYY FineReader的使用技巧. ...
- 微众api文档,身份证识别,ocr等人脸识别等
https://cloud.tencent.com/document/product/655/14369 https://cloud.tencent.com/document/product/655/ ...
- 图像添加到ABBYY 文档有什么方法
ABBYY FineReader 12作为一款功能全面的OCR图文识别软件,我们自是可以在其中将图像添加到FineReader文档中去,且添加在文档尾部,否则将会创建一个新的FineReader文档. ...
- ABBYY 识别结果的文档怎么导出
使用ABBYY FineReader Pro for Mac OCR文字识别软件识别文档时,识别结果可以保存至一个文件.复制到剪贴板或通过电子邮件发送.可以执行下列操作:导出整个文档.仅导出所选页面. ...
- ABBYY FineReader 15 文档转换功能
我们平常工作的时候总会固定地只用某几个文档格式,有的人经常使用office,所以电脑内就没安装PDF阅读器,这个时候就需要文档转换器了,ABBYY FineReader 15 也能够帮助我们实现快速的 ...
- 拆分ABBYY FineReader 12文档的方法
处理大量多页文档时,通常都会首先扫描所有文档,然后才进行分析和识别.但是,要正确保留每个纸质文档的原始格式,ABBYY FineReader 12必须将每个文档作为单独 FineReader 文档进行 ...
- ABBYY FineReader 15如何比较文档?
ABBYY FineReader 15 OCR文字识别软件能帮助用户快速地对比两个文档间的差异,适合用于审阅.修改文档,发现新旧版本差异,预防输出错误版本等情况.此功能既能用于对比同一格式文档的不同版 ...
随机推荐
- [阿里DIN] 深度兴趣网络源码分析 之 整体代码结构
[阿里DIN] 深度兴趣网络源码分析 之 整体代码结构 目录 [阿里DIN] 深度兴趣网络源码分析 之 整体代码结构 0x00 摘要 0x01 文件简介 0x02 总体架构 0x03 总体代码 0x0 ...
- JAVA NIO 基础学习
package com.hrd.netty.demo.jnio; import java.io.BufferedReader; import java.io.IOException; import j ...
- B. Petya and Divisors 解析(思維)
Codeforce 111 B. Petya and Divisors 解析(思維) 今天我們來看看CF111B 題目連結 題目 略,請看原題 前言 看了別人的解答就豁然開朗 @copyright p ...
- 解决Linux-Centos7启动Mysql服务失败丢失mysql.sock问题
在新安装mysql后进行启动发现报错 mysql启动服务命令 systemctl start mysqld@3306 Starting mysqld (via systemctl): Job for ...
- 【论文阅读】DGCNN:Dynamic Graph CNN for Learning on Point Clouds
毕设进了图网络的坑,感觉有点难,一点点慢慢学吧,本文方法是<Rethinking Table Recognition using Graph Neural Networks>中关系建模环节 ...
- Luogu P4247 [清华集训2012]序列操作
题意 给定一个长度为 \(n\) 的序列 \(a\) 和 \(q\) 次操作,每次操作形如以下三种: I a b c,表示将 \([a,b]\) 内的元素加 \(c\). R a b,表示将 \([a ...
- .NET Core如何进行请求转发?
前言 冒个泡,近日,有关注我公众号的小伙伴私信我,遇到一个问题搞了很久没解决,此问题具有参考意义,这里跟大家分享下,希望对后续可能有需要的你能有所参考和帮助. 请求转发问题 内网环境跟外网隔离,现在外 ...
- 水题挑战4: luogu P1280 尼克的任务
题目描述 尼克每天上班之前都连接上英特网,接收他的上司发来的邮件,这些邮件包含了尼克主管的部门当天要完成的全部任务,每个任务由一个开始时刻与一个持续时间构成. 尼克的一个工作日为 \(n\) 分钟,从 ...
- mns: Money Never Sleeps! 自己开发的一款 IDEA 插件介绍.
一边敲代码, 一边关注股票/基金行情, 还不怕同事盯到自己的屏幕! 对于一个关注股市跟基金的研发人员来说, 莫过于一天到晚写代码, 而不能及时的查看股市行情跟基金走势了吧. 写代码的时候比较容易忘记看 ...
- iOS面试高薪,进阶 你会这些呢嘛?(持续更新中)
这个栏目将持续更新--请iOS的小伙伴关注!做这个的初心是希望能巩固自己的基础知识,当然也希望能帮助更多的开发者! 基础>分析>总结 面试 iOS常见基础面试题(附参考答案) iOS底层原 ...