使用ABBYY FineReader 手动校正文档复杂结构

ABBYY FineReader 15（Windows系统）拥有强大的OCR识别功能，能对扫描仪或者数码相机等光学工具获取的图像进行识别，解析其中的文本、图像、表格、条形码等，方便用户进一步获取图像中的信息。

但由于设备或者拍摄时的客观因素影响，获取的图像可能并不是很理想的状态，比如图像可能会倾斜，识别的区域类型错误等，ABBYY FineReader 15 OCR文字识别软件配备了手动校正文档复杂结构的功能，更好地提高OCR的识别质量。接下来，小编以一个实例来演示一下手动校正文档的过程。

首先，要先把图像文件导入到软件的OCR编辑中，更为简便的方式是直接在“新任务窗口”的转换文档处使用“在OCR编辑器中打开”。

图1：打开OCR编辑器

第一步、对图像进行自动识别

导入图像后，ABBYY FineReader 15 OCR文字识别软件的OCR编辑器会对图像进行预处理的识别。导入了一张包含两个页面的、方向倒置的图书照片，软件会自动将其页面分割，并将页面翻转至正确方向，然后对其中的文本、图像、表格等进行区域分类。

图2：图像识别

图3：图像识别后

第二步、手动校正

在ABBYY FineReader 15 中，选中其中需要处理的图像，在“图像面板”处，可以看到图像中的右上角区域被定义为“图片”，但其中是包含有文本的，此时，就可以使用手动调整区域的功能。

图4：图片区域

·调整区域的边框，使用鼠标拖动图片区域的边框，将图片的文字部分减去。

图5：减去文本区域

·然后使用“图像面板”顶部工具栏的“新建区域”工具，新建文本区域。选择上一步中减去的文本区域，将其定义为文本，提高OCR识别的质量。

图6：新建的文本区域

·调整页面的属性，右击需要调整的区域，在其右击快捷菜单里选择“属性”，即可在图像面板的底部找到该区域的具体属性。选择其中的页脚文本，在其“功能属性”中，可将其定义为“页眉和页脚”。

图7：调整页面的属性

通过使用ABBYY FineReader 15 OCR文字识别软件的OCR识别功能，能帮助用户尽可能准确地获取到图像文件中的信息。通过预先识别+后期手动调整的方式，可帮助用户更有效地进行图像识别，既能减少不必要的简单重复劳动，也能发挥自我能动性。点击ABBYY FineReader教程即刻获取更多OCR识别技巧。

使用ABBYY FineReader 手动校正文档复杂结构的更多相关文章

如何使用ABBYY FineReader 手动管理文档区域
在运用OCR编辑器时,ABBYY FineReader 15(Windows系统)OCR文字识别软件会对扫描仪或数码相机导入的图像进行识别和检测.在识别和检测之前,软件会自动对PDF文档中的文本.图片 ...
ABBYY FineReader 15 PDF文档查看功能
PDF文档查看功能是ABBYY FineReader 15(Windows系统)OCR文字识别软件中PDF编辑器的一项基础功能,可供用户查看,搜索PDF文档,无需进入编辑模式,也可复制其中的文本,图片 ...
ABBYY FineReader 15 对比文档功能
想必大家在办公的时候都有着要处理各种各样文档的烦恼,一个文档经过一个人或不同人的多次修订都是常有的事,拥有文档对比功能的软件也就应势而生.ABBYY FineReader 15 有许多能够帮助我们办公 ...
ABBYY FineReader 15 PDF文档编辑功能详解
ABBYY FineReader 15(Windows系统)OCR文字识别软件作为一款通用 PDF 工具,能轻松有效地对各种 PDF文档和纸质文档,进行数字化.检索.编辑.转换.包含.分享和合作,而其 ...
HTML介绍、文档基本结构、meta标签、HTML标记的语法
一.HTML的介绍 Hyper Text Mark-up Language 超文本标记语言,是一种描述性标记语言(不是编程语言),主要用于描述网页(可以有图像,文字,声音,等..)但没有交互性 HTM ...
MFC单文档程序结构
MFC单文档程序结构三方面: Doc MainFrame View
深入分析MFC文档视图结构（项目实践）
k_eckel:http://www.mscenter.edu.cn/blog/k_eckel 文档视图结构(Document/View Architecture)是MFC的精髓,也是Observer ...
MFC文档视图结构学习笔记
文档/视图概述为了统一和简化数据处理方法,Microsoft公司在MFC中提出了文档/视图结构的概念,其产品Word就是典型的文档/视图结构应用程序 MFC通过其文档类和视图类提供了大量有关数据处理 ...
ABBYY 识别结果的文档怎么导出
使用ABBYY FineReader Pro for Mac OCR文字识别软件识别文档时,识别结果可以保存至一个文件.复制到剪贴板或通过电子邮件发送.可以执行下列操作:导出整个文档.仅导出所选页面. ...

随机推荐

JS里各种类型的循环
for... for( 初始条件; 判断条件; 递增条件 ) { ... } for ... in 可以把一个对象里面的所有属性依次循环出来 var person = { name: 'Jack', ...
soct的创建方法
服务器端:ServerSocket提供的实例 ServerSocket server = new ServerSocket(端口号) 客户端:Socket提供的实例 Socket client = ...
USB引脚属性
1.各型号usb 2.type c接口 type c母头 type c公头 usb type c三种工作模式: usb 3.1有三种工作模式: 1:DRP.主HOST/DEVICE可自由转换,类似电脑 ...
Centos7 使用nginx部署vue项目
一.安装nginx #设置源 sudo rpm -Uvh http://nginx.org/packages/centos/7/noarch/RPMS/nginx-release-centos-7-0 ...
云计算管理平台之OpenStack Web管理工具dashboard
在上一篇博客中,我们成功的基于两种网络启动虚拟机:这意味着openstack的核心服务都搭建完成,并正常运行着:有关启动虚拟机实例请参考上一篇博客:今天我们来了解下,基于一个web界面图形工具来管理o ...
C# 实现十六进制Unicode编码字符串转换为汉字
网上找了几个方法,但是运行之后会报错,提示要解析的字符串格式不正确.然后我猜想可能是传入的字符串 \u60a8\u4eca\u65e5\u5df2\u7b7e\u5230 中带"\" ...
Python3网络学习案例三：编写web server
1. 写在前面这里总结的并不够详细,有时间了再进行补充. 2. 设计思路 HTTP协议是建立在TCP上的1. 建立服务器端TCP套接字(绑定ip,port),等待监听连接:listen(2. 打开浏 ...
Servlet学习笔记（三）
目录 Servlet学习笔记(三) 一.HTTP协议 1.请求:客户端发送欸服务器端的数据 2.响应:服务器端发送给客户端的数据 3.响应状态码二.Response对象 1.Response设置响应 ...
Angular2 初学小记
1.与Angular1的异同几乎完全不同(什么鬼~ 1)保留一些特性表达式仍旧用{{}}. 2)属性指令变为驼峰式 ng-if ---> ngIf 3)ng-repeat被ngFor代替 4 ...
《精通Spring4.x企业应用开发实战》第三章
这一章节主要介绍SpringBoot的使用,也是学习的重点内容,之后就打算用SpringBoot来写后台,所以提前看一下还是很有必要的. 3.SpringBoot概况 3.1.1SpringBoot发 ...

使用ABBYY FineReader 手动校正文档复杂结构

使用ABBYY FineReader 手动校正文档复杂结构的更多相关文章

随机推荐

热门专题