使用ABBYY FineReader 手动校正文档复杂结构
ABBYY FineReader 15(Windows系统)拥有强大的OCR识别功能,能对扫描仪或者数码相机等光学工具获取的图像进行识别,解析其中的文本、图像、表格、条形码等,方便用户进一步获取图像中的信息。
但由于设备或者拍摄时的客观因素影响,获取的图像可能并不是很理想的状态,比如图像可能会倾斜,识别的区域类型错误等,ABBYY FineReader 15 OCR文字识别软件配备了手动校正文档复杂结构的功能,更好地提高OCR的识别质量。接下来,小编以一个实例来演示一下手动校正文档的过程。
首先,要先把图像文件导入到软件的OCR编辑中,更为简便的方式是直接在“新任务窗口”的转换文档处使用“在OCR编辑器中打开”。
.png)
图1:打开OCR编辑器
第一步、 对图像进行自动识别
导入图像后,ABBYY FineReader 15 OCR文字识别软件的OCR编辑器会对图像进行预处理的识别。导入了一张包含两个页面的、方向倒置的图书照片,软件会自动将其页面分割,并将页面翻转至正确方向,然后对其中的文本、图像、表格等进行区域分类。
.jpeg)
图2:图像识别
.png)
图3:图像识别后
第二步、 手动校正
在ABBYY FineReader 15 中,选中其中需要处理的图像,在“图像面板”处,可以看到图像中的右上角区域被定义为“图片”,但其中是包含有文本的,此时,就可以使用手动调整区域的功能。
.jpeg)
图4:图片区域
·调整区域的边框,使用鼠标拖动图片区域的边框,将图片的文字部分减去。
.jpeg)
图5:减去文本区域
·然后使用“图像面板”顶部工具栏的“新建区域”工具,新建文本区域。选择上一步中减去的文本区域,将其定义为文本,提高OCR识别的质量。
.png)
图6:新建的文本区域
·调整页面的属性,右击需要调整的区域,在其右击快捷菜单里选择“属性”,即可在图像面板的底部找到该区域的具体属性。选择其中的页脚文本,在其“功能属性”中,可将其定义为“页眉和页脚”。
.png)
图7:调整页面的属性
通过使用ABBYY FineReader 15 OCR文字识别软件的OCR识别功能,能帮助用户尽可能准确地获取到图像文件中的信息。通过预先识别+后期手动调整的方式,可帮助用户更有效地进行图像识别,既能减少不必要的简单重复劳动,也能发挥自我能动性。点击ABBYY FineReader教程即刻获取更多OCR识别技巧。
使用ABBYY FineReader 手动校正文档复杂结构的更多相关文章
- 如何使用ABBYY FineReader 手动管理文档区域
在运用OCR编辑器时,ABBYY FineReader 15(Windows系统)OCR文字识别软件会对扫描仪或数码相机导入的图像进行识别和检测.在识别和检测之前,软件会自动对PDF文档中的文本.图片 ...
- ABBYY FineReader 15 PDF文档查看功能
PDF文档查看功能是ABBYY FineReader 15(Windows系统)OCR文字识别软件中PDF编辑器的一项基础功能,可供用户查看,搜索PDF文档,无需进入编辑模式,也可复制其中的文本,图片 ...
- ABBYY FineReader 15 对比文档功能
想必大家在办公的时候都有着要处理各种各样文档的烦恼,一个文档经过一个人或不同人的多次修订都是常有的事,拥有文档对比功能的软件也就应势而生.ABBYY FineReader 15 有许多能够帮助我们办公 ...
- ABBYY FineReader 15 PDF文档编辑功能详解
ABBYY FineReader 15(Windows系统)OCR文字识别软件作为一款通用 PDF 工具,能轻松有效地对各种 PDF文档和纸质文档,进行数字化.检索.编辑.转换.包含.分享和合作,而其 ...
- HTML介绍、文档基本结构、meta标签、HTML标记的语法
一.HTML的介绍 Hyper Text Mark-up Language 超文本标记语言,是一种描述性标记语言(不是编程语言),主要用于描述网页(可以有图像,文字,声音,等..)但没有交互性 HTM ...
- MFC单文档程序结构
MFC单文档程序结构三方面: Doc MainFrame View
- 深入分析MFC文档视图结构(项目实践)
k_eckel:http://www.mscenter.edu.cn/blog/k_eckel 文档视图结构(Document/View Architecture)是MFC的精髓,也是Observer ...
- MFC文档视图结构学习笔记
文档/视图概述 为了统一和简化数据处理方法,Microsoft公司在MFC中提出了文档/视图结构的概念,其产品Word就是典型的文档/视图结构应用程序 MFC通过其文档类和视图类提供了大量有关数据处理 ...
- ABBYY 识别结果的文档怎么导出
使用ABBYY FineReader Pro for Mac OCR文字识别软件识别文档时,识别结果可以保存至一个文件.复制到剪贴板或通过电子邮件发送.可以执行下列操作:导出整个文档.仅导出所选页面. ...
随机推荐
- Spring Cloud Alibaba Seata
一.简介 官网地址:http://seata.io/zh-cn/ 1,概念 Seata是一款开源的分布式事务解决方案,致力于在微服务架构在提供高性能和简单一样的分布式事务服务. 2,处理过程 Tran ...
- 基于Python与命令行人脸识别项目(系列二)
接着系统一,继续开始我们face_recognition. Python 模块:face_recognition 在Python中,你可以导入face_recognition模块,调用丰富的API接口 ...
- ctfshow 1024杯 部分web题解
------------恢复内容开始------------ 今年1024忙得厉害,去大上海参加geekpwn膜拜大佬,几家平台的题目没怎么好好看.特别是小破站的比赛拉跨的一批,bytectf的web ...
- 走在深夜的小码农 Sixth Day
Css3 Six Day writer:late at night codepeasant 学习大纲: 一.其他样式 1.圆角边框 在 CSS3 中,新增了圆角边框样式,这样我们的盒子就可以变圆角了. ...
- ## 【分布式事务】面试官问我:MySQL中的XA事务崩溃了如何恢复??
写在前面 前段时间搭建了一套MySQL分布式数据库集群,数据库节点有12个,用来测试各种分布式事务方案的性能和优缺点.测试MySQL XA事务时,正当测试脚本向数据库中批量插入数据时,强制服务器断电! ...
- Java学习的第二十一天
1.综合实例 error异常:error指的是错误,通常是程序员不可能通过代码来解决的问题,底层环境或硬件问题,也就是说在程序中用户不用捕获error及任何error子类的异常. exception指 ...
- AWS SDK 使用说明
AWS 的Python SDK包名为 boto3, 可以使用命令pip install boto3安装使用 BOTO3中的基本概念 boto3提供了两个级别的接口来访问AWS服务:High Level ...
- leetcode70word-search
题目描述 给出一个二维字符数组和一个单词,判断单词是否在数组中出现, 单词由相邻单元格的字母连接而成,相邻单元指的是上下左右相邻.同一单元格的字母不能多次使用. 例如: 给出的字符数组= [↵ [&q ...
- CentOS 8.x 下尝试安装.Net 5 的运行时
1.背景 看着不管是群里还是公众号里这几天最热闹就是.Net 5.0 正式版的发布.C#9. 当然要开发.net 5.0 的项目就需要把VisualStudio升级的v16.8.0版本了.升级后自带着 ...
- jquery自定义弹层显示大图(兼容多层iframe)
1.介绍 a:可用于多层iframe中,显示在最外层 b:动画效果为从点击的图片位置开始放大至全屏显示 2.效果图 3.js代码 1 function ShowMaxImg(src, y, x, w, ...