如何使用ABBYY FineReader 处理无法识别的字符?
在识别PDF文档时,我们可能会遇到文档中存在多种语言、多种不同类型文字字符的情况。在ABBYY FineReader 15(Windows系统)OCR文字识别软件的默认语言数据下,可能无法识别PDF文档中的某些字符。为了更好、更准确地识别文档,用户可以创建包含文档识别数据所需的字符语言。
通过创建多个OCR的语言组,用户可在识别PDF文档时指定使用这些语言组,通过多重语言的识别,实现更准确的文本数据识别,下面就让小编来给您详解。
.jpeg)
图1:OCR项目
第一、创建用户语言
打开ABBYY FineReader 15 OCR文字识别软件的选项面板(通过单击工具>选项 打开选项面板),并单击其中的“语言”选项卡,用户可在此自动选择OCR语言或者手动指定OCR语言,当然也可以通过“新建”创建用户语言。
.jpeg)
图2:语言选项卡
第二、根据现有语言创建
在ABBYY FineReader 15 的语言选项卡,单击“新建”,在“新建语言或组”中选中“根据现有语言创建新语言”选项。由于示例中的图像包含了一些繁体中文字符,在此,我们可以添加一个“繁体中文”的语言。
.jpeg)
图3:新建语言
第三、语言属性
在ABBYY FineReader 15 中完成了用户语言创建后,即可打开语言的属性面板。用户在语言的属性面板中,可对语言的源语言、字母、词典的属性进行设置,并可打开高级属性进行更为详细的设置。
.jpeg)
图4:语言属性
第四、创建语言组
除了设置单一的用户语言外,用户还可以创建一个特定的语言组合,并将其保存起来,供长期的文档识别使用。同样地,打开语言选项卡,在“新建”中选中“新建语言或组”,然后再将需要的语言添加进组。
.jpeg)
图5:创建语言组
第五、再次识别
在ABBYY FineReader 15 完成用户语言创建后,需再次点击软件中的“识别”按钮,再次识别文档。从示例中可以看到,在第一次文本识别中未被识别的繁体文字已被准确识别。
.jpeg)
图6:创建语言后的识别结果
ABBYY FineReader 15 OCR文字识别软件让用户可以通过创建用户语言的方式,识别PDF文档中各种类型的字符文本,确保更加准确的识别结果输出,减少人工修正识别结果的繁琐。当遇到文档或图像中包含多种语言的情况,使用ABBYY FineReader 15就能很好地帮助用户准确识别文档,更多文档识别技巧尽在ABBYY中文网站。
如何使用ABBYY FineReader 处理无法识别的字符?的更多相关文章
- ABBYY FineReader 12如何识别包含非常规符号的文本
ABBYY FineReader 12 是一款OCR图文识别软件,可快速方便地将扫描纸质文档.PDF文件和数码相机的图像转换成可编辑.可搜索的文本,有时文本中可能会包含一些非常规的符号,此时ABBYY ...
- 哪些因素影响ABBYY FineReader 12的识别质量
任何一款OCR文字识别软件都无法确保100%识别准确,更何况诸多因素的存在,都有可能直接或间接影响识别质量.在使用ABBYY FineReader 12识别或者转换文档的时候也存在同样的状况,今天来给 ...
- ABBYY FineReader 12 能够识别哪些文档语言
ABBYY FineReader可以识别单语言文本和多语言文本(如使用两种及以上语言).对于多语言文本,需要选择多种识别语言. 要为文本指定一种 OCR 语言,请从主工具栏或任务窗口的文档语言下拉列表 ...
- 如何使用ABBYY FineReader 用户词典识别专业术语?
ABBYY FineReader 15可以说是比较新的版本,在这个版本中能运用强大的光学字符识别技术对PDF文档扫描件.图像等文件进行OCR识别.在识别的过程中,会使用其内置的词典检查识别文字,以获得 ...
- 电子数据识别软件ABBYY FineReader
ABBYY 是一家俄罗斯软件公司,在文档识别,数据捕获和语言技术的开发中居世界领先地位.其获奖产品 FineReader OCR 软件可以把静态纸文件和 PDF 文件转换成可管理的电子数据,可以大大节 ...
- 如何灵活运用ABBYY FineReader的识别功能
由于工作的原因,经常会使用到文字识别工具,说真的,一款好用的文字识别工具能省不少事,前不久碰到一位职场新人,他的工作内容也离不开文字识别工具,他还问我有什么好用的软件推荐,说到好用,还是ABBYY F ...
- ABBYY FineReader 12扫描界面介绍
ABBYY FineReader 12OCR图文识别软件自身拥有着自己的扫描界面,一般在默认情况下,ABBYY FineReader 使用其自身的扫描界面.本文就解析了ABBYY FineReader ...
- ABBYY FineReader无法打开TWAIN源怎么办
ABBYY FineReader OCR文字识别软件不仅可以将PDF文档和图像文件(包括数码照片)转换为可编辑.可搜索的格式,还可以用来扫描文档,但在扫描过程中,有时可能会出现以下两种错误信息:一是无 ...
- ABBYY FineReader的快速任务功能如何用
在使用ABBYY FineReader Pro for Mac OCR文字识别软件处理文档时,经常会执行一系列相同的步骤,如扫描.识别.将已识别文本导出为特定格式或导出至特定应用程序.针对经常执行的任 ...
随机推荐
- Linux入门到放弃之八《任务计划管理》
任务计划管理 1.每周一下午5:50将/data目录下的所有目录和文件归档并压缩为:backup.tar.gz 放在/home/backup目录下. 先新建/data目录,并在目录中随意生成几个文件 ...
- Spring Cloud 学习笔记 (一)-- Eureka 服务器
开局一张图,截取了本人学习资料中的一张图,很好地展示了Eureka的架构. Eureka服务器 管理服务的作用.细分为服务注册,服务发现. 所有的客户端在Eureka服务器上注册服务,再从Eureka ...
- JAVA概述-JAVA入门基础
一.JAVA的历史 Java是1995年由Sun公司(现Oracle公司)推出的一门面向对象的高级编程语言.这门编程语言的Logo就像是一杯刚刚煮好的咖啡. Java最初期的开发是在1991年,最初的 ...
- Java踩坑记系列之Arrays.AsList
java.util.Arrays的asList方法可以方便的将数组转化为集合,我们平时开发在初始化ArrayList时使用的比较多,可以简化代码,但这个静态方法asList()有几个坑需要注意: 一. ...
- PLC模拟量采集模块在工控领域的应用
在工业现场中,往往需要对温度.电流.电压等模拟量进行控制采集,这可以使用PLC对这些数据进行采集,但是如今生产各种PLC模拟量采集模块的厂家非常多,不同类型的PLC都是有自己专属的模拟量采集模块的,不 ...
- axios前端登录
1.创建一个Login.vue页面 1.1 写页面 views/Login.vue 在 views/components 下创建 Login.vue 页面 1.2 src/router/index.j ...
- [Luogu P4124] [CQOI2016]手机号码 (数位DP)
题面 传送门:洛咕 Solution 感谢神仙@lizbaka的教学 这题是数位DP的非常非常模板的题目,只是状态有点多 . 这题我使用记忆化搜索实现的 中国有句古话说的好,有多少个要求就设多少个状态 ...
- ELK搭建以及运行和ElasticStarch的详细使用(7.X版本之上)
ELK初体验 1.官网 https://www.elastic.co/cn/downloads/elasticsearch 2.需要安装JDK ElasticSearch 是一 ...
- NodeJs 加入Windows开机自启动服务
首先需要到http://nssm.cc/download/?page=download 下载 nssm,下下来之后是压缩包形式的解压之后,在命令行模式下进入到nssm的目录.之后运行:nssm ins ...
- AMA指标原作者Perry Kaufman 100+套交易策略源码分享
更多精彩内容,欢迎关注公众号:数量技术宅.想要获取本期分享的完整策略代码,请加技术宅微信:sljsz01 AMA技术指标与原作者 Kaufman 说起 Perry Kaufman 这个名字,不少读者会 ...