在识别PDF文档时,我们可能会遇到文档中存在多种语言、多种不同类型文字字符的情况。在ABBYY FineReader 15(Windows系统)OCR文字识别软件的默认语言数据下,可能无法识别PDF文档中的某些字符。为了更好、更准确地识别文档,用户可以创建包含文档识别数据所需的字符语言。

通过创建多个OCR的语言组,用户可在识别PDF文档时指定使用这些语言组,通过多重语言的识别,实现更准确的文本数据识别,下面就让小编来给您详解。

图1:OCR项目

第一、创建用户语言

打开ABBYY FineReader 15 OCR文字识别软件的选项面板(通过单击工具>选项 打开选项面板),并单击其中的“语言”选项卡,用户可在此自动选择OCR语言或者手动指定OCR语言,当然也可以通过“新建”创建用户语言。

图2:语言选项卡

第二、根据现有语言创建

在ABBYY FineReader 15 的语言选项卡,单击“新建”,在“新建语言或组”中选中“根据现有语言创建新语言”选项。由于示例中的图像包含了一些繁体中文字符,在此,我们可以添加一个“繁体中文”的语言。

图3:新建语言

第三、语言属性

在ABBYY FineReader 15 中完成了用户语言创建后,即可打开语言的属性面板。用户在语言的属性面板中,可对语言的源语言、字母、词典的属性进行设置,并可打开高级属性进行更为详细的设置。

图4:语言属性

第四、创建语言组

除了设置单一的用户语言外,用户还可以创建一个特定的语言组合,并将其保存起来,供长期的文档识别使用。同样地,打开语言选项卡,在“新建”中选中“新建语言或组”,然后再将需要的语言添加进组。

图5:创建语言组

第五、再次识别

在ABBYY FineReader 15 完成用户语言创建后,需再次点击软件中的“识别”按钮,再次识别文档。从示例中可以看到,在第一次文本识别中未被识别的繁体文字已被准确识别。

图6:创建语言后的识别结果

ABBYY FineReader 15 OCR文字识别软件让用户可以通过创建用户语言的方式,识别PDF文档中各种类型的字符文本,确保更加准确的识别结果输出,减少人工修正识别结果的繁琐。当遇到文档或图像中包含多种语言的情况,使用ABBYY FineReader 15就能很好地帮助用户准确识别文档,更多文档识别技巧尽在ABBYY中文网站

如何使用ABBYY FineReader 处理无法识别的字符?的更多相关文章

  1. ABBYY FineReader 12如何识别包含非常规符号的文本

    ABBYY FineReader 12 是一款OCR图文识别软件,可快速方便地将扫描纸质文档.PDF文件和数码相机的图像转换成可编辑.可搜索的文本,有时文本中可能会包含一些非常规的符号,此时ABBYY ...

  2. 哪些因素影响ABBYY FineReader 12的识别质量

    任何一款OCR文字识别软件都无法确保100%识别准确,更何况诸多因素的存在,都有可能直接或间接影响识别质量.在使用ABBYY FineReader 12识别或者转换文档的时候也存在同样的状况,今天来给 ...

  3. ABBYY FineReader 12 能够识别哪些文档语言

    ABBYY FineReader可以识别单语言文本和多语言文本(如使用两种及以上语言).对于多语言文本,需要选择多种识别语言. 要为文本指定一种 OCR 语言,请从主工具栏或任务窗口的文档语言下拉列表 ...

  4. 如何使用ABBYY FineReader 用户词典识别专业术语?

    ABBYY FineReader 15可以说是比较新的版本,在这个版本中能运用强大的光学字符识别技术对PDF文档扫描件.图像等文件进行OCR识别.在识别的过程中,会使用其内置的词典检查识别文字,以获得 ...

  5. 电子数据识别软件ABBYY FineReader

    ABBYY 是一家俄罗斯软件公司,在文档识别,数据捕获和语言技术的开发中居世界领先地位.其获奖产品 FineReader OCR 软件可以把静态纸文件和 PDF 文件转换成可管理的电子数据,可以大大节 ...

  6. 如何灵活运用ABBYY FineReader的识别功能

    由于工作的原因,经常会使用到文字识别工具,说真的,一款好用的文字识别工具能省不少事,前不久碰到一位职场新人,他的工作内容也离不开文字识别工具,他还问我有什么好用的软件推荐,说到好用,还是ABBYY F ...

  7. ABBYY FineReader 12扫描界面介绍

    ABBYY FineReader 12OCR图文识别软件自身拥有着自己的扫描界面,一般在默认情况下,ABBYY FineReader 使用其自身的扫描界面.本文就解析了ABBYY FineReader ...

  8. ABBYY FineReader无法打开TWAIN源怎么办

    ABBYY FineReader OCR文字识别软件不仅可以将PDF文档和图像文件(包括数码照片)转换为可编辑.可搜索的格式,还可以用来扫描文档,但在扫描过程中,有时可能会出现以下两种错误信息:一是无 ...

  9. ABBYY FineReader的快速任务功能如何用

    在使用ABBYY FineReader Pro for Mac OCR文字识别软件处理文档时,经常会执行一系列相同的步骤,如扫描.识别.将已识别文本导出为特定格式或导出至特定应用程序.针对经常执行的任 ...

随机推荐

  1. OpenCV计算机视觉学习(8)——图像轮廓处理(轮廓绘制,轮廓检索,轮廓填充,轮廓近似)

    如果需要处理的原图及代码,请移步小编的GitHub地址 传送门:请点击我 如果点击有误:https://github.com/LeBron-Jian/ComputerVisionPractice 1, ...

  2. Spring boot ConditionalOnClass原理解析

    Spring boot如何自动加载 对于Springboot的ConditionalOnClass注解一直非常好奇,原因是我们的jar包里面可能没有对应的class,而使用ConditionalOnC ...

  3. 枚举 switch case 标签必须为枚举常量的非限定名称

    枚举 switch case 标签必须为枚举常量的非限定名称 错误描述: Error:(63, 24) 错误: 枚举 switch case 标签必须为枚举常量的非限定名称. 解决思路: switch ...

  4. Java数据结构-03单链表(二)

    在之前我们封装了一些操作在接口类中,并在抽象类实现了相同的方法.下面我们开始写代码: 无头结点单链表:(注意下面的AbstractList是之前抽取的类,不是java.util包下的类) public ...

  5. 《Head First 设计模式》:迭代器模式

    正文 一.定义 迭代器模式提供一种方法顺序访问一个聚合对象中的各个元素,而又不暴露其内部的表示. 要点: 迭代器模式把在元素之间游走的责任交给迭代器,而不是聚合对象.这样简化了聚合的接口和实现,也让责 ...

  6. STM32入门系列-启动文件介绍

    在启动文件内部使用的都是汇编语言,这个文件的作用是负责执行微控制器从"复位"到"开始执行 main 函数"中间这段启动时间所必须进行的工作.它完成的具体工作有: ...

  7. 模块导入from collections import Iterator,Iterable失败

    1.引入模块报错 from collections import Iterator,Iterable 报错: DeprecationWarning: Using or importing the AB ...

  8. From delete library to run の 初见Django篇

    一.虚拟环境简介 1.什么是虚拟环境? 虚拟环境是用于依赖项管理和项目隔离的python工具,允许python的第三方库安装在本地特定项目的隔离目录中,而不是全局安装. 2.虚拟环境的组成 ① 安装了 ...

  9. 从小白到 6 个 offer,我究竟是怎么刷题的?

    最近自习室里又兴起了一阵刷题潮,大家相约刷题~ 今天和大家系统分享下我去年转行时的一个刷题过程和方法,希望对你有所帮助. 首先介绍下我的编程基础,我学的是金融工程专业,硕士时学过 C++ 的课,这也是 ...

  10. 833. Find And Replace in String —— weekly contest 84

    Find And Replace in String To some string S, we will perform some replacement operations that replac ...