OCR之前这些因素必须考虑到！

単子 2024-09-08 02:31:30 原文

用久了ABBYY FineReader 14OCR文字识别软件，相信大家都知道图像质量对OCR质量有很大的影响，本文将给大家讲解下在识别图像之前，有哪些因素需要考虑到！

1、OCR语言

ABBYY FineReader可以识别单一和多语言的文档，针对多语言文档，需要选择多个OCR语言。

选择OCR语言：点击选项 > 语言，然后选择以下选项之一：

•从以下列表中自动选择OCR语言

ABBYY FineReader将从用户自定义的语言列表中自动选择合适的语言，编辑语言列表时：

1、确保‘从以下列表中自动选择OCR语言’选项已选定。

2、点击‘指定’按钮。

3、在语言对话框中，选择需要的语言，然后点击确定。

4、在选项对话框中，点击确定。

•手动指定OCR语言

如果需要的语言不在列表里，则选择该选项。在下面的对话框中，指定一种或多种语言。如果你经常使用特定的语言组合，可以为这些语言创建新的语言组。

如果语言不在列表里，可能是因为ABBYY FineReader不支持或软件版本不支持。

2、打印类型

文档可能会使用各种设备（如打字机或传真机）打印，OCR质量会根据文档的打印类型而改变，可以通过在‘选项’对话框中选择正确的打印类型来提高OCR质量。

通常情况下，程序会自动检测大多数文档的打印类型，你也可以根据需要手动选择打印类型。

3、打印质量

带有“噪音”、模糊和不整齐字母，或者斜线的质量较差的文档，可能需要特殊的扫描设置了。

质量较差的文档应该用灰度来扫描，用灰度来扫描时，程序会自动选择合适亮度值。

4、颜色模式

如果不需要保存全彩色文档的原始颜色，可以在黑白模式中处理该文档，这将会大大降低最终OCR项目的大小，加速OCR过程。但是，在黑白模式中处理对比度较低的图像可能会导致OCR质量较差，也不建议用黑白模式处理中文、日文和韩文的照片、杂志页面和文本。

小贴士：你也可以在选项对话框的OCR选项卡上选择‘快速识别’，加速彩色和黑白文档的OCR过程。

有关ABBYY FineReader的更多内容，请点击访问ABBYY教程了解更多信息。

OCR之前这些因素必须考虑到！的更多相关文章

【腾讯Bugly干货分享】深度学习在OCR中的应用
本文来自于腾讯bugly开发者社区,未经作者同意,请勿转载,原文地址:http://dev.qq.com/topic/5809bb47cc5e52161640c5c8 Dev Club 是一个交流移动 ...
Atitit ocr识别原理与概论 attilax总结
Atitit ocr识别原理与概论 attilax总结 1.1. Ocr的过程与流程1 1.2. OCR不同技术细分略有不同,但大概原理是一样的. 即主要技术过程是:二值化(又叫归一化)----- ...
OCR识别流程
1.图像输入.预处理:图像输入:对于不同的图像格式,有着不同的存储格式,不同的压缩方式.预处理:主要包括二值化,噪声去除,倾斜较正等2.二值化:对摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量 ...
怎么使用OCR文字识别软件图像压缩功能
ABBYY FineReader是一款非常实用的OCR文字识别软件,在使用ABBYY FineReader保存文档时可以选择图像格式和压缩方法,通过图像压缩可以减小文件的大小,图像压缩方法视压缩率和数 ...
车牌识别OCR—易泊时代智慧城市解决方案模块
牌识别(License Plate Recognition,LPR) 是视频图像识别技术在智能交通领域中的一个模块.车牌识别运用OCR技术,将视频流或图片中的汽车牌照从复杂的应用场景中提取并识别出来, ...
Windows 10 IoT Serials 10 – 如何使用OCR引擎进行文字识别
1. 引言 OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗.亮的模式确定其形状,然后用字符识别方 ...
AI时代的OCR识别技术浅析
人工智能这个词可谓是耳熟能详,近几年人工智能热潮再次席卷而来,引起轰动的要数google的AlphaGo,相继打败了围棋界的韩国选手李世石以及世界冠军柯洁,见证了人工智能发展的里程碑式的变革,人工智能 ...
OCR技术初识
一.什么是OCR OCR英文全称是Optical Character Recognition,中文叫做光学字符识别.它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够接 ...
哪些因素影响ABBYY FineReader 12的识别质量
任何一款OCR文字识别软件都无法确保100%识别准确,更何况诸多因素的存在,都有可能直接或间接影响识别质量.在使用ABBYY FineReader 12识别或者转换文档的时候也存在同样的状况,今天来给 ...

随机推荐

spring与struts2整合出现错误HTTP Status 500 - Unable to instantiate Action
在进行spring和struts2整合的时候因为大意遇到了一个问题,费了半天神终于找到了问题所在,故分享出来望广大博友引以为戒!! 我们都知道在spring和struts2整合时,spring接管了a ...
JS逻辑运算符之“短路”
逻辑与 && 如(表达式 1 && 表达式 2)参与运算时,程序只运行到对应的位置后,停止运行二者都为真(true) 时,返回表达式 2 二者有一个为假 (fal ...
java中的三大注解
三大注解的作用 Java三大注解分别是@Override @Deprecated @Suppresswarnings @Override 注解表名子类中覆盖了超类中的某个方法,如果写错了覆盖形式,编译 ...
【设计模式】第一篇：概述、耦合、UML、七大原则，详细分析总结（基于Java）
迷茫了一周,一段时间重复的 CRUD ,着实让我有点烦闷,最近打算将这些技术栈系列的文章先暂时搁置一下,开启一个新的篇章<设计模式>,毕竟前面写了不少 "武功招式" 的 ...
Java nio Server端示例
public class ServerNio { public static void main(String[] args) throws IOException, InterruptedExcep ...
SpringBoot中的全局异常处理
SpringBoot中的全局异常处理本篇要点介绍SpringBoot默认的异常处理机制. 如何定义错误页面. 如何自定义异常数据. 如何自定义视图解析. 介绍@ControllerAdvice注解 ...
CodeForces 1426F Number of Subsequences
题意给定一个长度为 \(n\) 的串,只包含 abc 和通配符.通配符可以替换 abc 的一个.求所有得到的字符串中子序列 abc 出现的次数,对 \(10^9+7\) 取模. \(\texttt{ ...
python使用pip安装第三方模块遇到的问题及解决方法
python使用pip安装第三方模块遇到的问题及解决方法关注公众号"轻松学编程"了解更多. 使用国内源: 清华:https://pypi.tuna.tsinghua.edu.cn ...
Docker（6）- docker info 命令详解
如果你还想从头学起 Docker,可以看看这个系列的文章哦! https://www.cnblogs.com/poloyy/category/1870863.html 作用显示 Docker 系统信 ...
自己常用的Content-Type几种值用法
Content-Type 的值类型: application/json:消息主体是序列化后的 JSON 字符串这里要注意的是我在使用webapi,前台使用$.ajax的时候假如我要传递的数据为 ...