Tesseract–OCR 库原理探索

一，简介：

Tesseract is probably the most accurate open source OCR engine available. Combined with the Leptonica Image Processing Library it can read a wide variety of image formats and convert them to text in over 60 languages. It was one of the top 3 engines in the 1995 UNLV Accuracy test. Between 1995 and 2006 it had little work done on it, but since then it has been improved extensively by Google. It is released under the Apache License 2.0.

项目主页：http://code.google.com/p/tesseract-ocr/

二，使用：

按照主页wiki的介绍，下载编译tesseract。

Sample Code ： http://code.google.com/p/tesseract-ocr/source/browse/trunk/api/tesseractmain.cpp

VS2005的工程（包括第三方库）：http://pan.baidu.com/s/13ROuA

三，原理探索：

1，Tesseract是一个开源跨平台的OCR库；

2，Tesseract主要分为两部分：训练，预测；

3，训练：

a，Tesseract能通过训练来支持第三方语言，或者提高OCR准确率。详情：http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3

b，etc.

5，预测：

a，基本输入是PIX数据结构，可通过外围操作将video data或者其他格式的数据转换为leptonica的PIX格式；

b，输入得到PIX –> ProcessPage() –> Recognize() –>

b.1: 搜索文字块；

b.2：BaseLine匹配；

b.3：字符截断，分割成单个字符；

b.4：截断连在一起的字符，补全断掉的笔画；

b.5：特征提取：早期tesseract使用字符的拓扑特征，这种匹配方式对字体变化不敏感，但是对现实中出现的字识别率鲁棒性不好；

etc.

未完待续…

Tesseract–OCR 库原理探索的更多相关文章

Atitit ocr识别原理与概论 attilax总结
Atitit ocr识别原理与概论 attilax总结 1.1. Ocr的过程与流程1 1.2. OCR不同技术细分略有不同,但大概原理是一样的. 即主要技术过程是:二值化(又叫归一化)----- ...
tesseract ocr文字识别Android实例程序和训练工具全部源代码
tesseract ocr是一个开源的文字识别引擎,Android系统中也可以使用.可以识别50多种语言,通过自己训练识别库的方式,可以大大提高识别的准确率. 为了节省大家的学习时间,现将自己近期的学 ...
Tesseract——OCR图像识别入门篇
Tesseract——OCR图像识别入门篇最近给了我一个任务,让我研究图像识别,从我们项目的screenshot中识别文字信息,so我开始了学习,与大家分享下. 我看到目前OCR技术有很多,最主要 ...
Tesseract Ocr引擎
Tesseract Ocr引擎 1.Tesseract介绍 tesseract 是一个google支持的开源ocr项目,其项目地址:https://github.com/tesseract-ocr/t ...
Python下Tesseract Ocr引擎及安装介绍
1.Tesseract介绍 tesseract 是一个google支持的开源ocr项目,其项目地址:https://github.com/tesseract-ocr/tesseract,目前最新的源码 ...
Pyocr 0.2 发布，Python 的 OCR 库 - 开源中国社区
Pyocr 0.2 发布,Python 的 OCR 库 - 开源中国社区 Pyocr 0.2 发布,Python 的 OCR 库
sql注入--双查询报错注入原理探索
目录双查询报错注入原理探索 part 1 场景复现 part 2 形成原因 part 3 报错原理 part 4 探索小结双查询报错注入原理探索上一篇讲了双查询报错查询注入,后又参考了一些博客, ...
开源图片文字识别引擎——Tesseract OCR
Tessseract为一款开源.免费的OCR引擎,能够支持中文十分难得.虽然其识别效果不是很理想,但是对于要求不高的中小型项目来说,已经足够用了. 文字识别可应用于许多领域,如阅读.翻译.文献资料的检 ...
EBS R12 MOAC原理探索 (转)
转载地址 EBS R12 MOAC原理探索

随机推荐

NTFS数据流和web安全
NTFS流简单介绍: NTFS因为它的稳定性强大的功能以及它所提供的安全性而成为一种更优越的文件系统,NTFS交换数据流(ADSs)是为了和Macintosh的HFS文件系统兼容而设计的,它使用资 ...
javascript快速入门22--Ajax简介
Ajax是什么? 首先,Ajax是什么?一个很酷的新兴词汇!仅仅是某种早就有了的技术的一种新说法而已! Ajax是指一种创建交互式网页应用的网页开发技术.要谈到网页应用程序,则必须从WEB的历史来讲: ...
【angularJS】三个学习angulaJS的链接
1.官方文档:https://code.angularjs.org/1.5.7/docs/api 2.A Better Way to Learn AngularJS:https://thinkster ...
如何在不重启或重新格式化hadoop集群的情况下删除集群节点
在master节点上的hadoop安装目录下进入conf目录配置hdfs-site.xml文件添加节点如下: <property> <name>dfs.hosts.exc ...
两个IP实现IIS和Apache公用80端口的设置方法
1. 打开命令提示符并确保您位于 X:\Inetpub\Adminscripts 文件夹(其中 X 是 IIS 安装驱动器)中.为此,请在命令提示符下键入以下命令行: X: CD \Inetpub ...
Android动态载入Dex机制解析
1.什么是类载入器? 类载入器(class loader)是 Java™中的一个非常重要的概念.类载入器负责载入 Java 类的字节代码到 Java 虚拟机中. Java 虚拟机使用 Java 类的方 ...
diskpart分盘代码
List Disk Select Disk 0 Clean Create Partition Primary Size=512000 Active Format Quick Create Partit ...
Django——WEB三层架构与MVC
而我发此文的目的有二:一者,让初学者能够听到一家之言,是为解惑:二者,更希望抛砖引玉,得到专家的批判. 许多学生经常问我,MVC到底和WEB三层架构有啥关系? 开始时,我也只能给他们一些模糊的回答.时 ...
网页视频播放方案chimee 组件使用
1.概述鉴于目前 H5-Video 在 Web 生态环境中存在较大差异化(兼容性)的表现,本文主要介绍使用奇舞团开发chimee 组件进行视频播放的用法. chimee 组件地址: http://c ...
redislive
安装Redis Live监控服务分类: redis 2014-06-25 20:24 436人阅读评论(0) 收藏举报 redis redis live为监控redis服务的软件,带有监控web ...

Tesseract–OCR 库原理探索

一，简介：

二，使用：

三，原理探索：

Tesseract–OCR 库原理探索的更多相关文章

随机推荐

热门专题