OCR1：开源库

OCR （Optical Character Recognition，光学字符识别）是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程。优秀的开源OCR软件包括：

Tesseract：原本由惠普开发的图像识别类库tesseract-ocr已经更新到2.04，就是最近Google支持的那个OCR。原先是惠普写的，现在Open source了。
OCRopus：Ocropus的（TM）是一个先进的文件分析和OCR系统，采用可插入的布局分析，可插入的字符识别，自然语言统计建模和多语言支持功能。
Cuneiform：Cuneiform 是一个 OCR 文字识别系统的商标，最开始是由Cognitive 技术所开发的运行在 Windows 下的软件。而这个项目是该软件在 Linux 系统下的移植版本。
GOCR：GOCR 是一个开源的OCR光学识别程序。
OCRFeeder：OCRFeeder 是 GNOME 桌面下的一个开源 OCR 套件。可将纸质或者图形文档转成电子文档。
Lios：linux-intelligent-ocr-solution (Lios) 是Linux下一个开源的 OCR 解决方案，可将打印的文档转成可编辑的文本。

云服务商提供服务：

百度OCR: https://cloud.baidu.com/doc/OCR/OCR-Python-SDK.html
Azure图像识别：https://azure.microsoft.com/zh-cn/services/cognitive-services/computer-vision/
阿里云OCR: https://www.aliyun.com/product/cdi/
腾讯OCR：https://cloud.tencent.com/product/ocr

OpenCV VS tesseract：

opencv：专注机器视觉
tesseract：专注字符识别

由于tesserocr在windows环境下会出现各种不兼容问题，并且与pycharm虚拟环境不兼容等问题，所以在windows系统环境下，选择pytesseract模块进行安装

Tesseract

Tesserocr 是Python的一个OCR库，但其实是对tesseract做的一层Python API的封装，所以他的核心是tesseract。因此，在安装tesserocr之前，我们需要先安装tesseract。实际使用tesseract ocr也有两种方式：1- 动态库方式 libtesseract 2 - 执行程序方式 tesseract.exe

安装过程：

在Windows下,首选需要下载tesseract，它为tesserocr提供支持，在“https://digi.bib.uni-mannheim.de/tesseract/” ，然后选择3.05.02版本进行下载。其中文件名中带有 dev 的为开发版本，不带 dev 的为稳定版本，可以选择下载不带 dev 的版本，例如可以选择下载tesseract-ocr-setup-3.05.02-20180621.exe
如果不是做英文的图文识别，还需要下载其他语言的识别包 https://github.com/tesseract-ocr/tessdata 下载

安装Tesseract

下载Tesseract-OCR引擎，注意要3.0以上才支持中文哦，按照提示安装就行。
既然是要训练中文，记得勾选 additional language data，如下图：
找到中文简体和中文繁体，按需勾选，然后点下一步。可以先不勾选，因为这样直接下载语言的包实在太慢。可以从网页上直接下载语言包,然后等程序安装好后，放入安装目录下tessdata目录下面，如下图：

配置：

在环境变量的系统变量和个人用户的PATH，把tesseract-ocr的安装路径（如 C:\Program Files (x86)\Tesseract-OCR;）添加进去
在windows系统你还需要将testdata目录也加入环境变量，TESSDATA_PREFIX=C:\Program Files (x86)\Tesseract-OCR\tessdata

验证安装：

打开命令终端，输入：tesseract -v，可以看到版本信息

落地验证：

直接下载：https://raw.githubusercontent.com/Python3WebSpider/Testtess/master/image.png 然后，将图片下载下来并保存为image.png，然后使用tesseract命令进行测试
命令：tesseract image.png 1 （image.png 代表待识别的源文件，1代表输出文件名，默认输出格式是txt文件格式！）

python用tesseract-ocr做图像识别

需要导入两个库，这是别人写好的封装好的库文件。

需要用到两个库：pytesseract和PIL
还需要安装识别引擎tesseract-ocr

Python-tesseract：是Tesseract OCR引擎的Python封装类。能够读取任何常规的图片文件(JPG, GIF ,PNG , TIFF等)并解码成可读的语言。在OCR处理期间不会创建任何临文件

PIL （Python Imaging Library）：是 Python 中最常用的图像处理库。

python对图像的处理比较常见的是用 pytesseract 识别验证码，要安装pytesseract库，必须先安装其依赖的 PIL 及 tesseract-ocr，其中PIL为图像处理库，而后面的tesseract-ocr则为google的ocr识别引擎。

命令：pip install pillow 目前PIL的官方最新版本为1.1.7，支持的版本为python 2.5, 2.6, 2.7，并不支持python3，经查询python3.X用pillow代替，进入DOS命令行窗口，敲入以下代码
命令：pip install pytesseract

示例代码：

import pytesseract

from PIL import Image as img

text = pytesseract.image_to_string(img.open('image.png'))

print(text)

示例结果：

带中文图片示例（示例图片是从百度图片上下载的）：

中文效果并不理想，下一节介绍训练过程

相关链接：

tesserocr GitHub: https://github.com/sirfz/tesserocr
tesserocr PyPI: https://pypi.python.org/pypi/tesserocr
tesseract 下载地址： https://digi.bib.uni-mannheim.de/tesseract/
tesseract GitHub : https://github.com/tesseract-ocr/tesseract
tesseract 语言包： https://github.com/tesseract-ocr/tessdata
tesseract 文档： https://github.com/tesseract-ocr/tesseract/wiki/Documentation

参考资料：

OCR1：开源库的更多相关文章

【踩坑速记】开源日历控件，顺便全面解析开源库打包发布到Bintray/Jcenter全过程（新），让开源更简单~
一.写在前面自使用android studio开始,就被它独特的依赖方式:compile 'com.android.support:appcompat-v7:25.0.1'所深深吸引,自从有了它,麻 ...
Java下好用的开源库推荐
作者:Jack47 转载请保留作者和原文出处欢迎关注我的微信公众账号程序员杰克,两边的文章会同步,也可以添加我的RSS订阅源. 本文想介绍下自己在Java下做开发使用到的一些开源的优秀编程库,会不定 ...
第三方开源库和jar包的区别
jar包和第三方开源库的根本区别在于,开源库的功能比jar包功能更强大,通过引入库项目可以访问java文件以及该开源库项目下的资源文件,例如图片,layout等文件 jar包中只能放class文件引 ...
【转】用JitPack发布开源库时附加文档和源码
来自:http://www.gcssloop.com/course/jitpack-sources-javadoc 用JitPack发布开源库时附加文档和源码很早之前写过一篇用JitPack发布An ...
libCURL开源库在VS2010环境下编译安装，配置详解
libCURL开源库在VS2010环境下编译安装,配置详解转自:http://my.oschina.net/u/1420791/blog/198247 http://blog.csdn.net/su ...
GitHub上那些值得一试的JAVA开源库--转
原文地址:http://www.jianshu.com/p/ad40e6dd3789 作为一名程序员,你几乎每天都会使用到GitHub上的那些著名Java第三方库,比如Apache Commons,S ...
.NET蓝牙开源库：32feet.NET
在用C#调用蓝牙编程一文中我留个小悬念就是:InTheHand.Net.Personal.dll是怎么来的?这篇文章来解答这个问题,InTheHand.Net.Personal.dll就是来源于今天要 ...
Android Studio 简介及导入 jar 包和第三方开源库方[转]
原文:http://blog.sina.com.cn/s/blog_693301190102v6au.html Android Studio 简介几天前的晚上突然又想使用 Android Studi ...
快快快！27个提升效率的iOS开源库推荐
文章来源:http://www.csdn.net/article/2015-07-21/2825264-27-ios-open-source-libraries/1 我热爱开源,更喜爱那些花费宝贵的业 ...
开源库Magicodes.WeChat.SDK总体介绍
目录 1 概要 1 2 主要特点 2 3 架构图 8 3.1 构造器——WeChatSDKBuilder 8 3.2 函数管理器——WeChatF ...

随机推荐

cookies , sessionStorage 及 localStorage 的初步的区别
cookies 保存在浏览器中,关闭浏览器后再次打开,任然存在,当然可能存在一定的有效期.(仅限存在同一台电脑,同一个浏览器中) Session依赖Cookie!! sessionStorage ...
ACE在Ubuntu下的安装和编译
之前写了很多linux下的底层网络API的demo,这些demo可用于了解底层的网络通信过程,但是想做出好的服务器用于实际业务还是非常困难的,需要大量的代码实现,移植性也非常差,想要写出高性能架构的服 ...
ZROI 暑期高端峰会 A班 Day5 杂题选讲
CF469E \(n\) 个需要表示的数,请使用最少的 \(2^k\) 或 \(-2^k\) 表示出所有需要表示的数.输出方案. \(n\le 10^5,|a_i|\le 10^5\). 首先每个数肯 ...
K8s容器资源限制
在K8s中定义Pod中运行容器有两个维度的限制: 1. 资源需求:即运行Pod的节点必须满足运行Pod的最基本需求才能运行Pod. 如: Pod运行至少需要2G内存,1核CPU 2. 资源限额: ...
webpack 配置多入口文件，输出多出口文件
const path = require('path') module.exports = { // 入口文件的配置项 entry: { // 入口文件 entry: './src/entry.js' ...
Hotspot的Metaspace
Meta Space是JDK1.8引入的,在JDK1.8使用的是方法区,永久代(Permnament Generation).元空间存储的是元信息,使用的是操作系统的本地内存(Metaspace与Pe ...
使用vue搭建应用三引入scss
Css.Sass.Scss的含义及区别 Css(Cascading Style Sheets) 层叠样式表 Sass(Syntactically Awesome StyleSheets) 是一款强化 ...
Linux内核宏DEVICE_ATTR使用
1.前言在Linux驱动程序编写中,使用DEVICE_ATTR宏,可以定义一个struct device_attribute设备属性,并使用sysfs的API函数,便可以在设备目录下创建出属性文件, ...
Matlab匿名函数
Matlab可以通过function去定义一些功能函数,这使得代码变得简洁和高效.但是如果遇到的是一些简单的数学公式组成的函数表达式,继续用function去定义函数,似乎显得有些冗杂和多余.这时候, ...
ETCD 添加节点报错 tocommit(2314438) is out of range [lastIndex(0)]. Was the raft log corrupted, truncated, or lost?
生产环境中一台ETCD节点宕机之后,添加新的节点的时候出现以下错误, tocommit(2314438) is out of range [lastIndex(0)]. Was the raft lo ...

OCR1：开源库

OCR1：开源库的更多相关文章

随机推荐

热门专题