py库： Tesseract-OCR（图像文字识别）

http://blog.csdn.net/u012566751/article/details/54094692　　Tesseract-OCR入门使用1

http://blog.csdn.net/u012566751/article/details/54136836　　Tesseract-OCR入门使用2

http://blog.csdn.net/u012566751/article/details/54141109　　Tesseract-OCR入门使用3

https://github.com/tesseract-ocr/tesseract/wiki/APIExample　　Tesseract API Example

当前环境：win7，python3.6.0，pyCharm4.5。　　python目录是：c:/python3/

安装：

一、安装 tesseract 库

cd c:/python3/Scripts/

pip install tesseract

二、装程序：

https://github.com/UB-Mannheim/tesseract/wiki

这是非官方下载包，下载并安装4.0：　　https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.0.0-alpha.20170804.exe

安装时注意勾选简体中文，默认安装，安装完毕后，敲命令（看看装的怎么样了，支持什么语言）：

cd C:\Program Files (x86)\Tesseract-OCR

tesseract

tesseract -v

tesseract --list-langs　　#查看Tesseract-OCR支持语言

三、改文件：

C:\Python3\Lib\site-packages\pytesseract\pytesseract.py，找到这两行：

# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY

tesseract_cmd = 'tesseract'

改为这样：

# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY

#tesseract_cmd = 'tesseract'

tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'

四、pyCharm里运行，就可以进行文字识别了：

（先用画图，用微软雅黑字体，写几个数字、和诗词，保存成：ci.png）

from PIL import Image

import pytesseract

text = pytesseract.image_to_string(Image.open('ci.png'), lang='chi_sim')

print(text)

...

py库： Tesseract-OCR（图像文字识别）的更多相关文章

[免费下载应用]iNeuKernel.Ocr 图像数据识别与采集原理和产品化应用
目录 1..... 应用概述... 2 2..... 免费下载试用... 2 3..... 视频介绍... 2 4..... iNeuLink.Ocr图像数据采集应用... 2 5... ...
一篇文章搞定百度OCR图片文字识别API
一篇文章搞定百度OCR图片文字识别API https://www.jianshu.com/p/7905d3b12104
图像文字识别(OCR)用什么算法小结
说明:主要考虑深度学习的方法,传统的方法不在考虑范围之内. 1.文字识别步骤 1.1detection:找到有文字的区域(proposal). 1.2classification:识别区域中的文字. ...
基于Tesseract实现图片文字识别
一.简介 Tesseract是一个开源的文本识别[OCR]引擎,可通过Apache 2.0许可获得.它可以直接使用,或者使用API从图像中提取打印的文本,支持多种语言.该软件包包含一个ORC引擎[l ...
Python识别验证码，基于Tesseract实现图片文字识别
一.简介 Tesseract是一个开源的文本识别[OCR]引擎,可通过Apache 2.0许可获得.它可以直接使用,或者使用API从图像中提取打印的文本,支持多种语言.该软件包包含一个ORC引擎[li ...
Java文字识别软件-调用百度ocr实现文字识别
java_baidu_ocr Java调用百度OCR文字识别API实现图片文字识别软件这是一款小巧方便,强大的文字识别软件,由Java编写,配上了窗口界面调用了百度ocr文字识别API 识别精度高 ...
腾讯云OCR图片文字识别
一. OCR OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗.亮的模式确定其形状,然后用字符识别 ...
PHP百度AI的OCR图片文字识别
第一步可定要获取百度的三个东西要到百度AI网站(http://ai.baidu.com/)去注册然后获得 -const APP_ID = '请填写你的appid'; -const API_KEY ...
有道自然语言翻译和文字识别OCR(图片文字识别)接口调用
官网 http://ai.youdao.com 文档地址 http://ai.youdao.com/docs/doc-ocr-api.s#p01 在Python中调用api. #/usr/bin/en ...

随机推荐

table 设置每列的颜色
ISBN Title Price 3476896 My first HTML $53 5869207 My first CSS $49 <!DOCTYPE html> <html ...
SQL Server CONVERT() 日期转换为新数据类型的通用函数
http://www.w3school.com.cn/sql/func_convert.asp
使用Html Agility Pack快速解析Html内容
Html Agility Pack 是一个开源的.NET 方案HTML解析器. 开源地址:https://github.com/zzzprojects/html-agility-pack 用法:vs上 ...
LeetCode——11. Container With Most Water
一.题目链接:https://leetcode.com/problems/container-with-most-water/ 二.题目大意: 给定n个非负整数a1,a2....an:其中每一个整数对 ...
P1916小书童--大战蚂蚁
链接题解:(这里蚂蚁0血也算活...) #include<iostream>#include<cstdio>#include<cmath>using namesp ...
csrf攻击使用js 调用 php文件的方法(还没实践)
https://www.cnblogs.com/Im-Victor/p/9306535.html
计时器setInterval()
在执行时,从载入页面后每隔指定的时间执行代码. 语法: setInterval(代码,交互时间); 参数说明: 1. 代码:要调用的函数或要执行的代码串. 2. 交互时间:周期性执行或调用表达式之间的 ...
MySQL学习----多版本并发mvcc
MySQL中的大多数事务性存储引擎实现的都不是简单的行级锁.基于提升并发性能的考虑,他们一般实现了多版本并发控制(mvcc).不仅是mysql,包括oracle,postgresql等其他数据库也实现 ...
win10以上系统设定PPTP自动拨号
:bohaorasdial adsl 123 123if not %errorlevel% == 0 goto :bohaoexit rasdial adsl 123 123 rasdial是开始拨号 ...
无法定位序数****于动态链接库LIBEAY32.dll上
问题出现原因: GNS3打开出现问题尝试的方法如下: 创建脚本: @echo 开始注册 copy libeay32.dll %windir%\system32 regsvr32 %windir%\s ...

py库： Tesseract-OCR（图像文字识别）

py库： Tesseract-OCR（图像文字识别）的更多相关文章

随机推荐

热门专题