python ocr中文识别库 tesseract安装及问题处理

这个破东西，折腾了快1个小时，网上的教材太乱了。

我解决的主要是windows的问题

先下载exe。（一看到这个，我就有种预感，不妙）

https://digi.bib.uni-mannheim.de/tesseract/

选好自己的机型，

最新版的，可能会采坑啊

安装时可以添加支持的语言包，如下界面最后一个选项点开选择，我们可以选择简体中文 Chiness(Simplified)。多选几个吧

然后下一步。

完成后，添加环境变量

第一个环境变量

再配第二环境变量

我的机器运行提示要在这里找tessdata

Failed to init API, possibly an invalid tessdata path

就从安装目录下，直接把tessdata 文件夹里的内容都复制到

不要问为什么，这个缺德软件就这样

下一步安装

pip install tesserocr pillow

如果提示c++什么的，不要安装，使用

如果通过 pip 安装失败，可以尝试 Anaconda 下的 conda 来安装：

conda install -c simonflueckiger tesserocr pillow

亲测有效。

还有一种办法，我没试过，应该也可以

我的解决办法是：在这里下载对于的.whl文件

下载地址：https://github.com/simonflueckiger/tesserocr-windows_build/releases

我下载的版本为：tesserocr-2.2.2-cp36-cp36m-win_amd64.whl （注意版本号啊）

将文件复制到c盘中进行安装

最后一步

pip install pytesseract

最后上代码

import pytesseract

from PIL import Image

image = Image.open(r'd:\image.png')

result =pytesseract.image_to_string (image,lang='eng')

print(result)

　　亲测有效啊！！

python ocr中文识别库 tesseract安装及问题处理的更多相关文章

开源OCR识别库-Tesseract介绍
最近在github上面看到一个开源的ocr文字识别库,感觉效果还可以,所以在这里介绍一下,这个项目的原地址在:https://github.com/tesseract-ocr/tesseract. t ...
[Python学习] Linux环境下的Python配置，必备库的安装配置
1.默认Python安装情况一般情况,Linux会预装Python的,版本较低,比如Ubuntu15的系统一般预装的是Python2.7.10. 使用命令:which python可以查看当前的py ...
Python基础之第三方库gevent安装
安装gevent库: 想要安装gevent库,我们需要确定pip版本: 使用 pip3 list: 我们可以发现pip版本为19.3.1,如果你们的pip版本不是最新版可以使用命令python -m ...
怎么在OCR文字识别软件中安装和启动 OCR文字识别软件 Hot Folder
默认情况下,ABBYY Hot Folder 会与 ABBYY FineReader 12 一起安装到计算机中.(关于ABBYY FineReader 12请参考ABBYY FineReader 12 ...
Python 人工智能之人脸识别 face_recognition 模块安装
Python人工智能之人脸识别face_recognition安装 face_recognition 模块使用系统环境搭建系统环境 Ubuntu / deepin操作系统 Python 3.6 py ...
在Mac上 python中使用tesseract OCR (Pytesser) 识别图片中的文字
仓库地址:https://github.com/RobinDavid/Pytesser brew install tesseract sudo pip install opencv-python 安装 ...
OCR库Tesseract初探
1.Tesseract 安装及使用一款由HP实验室开发由Google维护的开源OCR(Optical Character Recognition , 光学字符识别)引擎,与Microsoft Off ...
Mac os 下 python爬虫相关的库和软件的安装
由于最近正在放暑假,所以就自己开始学习python中有关爬虫的技术,因为发现其中需要安装许多库与软件所以就在这里记录一下以避免大家在安装时遇到一些不必要的坑. 一. 相关软件的安装: 1. h ...
tesseract ocr文字识别Android实例程序和训练工具全部源代码
tesseract ocr是一个开源的文字识别引擎,Android系统中也可以使用.可以识别50多种语言,通过自己训练识别库的方式,可以大大提高识别的准确率. 为了节省大家的学习时间,现将自己近期的学 ...

随机推荐

【Beta】Phylab 发布说明
Phylab Beta阶段发布说明一.发布地址 Phylab 二.新功能 1. Markdown(Html)报告生成在生成报告界面可以选择报告生成方式:Latex或Markdown模板.目前支持M ...
深度解析 ASP.NET MVC 5
ASP.NET MVC基础 IoC容器 ASP.NET MVC可扩展性 ASP.NET MVC Filters & Cache ASP.NET MVC AJAX ASP.NET MVC Cli ...
android测试和iOS测试的区别
一.常识性区别二.导航方式 iOS:Tab放在页面底部,不能通过滑动来切换,只能点击.也有放在上面的,也不能滑动,但有些Tab本身可以滑动,比如天猫的.还有新闻类的应用. Android:一般放在页 ...
HandlerMethodArgumentResolver SpringMVC 参数解析继承关系以及各解析器解析类型
HandlerMethodArgumentResolver SpringMVC 参数解析继承关系以及各解析器解析类型 I HandlerMethodArgumentResolver (org.spr ...
pycharm 生成requirements.txt
在命令行中输入 pip freeze>requirements.txt 1 安装requirements文件中的包 pip install -r requirements.txt
SpringMVC request 得到文件路径
1.java中的路径 File directory = new File("abc"); // 对于getCanonicalPath()函数,“."就表示当前的文件夹,而 ...
Ant Design Pro 子界面传值
Python爬取视频指南
摘自:https://www.jianshu.com/p/9ca86becd86d 前言前两天尔羽说让我爬一下菜鸟窝的教程视频,这次就跟大家来说说Python爬取视频的经验正文 https://w ...
MongoDB开发深入之三：复制
复制是基于操作日志oplog,相当于MySQL中的二进制日志,只记录发生改变的记录,复制是将主节点的oplog日志同步并应用到其他从节点的过程. 首先要理解两个概念:1.复制:提供冗余和高可用性:2. ...
DevExpress XtraReport - 动态加载报表布局模板
XtraReport的报表模板文件是.repx,下面的代码演示动态加载报表布局模板. XtraReport mReport = new XtraReport(); mReport.LoadLayout ...

python ocr中文识别库 tesseract安装及问题处理

python ocr中文识别库 tesseract安装及问题处理的更多相关文章

随机推荐

热门专题