python3使用OCR识别图片

放假三天，闲来无事，想学下python爬虫。本想跟着网上教程操作一遍，奈何安装使用过程中出现一堆问题，并且在网上搜了一堆复制黏贴的答案，关键都不能起作用，最后终于找到一篇生效，为了以后不至于再经历这种痛苦，还是将多年未用的账号给翻了出来，将安装过程记录下来，以免以后突然心血来潮又想搞一把。

环境：

win10
python 3.10.4
tesseract-ocr-w64-setup-v5.0.1.20220118

看网上教程，使用python识别图片需要先安装tesseract，然后再安装python ocr库，才能正常使用。这里分为两部分介绍：

tesseract

安装

安装包下载路径https://digi.bib.uni-mannheim.de/tesseract/，从上面下载所需版本后，点击安装：

需要注意的是此次将“Additional language data(download)”选中，然后一路点击Next，直至安装即可。

配置环境变量

首先需要新建系统变量TESSDATA_PREFIX，设置成你的软件安装路径：（注意加上tessdata，此处网上的坑极大，没有加导致使用时报

Error opening data file C:\Program Files\Tesseract-OCR\eng.traineddata

Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory.

）

然后需要在PATH变量中添加软件的安装路径：

然后打开CMD进入图片存放路径验证是否能识别成功：（image.png可以换成带有字母或数字的图）

安装Python的OCR识别库

安装

直接使用命令安装：

pip install Pillow

pip install pytesseract

使用

在python脚步中添加如下代码，执行即可看到结果：

textPath = "C:\\Users\\umj\\Desktop\\image.jpg"

print(pytesseract.image_to_string(Image.open(textPath), lang="eng"))

参考链接：https://www.jb51.net/article/183990.htm

python3使用OCR识别图片的更多相关文章

【转】Python OCR识别图片验证码
转载自:博客对于某些网站登录的时候,往往需要输入验证码才能实现登录.如果要爬虫这类网站,往往总会比这个验证码导致无法爬取数据.以下介绍一种比较折中的方法,也是比较可行的方法: 实现思想: 1.通过截 ...
Onenote实现OCR识别图片
OCR识别推荐两个软件: 1. Tesseract:一个开源的,由谷歌维护的OCR软件. 2. Onenote:微软Office附带或者可以自己独立安装. 3. O ...
C++调用Asprise OCR识别图片
在一个识别软件中发现了Asprise OCR的"身影",上官网查了一下相关信息,发现功能挺强大的,识别印刷体应该不错,遗憾的是好像不能识别中文,不过不知道它对扭曲后的英文识别能力怎 ...
OCR识别-python3.5版
刚接触,啥子都不会,按着教程走需求:识别图片中的文字信息环境:windows系统开发语言:python3.5 使用工具类:1.pyocr 2.PIL 3.tesseract-ocr 步骤: 1.p ...
Python3.x：如何识别图片上的文字
Python3.x:如何识别图片上的文字安装pytesseract库,必须先安装其依赖的PIL及tesseract-ocr,其中PIL为图像处理库,而后面的tesseract-ocr则为google ...
python截图+百度ocr（图片识别）+ 百度翻译
一直想用python做一个截图并自动翻译的工具,恰好最近有时间就在网上找了资料,根据资料以及自己的理解做了一个简单的截图翻译工具.整理一下并把代码放在github给大家参考.界面用python自带的G ...
以API方式调用C# dll，使用OneNote2013 sp1实现OCR识别本地图片
http://www.cnblogs.com/Charltsing/p/OneNoteOCRAPI.html OneNote2013 OCR API调用使用说明2019.4.17 使用说明:1.安装干 ...
Python人工智能之图片识别，Python3一行代码实现图片文字识别
1.Python人工智能之图片识别,Python3一行代码实现图片文字识别 2.tesseract-ocr安装包和中文语言包注意:
python3 识别图片文字
1.下载相关组件安装:pip install Pillow 或下载:https://pypi.org/project/Pillow/5.2.0/ ,https://pypi.org/project ...
图片文字OCR识别-tesseract-ocr
帮助文件:https://github.com/tesseract-ocr/tesseract/blob/master/doc/tesseract.1.asc 下载地址:https://github. ...

随机推荐

Es 学习笔记 (1)
目录前言什么是es? es数据组织类比应用场景核心概念集群节点(node) 索引(Index) 文档类型(Type) 文档(Document) Mapping 核心简单域类型分片(sha ...
基于tauri打造的HTTP API客户端工具-CyberAPI
国庆长假和朋友聚会的时候,和朋友谈起最近这段时间捣鼓tauri,写了一个HTTP API客户端工具.『你写了这么多东西,其实有想过是为了啥不?』为了啥这是一个很大的命题,当初每个项目的时候都想过它应该 ...
Kafka之工作流程分析
Kafka之工作流程分析 kafka核心组成一.Kafka生产过程分析 1.1 写入方式 producer采用推(push)模式将消息发布到broker,每条消息都被追加(append)到分区(pa ...
驱动开发：内核枚举DpcTimer定时器
在笔者上一篇文章<驱动开发:内核枚举IoTimer定时器>中我们通过IoInitializeTimer这个API函数为跳板,向下扫描特征码获取到了IopTimerQueueHead也就是I ...
cURL error 1014: SSL verify failed 报错
报错 [ERROR] cURL error 1014: SSL verify failed (see https://curl.haxx.se/libcurl/c/libcurl-errors.htm ...
一天五道Java面试题----第七天（mysql索引结构，各自的优劣---------＞事务的基本特性和隔离级别）
这里是参考B站上的大佬做的面试题笔记.大家也可以去看视频讲解!!! 文章目录 1 .mysql索引结构,各自的优劣 2 .索引的设计原则 3 .mysql锁的类型有哪些 4 .mysql执行计划怎么看 ...
C# Linq 查询汇总
分组取值.求和.计数 1 var resultlist = orderllist.GroupBy(oo => new { oo.Deptname, oo.Userid, oo.Username ...
Debian安装WPS的方法
1.防止安装失败,请尽量重启电脑,关闭系统的软件商店,因为商店的权限可能会锁住pkg的配置文件,导致无法安装wps. 2.将原机残废的WPS卸载干净,卸载方法:手动或命令行操作. sudo apt r ...
Golang 和Python 几个小时前几分钟几天前的处理
在用golang爬虫的时候总会遇到 10天前 10分钟前刚刚这种很影响我们爬取正常事件所以我写了个方法来格式化这种事件 golang 版本 package utils import ( &qu ...
P6492 STEP(线段树维护左右区间pushup)
题目链接题目描述: 给定一个长度为\(~\)n\(~\)的字符序列\(~\)a,初始时序列中全部都是字符\(~\)L. 有\(~\)q\(~\)次修改,每次给定一个\(~\)x,做出如下变化: \( ...

python3使用OCR识别图片

python3使用OCR识别图片的更多相关文章

随机推荐

热门专题