图像_pytesseract

2024-11-10 08:13:29 原文

所需模块

①安装PIL：pip install Pillow（之前的博客中有写过）

②安装pytesser3：pip install pytesser3

③安装pytesseract：pip install pytesseract

④安装autopy3：

先安装wheel：pip install wheel

下载autopy3-0.51.1-cp36-cp36m-win_amd64.whl【点击打开链接】

执行命令：pip install E:\360安全浏览器下载\autopy3-0.51.1-cp36-cp36m-win_amd64.whl

##使用pip install autopy3时会报错如下：

④安装Tesseract-OCR：百度直接搜索Tesseract-OCR下载即可，Windows环境安装tesseract-ocr 4.00并配置环境变量

64位的安装包http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe

简体字识别包：https://raw.githubusercontent.com/tesseract-ocr/tessdata/4.00/chi_sim.traineddata

这里要说明的是安装Tesseract-OCR后，其不会被默认添加至环境变量path中，已导致如下报错：

解决办法有两种：（先找到Tesseract-OCR安装文件夹，再找到tesseract.exe文件）

我这里的绝对路径是：D:\python\Tesseract-OCR\tesseract.exe，环境变量路径则是：D:\python\Tesseract-OCR

①将此路径添加至环境变量path中（不过我是这么做的，但是PyCharm仍旧报错）

②找到pytesseract.py文件

我这里是C:\Users\admin\AppData\Local\Programs\Python\Python36\Lib\site-packages\pytesseract\pytesseract.py

将文件中的tesseract_cmd修改为上方的绝对路径

打开命令终端，输入：tesseract -v，可以看到版本信息

实例演示

进入正题，如何识别图像中文字

上原图：（这句是海上钢琴师中的一句经典台词）

接下来我们要通过python的pytesseract来识别图片中的字符了

#   _*_ coding:utf-8 _*_

import pytesseract

from PIL import Image

__author__ = 'admin'

im = Image.open(r'C:\Users\admin\Desktop\example.png')

print(pytesseract.image_to_string(im))

如果报错：

则修改代码如下：

import pytesseract

from PIL import Image

tessdata_dir_config = '--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"'

im = Image.open(r'./tupian.png')

print(pytesseract.image_to_string(im, config=tessdata_dir_config))

如果要显示中文：

from PIL import Image

import pytesseract

text = pytesseract.image_to_string(Image.open('./XLF5G7F6SHFCO4G0.jpg'),lang='chi_sim')

print(text)

结束

图像_pytesseract的更多相关文章

C#中如何调整图像大小
在本篇文章中,我将介绍如何在C#中来调整你想要的图像大小.要实现这一目标,我们可以采取以下几个步骤: 1.首先要获取你想要调整大小的图像: string path = Server.MapPath(& ...
基于window7+caffe实现图像艺术风格转换style-transfer
这个是在去年微博里面非常流行的,在git_hub上的代码是https://github.com/fzliu/style-transfer 比如这是梵高的画这是你自己的照片然后你想生成这样怎么实现 ...
超全面的.NET GDI+图形图像编程教程
本篇主题内容是.NET GDI+图形图像编程系列的教程,不要被这个滚动条吓到,为了查找方便,我没有分开写,上面加了目录了,而且很多都是源码和图片~ (*^_^*) 本人也为了学习深刻,另一方面也是为了 ...
git图像化界面GUI的使用
GIT学习笔记一. 基础内容 1.git是一个版本控制软件,与svn类似,特点是分布式管理,不需要中间总的服务器,可以增加很多分支. 2.windows下的git叫msysgit,下载 ...
CSharpGL(24)用ComputeShader实现一个简单的图像边缘检测功能
CSharpGL(24)用ComputeShader实现一个简单的图像边缘检测功能效果图这是红宝书里的例子,在这个例子中,下述功能全部登场,因此这个例子可作为使用Compute Shader的典型 ...
【.net深呼吸】WPF异步加载大批量图像
如何在WPF中加载大批量数据,并且不会阻塞UI线程,尤其是加载大量图片时,这活儿一直是很多朋友都相当关注的.世上没有最完美的解决之道,咱们但求相对较优的方案. 经过一些试验和对比,老周找到了一种算是不 ...
了解HTML图像
img <img>表示image图像,从技术上讲,<img>标签并不会在网页中插入图像,而是从网页上链接图像.<img> 标签创建的是被引用图像的占位空间. [必须 ...
四种比较简单的图像显著性区域特征提取方法原理及实现-----> AC/HC/LC/FT。
laviewpbt 2014.8.4 编辑 Email:laviewpbt@sina.com QQ:33184777 最近闲来蛋痛,看了一些显著性检测的文章,只是简单的看看,并没有深入的研究,以 ...
图像抠图算法学习 - Shared Sampling for Real-Time Alpha Matting
一.序言陆陆续续的如果累计起来,我估计至少有二十来位左右的朋友加我QQ,向我咨询有关抠图方面的算法,可惜的是,我对这方面之前一直是没有研究过的.除了利用和Photoshop中的魔棒一样的技术或者 ...

随机推荐

新鲜出炉一份Java面试清单，共200+道题
一.Java 基础 1.JDK 和 JRE 有什么区别? 答:JRE是java运行时环境,包含了java虚拟机,java基础类库.是使用java语言编写的程序运行所需要的软件环境,是提供给想运行jav ...
Dynamics CRM Solution
Default solution Dynamics comes pre-loaded with a Default Solution Contains all the base objects, en ...
idea 中maven编译速度过慢的问题的解决
解决方案一在创建Maven项目时加上 archetypeCatalog=internal 参数,如下: 解决方案二在maven的VM Options加上-DarchetypeCatalog=int ...
gaea-editor 项目使用
项目地址:https://github.com/ascoders/gaea-editor 打开编辑器界面:运行npm run docs 下载gaea-editor项目,进行调试,注意点: gaea-e ...
py-day1-1 python的基本运算符和语句
整体注释: 选中目标 ctrl + ? 基础: 运算符: ** 表示幂函数 in 和 not in : 比较运算符: 基本语法: pass 代表空代码,无意义,仅仅用于表示代码块: 引 ...
xshell 5中文破解版下载
xshell 5破解版是一款功能强大的终端模拟软件,支持Telnet.Rlogin.SSH.SFTP.Serial等远程协议,让用户能通过互联网直接连接远程主机.用户通过xshell 5破解版能轻松和 ...
语义分析之ansj_seg+word2vec的使用
语义分析,我是一个初学者,有很多东西,需要理论和实践结合后,才能理解的相对清楚. 今天,我就在语义理解中基于背景语料的情况,实现语义上下文的预测,比如,我说“王宝强”,你会想到什么?别告诉没有“马蓉” ...
[转]python实现RESTful服务（基于flask）
python实现RESTful服务(基于flask) 原文: https://www.jianshu.com/p/6ac1cab17929 前言上一篇文章讲到如何用java实现RESTful服务, ...
【maven】之打包war依赖子项目jar
比如 p-common p-core p-dao p-service p-web service项目依赖dao,dao依赖core和common,web依赖service 在使用maven tomca ...
前端入门应该掌握的html+css知识点
* 文档流元素从上自下从左到右排列,即文档流 (所以一个普通的元素前面有一个向右浮动的元素,这个元素不会和这个浮动元素发生重叠,但是如果这个普通元素前面是一个向左浮动的元素,可以看到元素会和浮动元 ...