python tesseract-ocr 图文识别 (windows基础环境搭建)
python tesseract-ocr 图文识别
一,先进行Tesserocr安装下载
1,先点击进入下面的百度网盘
链接: https://pan.baidu.com/s/1G5vZO2B4Mxx5JaiQtfIqCw 提取码: mp1u
打开百度网盘之后知道下面这两个文件
tesserocr-2.4.0-cp37-cp37m-win_amd64.whl
tesseract-ocr-w64-setup-v5.0.0.20190623.exe
如果上面百度网盘打不开,可以尝试打开下面的百度网盘:
链接:https://pan.baidu.com/s/1-a69qU0aFu8_IlYzy0QgMQ 提取码:yd7i
链接:https://pan.baidu.com/s/1Tt9vRsbk7uX9VVTGb36OiA 提取码:1yhh
2,待下载完毕之后运行tesseract-ocr-w64-setup-v5.0.0.20190623.exe文件,
我的是安装在F:\Tesseract-OCR,一直next下去。
需要选择的选项,看下图。其中语言要选择简体中文,安装时会下载语言包,可能等待一段时间。


安装完成之后的目录如下:
我的tesseract-ocr是安装在F:\Tesseract-OCR,

下面开始最重要的步骤:
将F:\Tesseract-OCR里面的 tessdata 整个文件夹一起复制到python安装目录下面

把上面网盘下载的另一个文件(tesserocr-2.4.0-cp37-cp37m-win_amd64.whl)也复制到python安装目录下面


3,开始创建tesseract-ocr环境变量
将“F:\Tesseract-OCR”添加到环境变量中。如图:

增加一个TESSDATA_PREFIX变量名,变量值还是我的安装路径F:\Tesseract-OCR\tessdata这是将语言字库文件夹添加到变量中。

打开命令终端,输入:tesseract -v,可以看到版本信息


用命令tesseract --list-langs来查看Tesseract-OCR支持语言。

二,用pip或者pycharm 安装 tesseract 和 pytesseract
1,用pip安装
其实只需安装tesseract,默认pytesseract会随着tesseract一起安装的
执行pip install tesseract
如果pytesseract没有自动安装的话,可以再次主动安装pytesseract
2,用pycharm安装


最后pytesseract,tesseract,tesserocr 都安装成功之之后,显示如下:

三,在网上下载中文识别库 chi_sim.traineddata
可以在官网下载https://github.com/tesseract-ocr/tessdata
如果官网下载很慢的话也可以在百度网盘下载 https://pan.baidu.com/s/1G5vZO2B4Mxx5JaiQtfIqCw 提取码: mp1u

四,测试一下识别效果:
用下面三张图片进行识别

代码如下:
import pytesseract
from PIL import Image
import tesserocr im=Image.open('ying_shu.png')
print(pytesseract.image_to_string(im))
im1=Image.open('ying_jianti.png')
print(pytesseract.image_to_string(im1,lang='chi_sim'))
im2=Image.open('fanti.png')
print(pytesseract.image_to_string(im2,lang='chi_tra'))
识别结果如下:

可以看到识别结果存在一定的错误,这就是识别率的问题,后期再进行优化

python tesseract-ocr 图文识别 (windows基础环境搭建)的更多相关文章
- 如何用OCR图文识别软件在文档里复制内容
ABBYY FineReader 12是一款OCR图文识别软件,可从文档中复制文本.图片和表格,粘贴到其他应用程序中.无需识别整个文档(关于ABBYY FineReader识别文档的文章,请参考解析A ...
- 怎么用OCR图文识别软件在MS Office中创建PDF文件
ABBYY PDF Transformer+是一款可创建.编辑及将PDF文件转换为其他可编辑格式的OCR图文识别软件,不仅可以从纸质文档.图像文件和任何其他流行格式创建PDF文件(相关文章请参考如何从 ...
- 【1】windows下IOS开发基础环境搭建
一.目的 本文的目的是windows下IOS开发基础环境搭建做了对应的介绍,大家可根据文档步骤进行mac环境部署: 二.安装虚拟机 下载虚拟机安装文件绿色版,点击如下文件安装 获取安装包: ...
- Windows基础环境_安装配置教程(Windows7 64、JDK1.8、Android SDK23.0、TortoiseSVN 1.9.5)
Windows基础环境_安装配置教程(Windows7 64.JDK1.8.Android SDK23.0.TortoiseSVN 1.9.5) 安装包版本 1) JDK版本包 地址: htt ...
- dos基础+环境搭建基础理论
dos基础 市面上两大操作系统 windows.*nix(unix.linux.mac.bsd(安全性比较高)) 后三种都属于unix的衍生版本 linux是为了兼容unix开发的,最后开放了源代码 ...
- IOS开发基础环境搭建
一.目的 本文的目的是windows下IOS开发基础环境搭建做了对应的介绍,大家可根据文档步骤进行mac环境部署: 二.安装虚拟机 下载虚拟机安装文件绿色版,点击如下文件安装 获取安装包: ...
- Spark环境搭建(上)——基础环境搭建
Spark摘说 Spark的环境搭建涉及三个部分,一是linux系统基础环境搭建,二是Hadoop集群安装,三是Spark集群安装.在这里,主要介绍Spark在Centos系统上的准备工作--linu ...
- (一)Hyperledger Fabric 1.1安装部署-基础环境搭建
在学习和开发hyperledger fabric的时候遇到了一些坑,现将自己的一些总结和心得整理如下,以期对大家有所帮助.本次使用的宿主机环境:ubuntu,版本:Ubuntu 16.04.3 LTS ...
- hadoop3.1.0 window win7 基础环境搭建
https://blog.csdn.net/wsh596823919/article/details/80774805 hadoop3.1.0 window win7 基础环境搭建 前言:在windo ...
- Nginx基础环境搭建
1.下载docker toolbox https://mirrors.aliyun.com/docker-toolbox/windows/docker-toolbox/ 2.选择好安装目录 一路nex ...
随机推荐
- react多级路由 重定向与404定义
在有一些功能中,往往请求地址的前缀是相同的,不同的只是后面一部份,此时就可以使用多级路由(路由嵌套)来实现此路由的定义实现. 例: 路由规则如下 admin/index admin/user 它们路由 ...
- mysql中,时间类型datetime和timestamp的区别
TIMESTAMP和DATETIME的相同点: 两者都可用来表示 YYYY-MM-DD HH:MM:SS 类型的日期. TIMESTAMP和DATETIME的不同点: 1> 两者的存储方式不一 ...
- 讯飞有一个可以根据描述文本自动生成PPT的AI接口,有趣
文档:https://www.xfyun.cn/doc/spark/PPTGeneration.html 价格方面提供了免费1000点的额度,生成一次是10点,正好100次,如果要购买的话最低要购买1 ...
- perfers-color-scheme 使用简单介绍
perfers-color-scheme 简介 prefers-color-scheme 媒体查询属性用于检测用户操作系统是否使用深色模式. 属性值 dark 表示用户操作系统使用深色模式 light ...
- CNN --Inception Module
Smiling & Weeping ---- 祝你想我 在平静的湖面 不止在失控的雪山之前 说明:Inception Module 1. 卷积核超参数选择困难,自动找到卷积的最佳组合 2. 1 ...
- FFmpeg frei0r插件使用学习
背景 ffmpeg做基本的音视频编辑还是比较简单的,但要做一些滤镜及特效就比较麻烦了.接下来看看借用frei0r插件怎么做: 简介 你可以将frei0r看作是一个"视频特效工具箱" ...
- firewall-cmd设置NAT转换
配置ipv4转发 修改servera配置文件/etc/sysctl.conf ,修改参数为1 net.ipv4.ip_forward = 1 配置生效: sysctl -p 修改网卡的zone [ro ...
- Linux 网络编程的5种IO模型 总结
背景 在网络编程中,经常会用到一些模型,在这里做一下总结. 正文 Linux 网络编程的5种IO模型:阻塞IO与非阻塞IO 这是最简单的模型,一般配合多线程来实现. Linux 网络编程的5种IO模型 ...
- jsp---------------------复选框,全选按钮
js部分:注意:<script type="text/javascript" ></script>内不能有其他内容,否则会无效,若有则另起一对<scr ...
- Node.js - fs.path模块
首先我有话说,是谁说的学完ajax就可以去vue了,太天真了我,学会js钻出来个ajax,学完ajax钻出来个node.js这一步步的,当然node不会学到太深入把表面的认识一下就可以了,这之后可能更 ...