python tesseract-ocr 图文识别

一,先进行Tesserocr安装下载

1,先点击进入下面的百度网盘
链接: https://pan.baidu.com/s/1G5vZO2B4Mxx5JaiQtfIqCw 提取码: mp1u
打开百度网盘之后知道下面这两个文件
tesserocr-2.4.0-cp37-cp37m-win_amd64.whl
tesseract-ocr-w64-setup-v5.0.0.20190623.exe
如果上面百度网盘打不开,可以尝试打开下面的百度网盘:
链接:https://pan.baidu.com/s/1-a69qU0aFu8_IlYzy0QgMQ 提取码:yd7i
链接:https://pan.baidu.com/s/1Tt9vRsbk7uX9VVTGb36OiA 提取码:1yhh

2,待下载完毕之后运行tesseract-ocr-w64-setup-v5.0.0.20190623.exe文件,

我的是安装在F:\Tesseract-OCR一直next下去。

需要选择的选项,看下图。其中语言要选择简体中文,安装时会下载语言包,可能等待一段时间。

安装完成之后的目录如下:

我的tesseract-ocr是安装在F:\Tesseract-OCR,

下面开始最重要的步骤:

将F:\Tesseract-OCR里面的 tessdata 整个文件夹一起复制到python安装目录下面

把上面网盘下载的另一个文件(tesserocr-2.4.0-cp37-cp37m-win_amd64.whl)也复制到python安装目录下面

 3,开始创建tesseract-ocr环境变量

将“F:\Tesseract-OCR”添加到环境变量中。如图:

增加一个TESSDATA_PREFIX变量名,变量值还是我的安装路径F:\Tesseract-OCR\tessdata这是将语言字库文件夹添加到变量中。

打开命令终端,输入:tesseract -v,可以看到版本信息

用命令tesseract --list-langs来查看Tesseract-OCR支持语言。

二,用pip或者pycharm 安装 tesseract 和 pytesseract

1,用pip安装

其实只需安装tesseract,默认pytesseract会随着tesseract一起安装的
执行pip install tesseract
如果pytesseract没有自动安装的话,可以再次主动安装pytesseract

2,用pycharm安装

最后pytesseract,tesseract,tesserocr 都安装成功之之后,显示如下:

三,在网上下载中文识别库 chi_sim.traineddata

可以在官网下载https://github.com/tesseract-ocr/tessdata

如果官网下载很慢的话也可以在百度网盘下载 https://pan.baidu.com/s/1G5vZO2B4Mxx5JaiQtfIqCw 提取码: mp1u

四,测试一下识别效果:

用下面三张图片进行识别

代码如下:

import pytesseract
from PIL import Image
import tesserocr im=Image.open('ying_shu.png')
print(pytesseract.image_to_string(im))
im1=Image.open('ying_jianti.png')
print(pytesseract.image_to_string(im1,lang='chi_sim'))
im2=Image.open('fanti.png')
print(pytesseract.image_to_string(im2,lang='chi_tra'))

识别结果如下:

可以看到识别结果存在一定的错误,这就是识别率的问题,后期再进行优化

python tesseract-ocr 图文识别 (windows基础环境搭建)的更多相关文章

  1. 如何用OCR图文识别软件在文档里复制内容

    ABBYY FineReader 12是一款OCR图文识别软件,可从文档中复制文本.图片和表格,粘贴到其他应用程序中.无需识别整个文档(关于ABBYY FineReader识别文档的文章,请参考解析A ...

  2. 怎么用OCR图文识别软件在MS Office中创建PDF文件

    ABBYY PDF Transformer+是一款可创建.编辑及将PDF文件转换为其他可编辑格式的OCR图文识别软件,不仅可以从纸质文档.图像文件和任何其他流行格式创建PDF文件(相关文章请参考如何从 ...

  3. 【1】windows下IOS开发基础环境搭建

    一.目的 本文的目的是windows下IOS开发基础环境搭建做了对应的介绍,大家可根据文档步骤进行mac环境部署: 二.安装虚拟机 下载虚拟机安装文件绿色版,点击如下文件安装 获取安装包:       ...

  4. Windows基础环境_安装配置教程(Windows7 64、JDK1.8、Android SDK23.0、TortoiseSVN 1.9.5)

    Windows基础环境_安装配置教程(Windows7 64.JDK1.8.Android SDK23.0.TortoiseSVN 1.9.5) 安装包版本 1)     JDK版本包 地址: htt ...

  5. dos基础+环境搭建基础理论

    dos基础 市面上两大操作系统 windows.*nix(unix.linux.mac.bsd(安全性比较高)) 后三种都属于unix的衍生版本 linux是为了兼容unix开发的,最后开放了源代码 ...

  6. IOS开发基础环境搭建

    一.目的 本文的目的是windows下IOS开发基础环境搭建做了对应的介绍,大家可根据文档步骤进行mac环境部署: 二.安装虚拟机 下载虚拟机安装文件绿色版,点击如下文件安装 获取安装包:       ...

  7. Spark环境搭建(上)——基础环境搭建

    Spark摘说 Spark的环境搭建涉及三个部分,一是linux系统基础环境搭建,二是Hadoop集群安装,三是Spark集群安装.在这里,主要介绍Spark在Centos系统上的准备工作--linu ...

  8. (一)Hyperledger Fabric 1.1安装部署-基础环境搭建

    在学习和开发hyperledger fabric的时候遇到了一些坑,现将自己的一些总结和心得整理如下,以期对大家有所帮助.本次使用的宿主机环境:ubuntu,版本:Ubuntu 16.04.3 LTS ...

  9. hadoop3.1.0 window win7 基础环境搭建

    https://blog.csdn.net/wsh596823919/article/details/80774805 hadoop3.1.0 window win7 基础环境搭建 前言:在windo ...

  10. Nginx基础环境搭建

    1.下载docker toolbox https://mirrors.aliyun.com/docker-toolbox/windows/docker-toolbox/ 2.选择好安装目录 一路nex ...

随机推荐

  1. UIScrollView 在Autolayout下使用的一些问题

    一.UIScrollView 双指放大手势,双击放大实现 在设置UIScrollView的frame后.maxZoomScale 和 minZoomScale之后,UIScrollView会自然支持双 ...

  2. itest(爱测试) 接口测试,敏捷测试管理平台 10.4.0 发布

    一:itest work 简介 itest work 开源敏捷测试管理,包含极简的任务管理,测试管理,缺陷管理,测试环境管理,接口测试,接口Mock,还有压测 ,又有丰富的统计分析,8合1工作站.可按 ...

  3. LeetCode 621. 任务调度器 (Java)

    题目: 给定一个用字符数组表示的 CPU 需要执行的任务列表.其中包含使用大写的 A - Z 字母表示的26 种不同种类的任务.任务可以以任意顺序执行,并且每个任务都可以在 1 个单位时间内执行完.C ...

  4. FFmpeg开发笔记(二十八)Linux环境给FFmpeg集成libxvid

    ​XviD是个开源的视频编解码器,它与DivX一同被纳入MPEG-4规范第二部分的视频标准,但DivX并未开源.早期的MP4视频大多采用XviD或者DivX编码,当时的视频格式被称作MPEG-4.现在 ...

  5. Console LDAP 配置解密

    之前通过短视频向大家介绍了 Console 如何集成 LDAP,但很多小伙伴反映按照视频里的配置后不成功.今天就结合小伙伴们反映的问题来跟大家详细介绍一下. Console LDAP 完整的配置参数如 ...

  6. 串口收发UART(Verilog HDL)

    UART(Universal Asynchronous Receiver Transmitter,通用异步收发器)是一种异步串行通信协议,主要用于计算机和嵌入式系统之间的数据交换. 实现UART通信的 ...

  7. 计算机网络实验一:vlan的创建与划分

    这个是 pkt文件 有两道题 所以我是两个文件 https://pan.quark.cn/s/d4170897cb59 https://pan.quark.cn/s/da48878c77f5 发现 复 ...

  8. Masonry在视图相对关系处理中的各种“offset”

    如果我们需要设置一个view在另一个view的右边缘距离一定距离的地方,利用Masonry这么写: [a mas_makeConstraints:^(MASConstraintMaker *make) ...

  9. Codeforces Round #243 (Div. 2) Problem B - Sereja and Mirroring 题解

    http://codeforces.com/contest/426/problem/B 题意大概就是对称有关,要注意的是,当行数为奇数的时候,答案就是行数本身 #include<iostream ...

  10. hive第一课:# hive-3.1.2分布式搭建文档

    hive-3.1.2分布式搭建文档 谷歌浏览器下载网址:Google Chrome – Download the fast, secure browser from Google 华为云镜像站:htt ...