OCR

OCR(Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程。

Tesseract(识别引擎)

简介

Tesseract是一款由HP实验室开发由Google维护的开源OCR引擎，当时在1995年已经成为OCR业内最准确的三款识别引擎之一，后开源并委托Google对其进行改进、优化，特点是开源，免费，支持多语言，多平台。
Tesseract目前已作为开源项目发布在Google Project，它与Leptonica图片处理库结合，可以读取各种格式的图像并将它们转化成超过60种语言的文本。同时，与Microsoft Office Document Imaging(MODI)相比，其还可以不断训练其他库，使图像转换文本的能力不断增强。

项目地址：https://github.com/tesseract-ocr/tesseract

一、下载并安装OCR字符识别库Tesseract

1）下载

地址：https://digi.bib.uni-mannheim.de/tesseract/

下载对应版本：tesseract-ocr-w64-setup-v5.0.0.20190623.exe

2）安装

勾选额外的语言(中文)：展开Additional language data(download) --> 勾选Chinese

安装路径：C:\ProgramData\Tesseract-OCR（注意：安装路径不要出现中文）

3）配置环境变量

Path --> 编辑 --> 新建 --> C:\ProgramData\Tesseract-OCR

4）验证

Tesseract -v

二、安装Python包

pip install Pillow==
pip install pytesseract==

三、OCR识别

import pytesseract
from PIL import Image
image = Image.open('Text.png')
code = pytesseract.image_to_string(image,lang='chi_sim')
print(code)

问题：未找到Tesseract-OCR安装路径

解决：在C:\Anaconda3\Lib\site-packages\pytesseract目录下，修改pytesseract.py

使用Python基于OpenCV和Tesseract的OCR的更多相关文章

两种Python基于OpenCV的固定位置半透明水印去除方案
1. 基于 inpaint 方法(网上的方法,处理质量较低) 算法理论:基于Telea在2004年提出的基于快速行进的修复算法(FMM算法),先处理待修复区域边缘上的像素点,然后层层向内推进,直到修复 ...
python基于opencv实现人脸定位
import cv2 # 读取图片 img = cv2.imread("image.jpg") # 加载模型,模型可以从https://github.com/opencv/open ...
python基于OpenCV的人脸识别系统
想获得所有的代码,请下载(来自我的CSDN): https://download.csdn.net/download/qq_40875849/11292912 主函数: from recognitio ...
使用Python基于OpenCV的验证码识别
Blog:https://blog.csdn.net/qq_40962368/article/details/89312429(Verification_Code_Identification) 步骤 ...
使用Python基于OpenCV的图像油画特效
算法步骤: 1.获取图像的灰度图片 2.设计一个小方框(4x4/8x8 /10x10等),统计每个小方框的像素值 3.将0-255的灰度值划分成几个等级,并把第二步处理的结果映射到所设置的各个等级中, ...
BugKu 2B+基于python的opencv的安装-------CTF 盲水印的套路
BugKu杂项-2B 下载图片后,binwalk下跑一跑,发现有个zip,分离. 值得一提的是,这个zip是伪加密的. 但是你在分离的时候,伪加密的图片也给你分离出来了.这两个图片2B和B2肉眼看起来 ...
Python图像处理丨基于OpenCV和像素处理的图像灰度化处理
摘要:本篇文章讲解图像灰度化处理的知识,结合OpenCV调用cv2.cvtColor()函数实现图像灰度操作,使用像素处理方法对图像进行灰度化处理. 本文分享自华为云社区<[Python图像处理 ...
基于python的OpenCV图像1
目录 1. 读入图片并显示 import cv2 img = cv2.imread("longmao.jpg") cv2.imshow("longmao", i ...
基于 opencv 的图像处理入门教程
前言虽然计算机视觉领域目前基本是以深度学习算法为主,但实际上很多时候对图片的很多处理方法,并不需要采用深度学习的网络模型,采用目前成熟的图像处理库即可实现,比如 OpenCV 和 PIL ,对图片进 ...

随机推荐

[笔记]共享内存(shm)
一.特点共享内存允许多个不同的进程可以访问同一块内存.相较于其他IPC形式,具有速度快,效率高的特点,共享内存的存在降低了在大规模数据处理过程中内存的消耗. 二.创建共享内存 1.头文件 #incl ...
CLion配置Cygwin环境
CLion "download" 跳转到 https://cygwin.com/install.html 下载64位安装程序并安装国内添加网易镜像 http://mirrors. ...
Java并发编程的艺术笔记（十）——Semaphore详解
作用:控制同时访问某个特定资源的线程数量,用在流量控制.
Linux 特殊权限
Linux 有三个高级权限suid,sgid,sticky. 1.suid suid 属性只能运用在可执行文件上,含义是开放文件所有者的权限给其他用户,即当用户执行该执行文件时,会拥有该执行文件所有者 ...
Java 谷歌浏览器开发必备插件
1.谷歌访问助手下载网址:http://www.ggfwzs.com/ 2.Json Viewer 格式化请求接口,返回Json数据格式,可以在浏览器展示 3.Restlet client 一种类似 ...
springBoot整合spring、springMVC、mybatis
前文 1.为什么使用springBoot 众所周知,spring是Java在搭建后台时非常实用的框架,其整合了市场上几乎所有的主流框架于一体,使后端编程更加高效.快速: 而SpringBoot更是把s ...
Tomcat 8.5 配置 SSL 证书
前文: 1.以上内容仅支持Linux-Tomcat配置正文: 说一下我遇到的坑,我使用的服务器是阿里云服务器,阿里云提供的云服务器Tomcat配置SSL是7.0版本,跟8.5出入较大. 以下为阿里提 ...
Java Web开发中路径问题小结（getRequestUrl getContextUrl getServletUrl)
看以博客感觉不错,分享一下http://www.cnblogs.com/tianguook/archive/2012/08/31/2665755.html (1) Web开发中路径的几个基本概念假设 ...
linux/windows/Mac平台生成随机数的不同方法
linux平台,使用rand.Seed() //rand_linux.go package main import ( "math/rand" "time" ) ...
阶段3 3.SpringMVC·_04.SpringMVC返回值类型及响应数据类型_7 响应json数据之发送ajax的请求
编写conroller的方法 @RequestBody获取请求体的内容.当前请求体传递的是json字符串. 拿到了请求的内容

使用Python基于OpenCV和Tesseract的OCR

OCR