pytesseract 使用框架
import pytesseract
import cv2 img = cv2.imread("captcha.jpg",0)
try:
img.shape
except AttributeError:
pass
else:
code = pytesseract.image_to_string(img)
print(code)
centos 安装tesseract
yum-config-manager --add-repo https://download.opensuse.org/repositories/home:/Alexander_Pozdnyakov/CentOS_7/
sudo rpm --import https://build.opensuse.org/projects/home:Alexander_Pozdnyakov/public_key
yum update
yum install tesseract
yum install tesseract-langpack-deu
接口就是pytesseract.image_to_string(),前提就是需要安装tesseract-OCR,并加入环境变量。
这里再记录一下识别中文的流程:
1. 下载二进制windows安装包
https://github.com/tesseract-ocr/tesseract/wiki/4.0-with-LSTM#400-alpha-for-windows
一键傻瓜式安装。安装完成后不要忘记把tesseract.exe所在路径加入环境变量。
2.安装简体中文包
https://github.com/tesseract-ocr/tessdata
下载chi_sim.traineddata并将其放入C:\Program Files (x86)\Tesseract-OCR\tessdata路径下。
最后,可以识别了,但是识别率惨的一批。。。。还需要我们训练自己的字体库。
pytesseract 使用框架的更多相关文章
- Pyhton开源框架(加强版)
		
info:Djangourl:https://www.oschina.net/p/djangodetail: Django 是 Python 编程语言驱动的一个开源模型-视图-控制器(MVC)风格的 ...
 - Python开源框架
		
info:更多Django信息url:https://www.oschina.net/p/djangodetail: Django 是 Python 编程语言驱动的一个开源模型-视图-控制器(MVC) ...
 - Awesome Python,Python的框架集合
		
Awesome Python A curated list of awesome Python frameworks, libraries and software. Inspired by awes ...
 - selenium3与Python3实战 web自动化测试框架   ☝☝☝
		
selenium3与Python3实战 web自动化测试框架 selenium3与Python3实战 web自动化测试框架 学习 教程 一.环境搭建 1.selenium环境搭建 Client: py ...
 - selenium3 web自动化测试框架 二:页面基础操作、元素定位方法封装、页面操作方法封装
		
学习目的: 掌握自动化框架中需要的一些基础web操作 正式步骤: 使用title_contains检查页面是否正确 # -*- coding:utf-8 -*- import time from se ...
 - 文字识别OCR开源框架的对比--Tesseract vs EasyOCR
		
 前言: OCR文字识别在目前有着比较好的应用,也出现了很多的文字识别软件,但软件是面向用户的.对于我们技术人员来说,有时难免需要在计算机视觉任务中加入文字识别,如车牌号识别,票据识别等,因此软件对 ...
 - UI自动化框架搭建之Python3
		
UI自动化框架搭建--unittest 使用的代码是Python3版本,与时俱进哈哈 解释一下我的框架目录接口(每个人框架的目录接口不一样,根据实际要求) common目录:公共模块,这个地方可以存放 ...
 - 避免重复造轮子的UI自动化测试框架开发
		
一懒起来就好久没更新文章了,其实懒也还是因为忙,今年上半年的加班赶上了去年一年的加班,加班不息啊,好了吐槽完就写写一直打算继续的自动化开发 目前各种UI测试框架层出不穷,但是万变不离其宗,驱动PC浏览 ...
 - ABP入门系列(1)——学习Abp框架之实操演练
		
作为.Net工地搬砖长工一名,一直致力于挖坑(Bug)填坑(Debug),但技术却不见长进.也曾热情于新技术的学习,憧憬过成为技术大拿.从前端到后端,从bootstrap到javascript,从py ...
 
随机推荐
- 更换pip源到国内镜像
			
1.pip国内的一些镜像 阿里云 https://mirrors.aliyun.com/pypi/simple/ 中国科技大学 https://pypi.mirrors.ustc.edu.cn/ ...
 - Linux 小记 — Ubuntu 自动化配置
			
前言 工欲善其事,必先利其器.经过多次的重复配置 ubuntu 开发坏境,我终于决定花点时间总结一下,并将其写成一个自动化配置脚本.服务器实例:ubuntu 16.04,技术栈:shell,pytho ...
 - 关于树莓派HDMI转VGA线接显示器黑屏
			
经过数种折腾,找到了解决方法,在SD卡内有个config.txt文件,在其中找到“#hdmi_safe=1”,把#消除掉,变更后成为 # uncomment if you get no picture ...
 - 从源码的角度看 React JS 中批量更新 State 的策略(下)
			
这篇文章我们继续从源码的角度学习 React JS 中的批量更新 State 的策略,供我们继续深入学习研究 React 之用. 前置文章列表 深入理解 React JS 中的 setState 从源 ...
 - 总结几个常用的系统安全设置(含DenyHosts)
			
1)禁止系统响应任何从外部/内部来的ping请求攻击者一般首先通过ping命令检测此主机或者IP是否处于活动状态如果能够ping通 某个主机或者IP,那么攻击者就认为此系统处于活动状态,继而进行攻击或 ...
 - Mongodb副本集+分片集群环境部署记录
			
前面详细介绍了mongodb的副本集和分片的原理,这里就不赘述了.下面记录Mongodb副本集+分片集群环境部署过程: MongoDB Sharding Cluster,需要三种角色: Shard S ...
 - Nginx+Tomcat+Memcached部署
			
环境清单列表:(因为只有三台电脑,所有把Nginx和memcached放到一起) 应用服务器1:192.168.51.10: 应用服务器2:192.168.55.110: memcached服务器:1 ...
 - 实验三   Java敏捷开发与xp实现
			
实验内容: 1. XP基础 2. XP核心实践 3. 相关工具 实验要求 1.没有Linux基础的同学建议先学习<Linux基础入门(新版)><Vim编辑器> 课程 2.完成实 ...
 - linux内核分析第六周学习笔记
			
LINUX内核分析第六周学习总结 标签(空格分隔): 20135328陈都 陈都 原创作品转载请注明出处 <Linux内核分析>MOOC课程 http://mooc.study.163.c ...
 - Ajax进阶 FormData对象
			
Ajax基础:http://www.cnblogs.com/-beyond/p/7919369.html xhr 2.0及FormData介绍 FormData对象 其实和 XMLHttpReques ...