pytesser的使用
pytesser以及其依赖插件下载地址:链接: http://pan.baidu.com/s/1i3zgpjJ 密码: ueyy
在学习Webdriver的过程中遇到验证码的识别问题,问了度娘知道了pytesser能用于验证码的识别,而且代码用起来比较简单,就查了好多资料整了一天终于配置好了,记录一下。
首先安装vc 2008外部运行库(全名不记得了)vcsetup_V9.0.30729.1.239631479.exe,不然安装PIL会提示找不到xxx.bat文件,文件名也忘记了。
接着就安装PIL了,本机环境 win7 64位系统,Python2.7,安装PIL时发现没有对应的版本,查到PIL的替代:Pillow,找到对应版本安装
pytesser同时依赖tesseract-ocr,自然是继续安装tesseract-ocr了
这些都安装完了之后就是pytesser的问题了,只需要把pytesser解压到Python安装目录(自己新建工程的话就解压到工程目录就ok)就行,另外注意一下pytesser.py中第六行的import Image,改成from PIL import Image(因为我们安装的不是原版的PIL而是pillow所以要把这个也改一下)
做完这些就能使用啦!
from pytesser import *
image=Image.open("D:\\ProgramFiles\\Python27\\workspace\\fnord.tif")
print image_to_string(image)
aaarticlea/png;base64,iVBORw0KGgoAAAANSUhEUgAAAnYAAAA4CAIAAAD/+yKbAAADMUlEQVR4nO3d0XHjIBQFUOqiIFpIG3SxHfCZRlRBqmA/HFtIxna0O8/JOOdMPpInCTyZYa5BskkdAAiQvvsFAMBrErEAEELEAkAIEQsAIUQsAIQQsfCtWkmjXE/lpea0cz7Ue18PllJynZ+fcl22HQwtHOj3sx3gsDFi25+U6mQwHa0DByw1X0KslTXQxvrpj+n56Ryxl0Qtrffex6tPh1vZhOW03wftAEfsZ7HvOb2l/H41oo7Wr83eHadcF3X131C/PzQ2UXpKtrXeyjj73J1/5RKNu0tKO7W0jMVpv3famb74H/V/Vld/Zv3hAJktFC+1pvS2HdX/Uge+YIy6mtdgW0f11eBax/vVoWk0nvNzk9a3+r3TDnDIzXuxHzW/zdaBj9Yvftq7D3X1Z9bvDMLxktkscz+L3V+7PTqJxqE0Hr3V7812Hr34n/B/Vld/Zv3hAJlH7EfN01np0Trw0DqbbCUNuXZ/QfhsH4XX0bh7sCntF6L3/d5qBzjqKmKtEsNzjVG6DCu2u4hdF3vHd8+P76HuJ8GXC271e6Md4LD9E8WzZ5eO1oEvu8wxz0FYc0q5zhamLhE7X6zaXlJa397OXbad1Xm/83aAf+JzsQAQQsQCQAgRCwAhRCwAhBCxABBCxAJACBELACFELACEELEAEMJ+sQAQ4nn7xQLAr2K/WAAI8bz9YgHgV7FfLACEsF8sAISwXywAhPC5WAAIIWIBIISIBYAQIhYAQohYAAghYgEghIgFgBAiFgBCTCK2lZ7S509pUR2X1FOOahwAvt31Fyj2/KzkKyIWgNe1idhx/prOs8yl9pR6GQ6NM9uaJ/VTMdfPa9dDS8/D/FjEAvDCvjSLPSVlO/9++c7/mtffe9su/LY1pHv7XHAuqV82u7NQDMBr+2rErjdl2zlWl57L5rRW1gRdT+s3Kk9ckQaA5xOxABDiPyK295qHTN09vnQdsb2X4X5tKxaKAXhlm4gdn11KqafSe18fWSrtfIc1DRPZNPmET0mbdsZ4Hht3OxaAF+arJwAghIgFgBAiFgBCiFgACCFiASCEiAWAECIWAEKIWAAIIWIBIISIBYAQfwGo93kdAMkVLAAAAABJRU5ErkJggg==" alt="" />
pytesser的使用的更多相关文章
- Python 利用pytesser模块识别图像文字
使用的是python的pytesser模块,原先想做的是图片中文识别,搞了一段时间了,在中文的识别上还是有很多问题,这里做记录分享. pytesser,OCR in Python using the ...
- pytesser图片文本识别
python图片文本识别使用的工具是PIL和pytesser.因为他们使用到很多的python库文件,为了避免一个个工具的安装,建议使用pythonxy,这个工具的介绍可参考baidu. pytess ...
- python pytesser 的安装
安装包: 需要安装的包主要有两个: PIL 和 pytesser . PIL模块的安装不多说 pytesser 模块的安装: 下载后得到 "pytesser_v0.0.1.zip&quo ...
- Python验证码通过pytesser识别
Python安装包: 需要安装的包主要有两个: PIL 和 pytesser .tesseract (1).安装PIL:下载地址:http://www.pythonware.com/products/ ...
- python识别验证码——PIL,pytesser,pytesseract的安装
1.使用Python识别验证码需要安装Python的图像处理模块(PIL.pytesser.pytesseract) (安装过程需要pip,在我的Python中已经安装pip了,pip的安装就不在赘述 ...
- 利用pytesser识别图形验证码
简单识别 1.一般思路 验证码识别的一般思路为: 图片降噪 图片切割 图像文本输出 1.1 图片降噪 所谓降噪就是把不需要的信息通通去除,比如背景,干扰线,干扰像素等等,只剩下需要识别的文字,让图片变 ...
- Windows下Pytesser安装
安装流程 详细步骤 安装PIL 32位机器:去到PIL官网进行安装 64位机器:建议使用Pillow代替PIL,PIL官网的安装包在64位机器下无法找到,安装Pillow也非常简单,使用pip就可 ...
- 在Mac上 python中使用tesseract OCR (Pytesser) 识别图片中的文字
仓库地址:https://github.com/RobinDavid/Pytesser brew install tesseract sudo pip install opencv-python 安装 ...
- Python 安装 pytesser 处理验证码出现的问题
今天这个问题困扰了我好久,开始直接用 pip install pytesseract 安装了 pytesseract 然后出现了如下错误 Traceback (most recent call las ...
随机推荐
- android的生命周期
1.运行状态:当一个活动处于栈的顶部时,这时活动就处于活动状态,系统是不愿意回收处于活动状态的,会影响用户体验. 2.暂停状态:当一个活动不再处于栈的顶部时,但仍然可见时,这时就是暂停状态了.处于暂停 ...
- shell之“>/dev/null 2>&1” 详解(转)
今天在自己的一个技术群中又被问道了这么一个问题,于是又通俗的解释了一下,做个记录,大家看看解释是否清楚! shell中可能经常能看到:>/dev/null 2>&1 命令的结果可以 ...
- Qt 学习之路 :动态视图
Repeater适用于少量的静态数据集.但是在实际应用中,数据模型往往是非常复杂的,并且数量巨大.这种情况下,Repeater并不十分适合.于是,QtQuick 提供了两个专门的视图元素:ListVi ...
- 常用Content-type汇总
Content-Type,内容类型,用于定义网络文件的类型和网页的编码,决定浏览器将以什么形式.什么编码读取这个文件.这里汇总一下常用的,所有资料来源于网络,未经测试: 文件后缀 处理方式 .* ...
- iOS-CALayer中position与anchorPoint详解
iOS-CALayer中position与anchorPoint详解 属性介绍 CALayer通过四个属性来确定大小和位置, 分别为:frame.bounds.position.anchorPoint ...
- java web项目中的web.xml标签之context-param
WEB项目初始化过程: 在启动Web项目时,容器(比如Tomcat)会读web.xml配置文件中的两个节点<listener>和<contex-param>. 接着容器会创建一 ...
- 【Android】广播BrocastReceiver
1.Android中广播主要分为两种:标准广播和有序广播. 标准广播:完全异步执行.广播发出后,所有的广播接收器几乎在同一刻收到广播事件,没有先后顺序之分. 优点:效率高 缺点:不能被截断 有序广播: ...
- 访问nginx提示gateway timeout 504 ,发现总是当调用时间超过30s时提示504错误
解决办法: 需要修改php-fpm的配置文件 request_terminate_timeout=30s 参考文档: http://baike.baidu.com/view/641394.htm ht ...
- C#读取Visual FoxPro(*.dbf)数据并使用SqlBulkCopy插入到SqlServer 2008 R2数据表中
公司数据库从32位的SqlServer 2005升级到64位的SqlServer 2008 R2后,无法再像原来通过Link Server连接VFP同步数据,因此考虑用代码程序从VFP数据库中读取所需 ...
- jQuery 删除元素
通过 jQuery,可以很容易地删除已有的 HTML 元素. 删除元素/内容 如需删除元素和内容,一般可使用以下两个 jQuery 方法: remove() - 删除被选元素(及其子元素) empty ...