WebDriver中自动识别验证码--Python实现

一、在自动化测试中，遇到验证码的处理方法有以下两种：

1、找开发去掉验证码或者使用万能验证码

2、使用OCR自动识别

这里，方法一只要和研发沟通就行。

使用pytesseract自动化识别，一般识别率不是太高，处理一般简单验证码还是没问题，例如下面这种验证码：

使用非常简单，只需下面几步：

import pytesseract

from PIL import Image

image=Image.open('new.jpg')

vcode=pytesseract.image_to_string(image)

print vcode

二、但在使用python自动化测试中会遇到一个难点，验证码怎么获取，python的webdriver API没有这样接口。baidu查之，网上只有java的解决方案，python的貌似没有，在这就将python的解决方案写下，以供需要的人参考：

解决方法：

从页面获取验证码的坐标值得，使用PIL的Image模块，截取特定的区域，代码如下：

思路：将web节目截图保存-->定位到验证码坐标-->从截图中再进行验证码位置的截图

from PIL import Image

import pytesseract

from selenium import webdriver

url='http://xxxxx.com'

driver = webdriver.Chrome()

driver.maximize_window()  #将浏览器最大化

driver.get(url)

driver.save_screenshot('f://aa.png')  #截取当前网页，该网页有我们需要的验证码

imgelement = driver.find_element_by_xpath('//img[@src="rand!loginRand.action"]')  #定位验证码

location = imgelement.location  #获取验证码x,y轴坐标

size=imgelement.size  #获取验证码的长宽

rangle=(int(location['x']),int(location['y']),int(location['x']+size['width']),int(location['y']+size['height'])) #写成我们需要截取的位置坐标

i=Image.open("f://aa.png") #打开截图

frame4=i.crop(rangle)  #使用Image的crop函数，从截图中再次截取我们需要的区域

frame4.save('f://frame4.jpg')

qq=Image.open('f://frame4.jpg')

text=pytesseract.image_to_string(qq).strip() #使用image_to_string识别验证码

print text

参考模块：

Image模块：http://effbot.org/imagingbook/image.htm#tag-Image.Image.crop

pytesseract识别验证码方法：http://www.waitalone.cn/python-php-ocr.html

原文链接：http://www.cnblogs.com/landhu/p/4968577.html

WebDriver中自动识别验证码--Python实现的更多相关文章

Python+Selenium+PIL+Tesseract真正自动识别验证码进行一键登录
Python 2.7 IDE Pycharm 5.0.3 Selenium:Selenium的介绍及使用,强烈推荐@ Eastmount的博客 PIL : Pillow-3.3.0-cp27-cp27 ...
Python - WebDriver 识别登录验证码
Python - WebDriver 识别登录验证码没什么可说的直接上代码! #-*-coding:utf-8-*- # Time:2017/9/29 7:16 # Author:YangYangJ ...
Python+selenium+pil+tesseract实现自动识别验证码
一.环境搭建准备: 1.Python下载,安装以及环境配置 2.IDE pycharm 工具下载,安装 3.ie浏览器 4.selenium 5.pil:pil第三方库的下载,win下安装whl文件, ...
Python自动化学习--Webdriver中的常用方法
from selenium import webdriver driver = webdriver.Chrome() driver.get("https://www.baidu.com/&q ...
第三百三十五节，web爬虫讲解2—Scrapy框架爬虫—豆瓣登录与利用打码接口实现自动识别验证码
第三百三十五节,web爬虫讲解2—Scrapy框架爬虫—豆瓣登录与利用打码接口实现自动识别验证码打码接口文件 # -*- coding: cp936 -*- import sys import os ...
十四 web爬虫讲解2—Scrapy框架爬虫—豆瓣登录与利用打码接口实现自动识别验证码
打码接口文件 # -*- coding: cp936 -*- import sys import os from ctypes import * # 下载接口放目录 http://www.yundam ...
webdriver中的定位\模拟\及实例
Selenium webdriver 下载 pip install selenium pip install -i https://pypi.doubanio.com/simple/ selenium ...
webdriver中的等待——主要讲解WebDriverWait()
webdriver中的等待--主要讲解WebDriverWait() 强制等待:sleep() 隐式等待:implicitly_wait() 显示等待:WebDriverWait() 与until() ...
CodeIgniter(CI)框架中的验证码
在CodeIgniter框架中,CI本身自带了验证码,但是查看文档的时候,发现: 需要新建一个表,用来存储验证码信息.因为习惯了session存储验证码信息,所以我把我认为比较好看的验证码应用在了CI ...

随机推荐

NOIP模拟:能源(二分答案)
题目描述小美为了拯救世界能源危机,她准备了 n 台蓄电池.一开始每台蓄电池有 ai 个单位的能量. 现在她想把 n 台蓄电池调整到能量相同.对于每台蓄电池可以给另一台蓄电池传递能量.但是会有能量损耗 ...
SpringMVC源码情操陶冶-View视图渲染
本节简单分析View视图对象的render方法 View接口最重要的就是render()方法,具体源码如下 /** * Render the view given the specified mod ...
使用Go和Let's Encrypt证书部署HTTPS
为什么要使用HTTPS?使用HTTPS的途径有哪些?如何用Go来部署HTTPS?拿出你的小本本,你要的干货都在这儿! HTTPS的好处我们已在之前的文章中提高好多.它加密浏览器和服务器之间的流量,保障 ...
Python学习记录----语法学习
一控制语句 http://blog.csdn.net/lynn_yan/article/details/5464911 if 语句二字典详解 http://blog.csdn.net/moodyt ...
【前端】react and redux教程学习实践，浅显易懂的实践学习方法。
前言前几天,我在博文[前端]一步一步使用webpack+react+scss脚手架重构项目中搭建了一个react开发环境.然而在实际的开发过程中,或者是在对源码的理解中,感受到react中用的最多 ...
Redis-主从配置了解
集群的作用: 主从备份, 防止主机宕机(相当于从服务器为主服务器担任备份的作用) 读写分离, 分担master的任务任务分离, 如从服务器分别分担备份工作和计算工作 redis集群方式星形: 众多 ...
pudian
https://zh.wikipedia.org/wiki/%E7%89%B9%E5%BE%81%E7%A0%81 http://www.voidcn.com/blog/lionzl/article/ ...
Java框架概述
一.框架的意义 1.什么是框架? 框架就是一些类和接口的集合,通过这些类和接口协调来完成一系列的程序实现.有了框架,我们就可以集中精力进行业务逻辑的开发而不用去关心它的技术实现以及一些辅助的业务逻辑. ...
IDE eclipse PyDev插件安装
Python安装成功后,即要配置开发环境,这里选用Eclipse, 在Eclipse中安装PyDev插件,有多种方法,这里介绍最最常用的两种. 1)使用Eclipse安装插件,打开eclipse,进入 ...
Orleans例子再进一步
Orleans例子再进一步这是Orleans系列文章中的一篇.首篇文章在此步骤现在我想再添加一个方法,到IGrains项目内,这个方法里面有个延迟3秒,然后返回一个Task<string& ...

WebDriver中自动识别验证码--Python实现

WebDriver中自动识别验证码--Python实现的更多相关文章

随机推荐

热门专题