Python+Selenium----处理登录图片验证码
1.说明
在做自动化测试的时候,经常会遇到登录,其中比较麻烦的就是验证码的处理,现在比较常用的图形验证码,每次刷新,得到的验证码不一致,所以,一般来说,获取验证码图片有两种方式:

(1)拿到验证码的图片链接:src=”http://cli.cncaq.com//login/to_getvericode/52”,但是这种方式有时候行不通。因为有时候会发现当前的验证码和通过提取出来的url链接打开的验证码,内容是不一样的,其内容不断发生变化。
(2)利用selenium先进行可视区域的截屏,然后定位验证码元素的位置以及大小,然后利用Image(PIL模块中)进行裁剪,得到验证码图片,然后送往验证码模块或者打码平台处理。
2.代码
方法一:获得验证码图片地址,下载到本地,然后,进行图文识别,得到验证码中的内容(但是因为同一个地址,每次访问获得的验证码也不一样,所以,当前场景并不适用)
import random # 导入 random(随机数) 模块
from selenium_demo3_test.utils.file import * #引入下载图片函数所在的py文件
yanzhengma_src = driver.find_element_by_id('imgvercodeLogin').get_attribute('src') #根据验证码img的id获得元素,并使用get_attribute方法得到图片的地址
img_url = yanzhengma_src+'.png' #根据上图看到,我当前的地址 /52结尾,所以,我这边添加后缀,方便稍后下载
file_name = random.randint(0, 100000) #生成一个100000以内的随机数
file_path = 'img\\login' #下载验证码图片的时候的保存地址,默认为当前脚本运行目录下的file_path文件夹中
save_img(img_url, file_name,file_path) #下载图片(调用的其它文件中已经写好的下载方法)_要下载的文件路径,保存的文件名,保存路径
下载文件方法:
import urllib.request
import os
import random # 导入 random(随机数) 模块 #(要下载的文件地址,保存的文件名,保存地址)
def save_img(img_url,file_name,file_path):
#保存图片到磁盘文件夹 file_path中,默认为当前脚本运行目录下的 file_path文件夹
try:
if not os.path.exists(file_path):
print('文件夹',file_path,'不存在,重新建立')
#os.mkdir(file_path)
os.makedirs(file_path)
#获得图片后缀
file_suffix = os.path.splitext(img_url)[1]
#拼接图片名(包含路径)
filename = '{}{}{}{}'.format(file_path,os.sep,file_name,file_suffix)
urllib.request.urlretrieve(img_url,filename=filename)
print('********************************文件保存成功')
except IOError as e:
print('文件操作失败',e)
except Exception as e:
print('错误 :',e)
方法二:截屏,然后裁剪出验证码,再进行图片识别
#截图裁剪出验证码,并写入验证码输入框中(保存地址,验证码元素,验证码输入框元素)
jietu_xieru(driver,'img\\login\\','imgvercodeLogin','verfieldUserText')
截图并裁剪图片以及图文识别的方法:
from PIL import Image
import random #导入 random(随机数) 模块
import pytesseract #导入识别验证码信息包
import time #截图,裁剪图片并返回验证码图片名称
# _save_url 保存路径 ;yuansu 验证码元素标识
def image_cj(driver,_save_url,yuansu):
try:
_file_name = random.randint(0, 100000)
_file_name_wz = str(_file_name) + '.png'
_file_url = _save_url + _file_name_wz
driver.get_screenshot_as_file(_file_url) # get_screenshot_as_file截屏
captchaElem = driver.find_element_by_id(yuansu) # # 获取指定元素(验证码)
# 因为验证码在没有缩放,直接取验证码图片的绝对坐标;这个坐标是相对于它所属的div的,而不是整个可视区域
# location_once_scrolled_into_view 拿到的是相对于可视区域的坐标 ; location 拿到的是相对整个html页面的坐标
captchaX = int(captchaElem.location['x'])
captchaY = int(captchaElem.location['y'])
# 获取验证码宽高
captchaWidth = captchaElem.size['width']
captchaHeight = captchaElem.size['height'] captchaRight = captchaX + captchaWidth
captchaBottom = captchaY + captchaHeight imgObject = Image.open(_file_url) #获得截屏的图片
imgCaptcha = imgObject.crop((captchaX, captchaY, captchaRight, captchaBottom)) # 裁剪
yanzhengma_file_name = str(_file_name) + '副本.png'
imgCaptcha.save(_save_url + yanzhengma_file_name)
return yanzhengma_file_name
except Exception as e:
print('错误 :', e) # 获取验证码图片中信息(保存地址,要识别的图片名称)
def image_text(_save_url,yanzhengma_file_name):
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files (x86)\Tesseract-OCR\tesseract'
yanzhengma_file_url = 'F:\\Python\\workspace\\selenium_demo3_test\\test\\case\\PT\\'+ _save_url
image = Image.open(yanzhengma_file_url + yanzhengma_file_name)
text = pytesseract.image_to_string(image)
print('$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$图片中的内容为:', text)
return text #截图并写入验证码(保存地址,验证码元素,验证码输入框元素)
def jietu_xieru(driver,_save_url,yuansu,yanzhma_text):
# 截图当前屏幕,并裁剪出验证码保存为:_file_name副本.png,并返回名称
yanzhengma_file_name = image_cj(driver,_save_url, yuansu) ##对页面进行截图,弹出框宽高(因为是固定大小,暂时直接写死了)
# 获得验证码图片中的内容
text = image_text(_save_url, yanzhengma_file_name)
# 写入验证码
driver.find_element_by_id('verfieldUserText').send_keys(text)
time.sleep(2)
3.登录
from selenium import webdriver #引入浏览器驱动
import time
from selenium.webdriver.common.action_chains import ActionChains # 引入 ActionChains 类进行鼠标事情操作
import pytesseract #导入识别验证码信息包
from PIL import Image
#from .utils.log import logger 引入日志模块
import random # 导入 random(随机数) 模块
from selenium_demo3_test.utils.file import * #引入下载图片函数所在的py文件
from selenium_demo3_test.utils.image import * #引入图片操作
from selenium_demo3_test.utils.llqi import * #引入浏览器操作
#coding=utf-8 driver = llq_qudong('Chrome')
open_url(driver,'http://www.cncaq.com/') denlu =driver.find_element_by_id('top_login_a') #根据id获取登录元素
ActionChains(driver).click(denlu).perform() #点击登录,打开弹出层
driver.find_element_by_id('loginNameText').send_keys('188XXXXXXXX')
driver.find_element_by_id('passwordText').send_keys('')
time.sleep(2) #截图裁剪出验证码,并写入验证码输入框中(保存地址,验证码元素,验证码输入框元素)
jietu_xieru(driver,'img\\login\\','imgvercodeLogin','verfieldUserText')
driver.find_element_by_xpath('//*[@id="loginForm"]/div[6]/button').click() #点击登录 _user_name = driver.find_element_by_xpath('//*[@id="userWrap"]/div/p').get_attribute('innerHTML')
user_name = '用户1'
#判断不相等,则未登录成功,则为验证码输入错误(此时,只考虑验证码,且图文识别并非百分之百正确)一直循环读取验证码输入
while _user_name != user_name:
jietu_xieru(driver, 'img\\login\\', 'imgvercodeLogin', 'verfieldUserText')
driver.find_element_by_xpath('//*[@id="loginForm"]/div[6]/button').click() # 点击登录
_user_name = driver.find_element_by_xpath('//*[@id="userWrap"]/div/p').get_attribute('innerHTML')
else:
print('#############################################登录成功#############################################')
pass
Python+Selenium----处理登录图片验证码的更多相关文章
- Selenium获取动态图片验证码
Selenium获取动态图片验证码 关于图片验证码的文章,我想大家都有一定的了解了. 在我们做UI自动化的时候,经常会遇到图片验证码的问题. 当开发不给咱们提供万能验证码,或者测试第三方网站比如知乎的 ...
- 使用Python+Selenium模拟登录QQ空间
使用Python+Selenium模拟登录QQ空间爬QQ空间之类的页面时大多需要进行登录,研究QQ登录规则的话,得分析大量Javascript的加密解密,这绝对能掉好几斤头发.而现在有了seleniu ...
- python+selenium,实现带有验证码的自动化登录功能
python+selenium的环境准备,请自行安装完成,这里直接贴代码,方便做项目时直接使用. import time from selenium import webdriver from PIL ...
- Python + Selenium 实现登录Office 365
最近捡起之前用的Python + Selenium实现工作中需要的登录Office 365功能.(吐槽:国内网络真是卡,登录Office 365实属不易.另外Selenium这样的网站都要墙,无法理解 ...
- Python简单的制作图片验证码
-人人可以学Python--这里示范的验证码都是简单的,你也可以把字符扭曲 人人可以学Python.png Python第三方库无比强大,PIL 是python的一个d第三方图片处理模块,我们也可以使 ...
- python+selenium自动化登录dnf11周年活动界面领取奖励登录部分采坑总结[1]
背景: Dnf的周年庆活动之一,游戏在6月22日 06:00~6月23日 06:00之间登陆过游戏后可以于6月25日 16:00~7月04日 06:00领取奖励 目标:连续四天自动运行脚本,自动领取所 ...
- Spingmvc项目注册登录图片验证码(比较灵活的验证码)
最近项目中注册模块要加一个图片验证码功能. 写下来记录下. 1:首先用什么实现,我用的servlet. 后台java代码:RandomValidateCode 类 ,这个类是生成随即验证码和干扰线,可 ...
- Python爬虫模拟登录带验证码网站
问题分析: 1.爬取网站时经常会遇到需要登录的问题,这是就需要用到模拟登录的相关方法.python提供了强大的url库,想做到这个并不难.这里以登录学校教务系统为例,做一个简单的例子. 2.首先得明白 ...
- Python+selenium之截图图片并保存截取的图片
本文转载:http://blog.csdn.net/u011541946/article/details/70141488 http://www.cnblogs.com/timsheng/archiv ...
随机推荐
- centos6.5升级默认的Mysql到5.5方法
0.用lsb_release -a 查看linux系统的版本 1.官网下载bundle或rpm版2.解压 tar -xvf MySQL-xxx.tar或 MySQL-server-xxx.rpm和My ...
- Linux CentOS安装Azure Cli工具
vim /etc/yum.repos.d/epel.repo [epel] name=epel baseurl=http://mirrors.sohu.com/fedora-epel/6/$basea ...
- VMware Workstation虚拟机安装Windows 7系统
1.进入VMware Workstation虚拟机软件界面,选择新建虚拟机
- Java接口定义和实现
1. 使用interface来定义一个接口.接口定义类似类的定义,分为接口的声明和接口体,其中接口体由常量定义和方法定义两部分组成.定义接口的基本格式如下: [修饰符] interface 接口名 [ ...
- 快速实现CentOS7安装python-pip
1.首先检查linux有没有安装python-pip包,终端执行 pip -V [root@ network-scripts]# pip -V -bash: pip: command not foun ...
- java不定参数列表---乔老师没讲,但是传智有讲
**public static void sum(int i,int...srgs){** package com.xml; public class dremo1 { public static v ...
- SharePoint 2013上传AI格式文件,再次下载后变成了PS格式文件
问题: SharePoint 2013上传AI格式文件,再次下载后变成了PS格式文件 需要下载副本才能显示AI格式 解决办法有两个: 第一种,在客户端机器1. Click Start, click R ...
- java多线程无锁和工具类
1 无锁 (1) cas (compare and swap) 设置值的时候,会比较当前值和当时拿到的值是否相同,如果相同则设值,不同则拿新值重复过程:注意,在设置值的时候,取值+比较+设值 是一条c ...
- 1.3 xss原理分析与剖析(4)
0×01 URL编码 URL只允许用US-ASCII字符集中可打印的字符(0×20—0x7x),其中某些字符在HTTP协议里有特殊的意义,所以有些也不能使用.这里有个需要注意的,+加号代表URL编码的 ...
- hdu1050
#include <cstdio> #include <algorithm> using namespace std; #define SIZE 205 struct Data ...