验证码破解 | Selenium模拟登陆12306
12306官网登录的验证码破解比较简单,验证码是常规的点触类型验证码,使用超级鹰识别率比较高。
思路:
(1)webdriver打开浏览器;
(2)先对整个屏幕截屏,通过标签定位找到验证码图片,并定位到验证码图片的坐标,然后从先前截屏的图片中截取验证码部分的图片;
(3)通过超级鹰识别验证码上字的坐标;
(4)点击验证码图片上的字;
(5) 输入用户名和密码进行登录;
注意:将以下标红部分的账号等信息换成自己的即可成功
from selenium import webdriver
from selenium.webdriver import ActionChains
from chaojiying import Chaojiying
from PIL import Image
import time # 用户名和密码是自己的12306账号的用户名和密码
USERNAME =
PASSWORD = class Huochepiao(): def __init__(self):
self.bro = webdriver.Chrome()
self.url = 'https://kyfw.12306.cn/otn/login/init' def open_browser(self):
self.bro.get(self.url)
time.sleep(5) # def __del__(self):
# self.bro.quit() def find_code_img(self):
# 定位到验证码图片对应的img标签
code_img = self.bro.find_element_by_class_name('touclick-img-par')
location = code_img.location
size = code_img.size
return (location,size) def get_code_img(self,location,size):
# rangle对应的就是验证码图片的裁剪区域
rangle = (int(location['x']), int(location['y']), int(location['x'] + size['width']), int(location['y'] + size['height']))
self.bro.save_screenshot('aa.png')
i = Image.open('./aa.png')
frame = i.crop(rangle) # 根据指定区域实现裁剪
frame.save('code.png') def get_words_locations(self):
chaojiying = Chaojiying(username, password, softID) # 超级鹰账号、密码和ID更换即可
im = open('./code.png', 'rb').read()
print("超级鹰识别结果:",chaojiying.post_pic(im, 9004))
result = chaojiying.post_pic(im, 9004)['pic_str']
print("result:",result) # "x1,y1|x2,y2" --> [['x1','y1'],['x2','y2']] "x,y" --> [['x','y']]
all_coorodinates = []
if '|' in result:
li = result.split('|')
count = len(li)
for i in range(count):
xy_list = []
x = int(li[i].split(',')[0])
y = int(li[i].split(',')[1])
xy_list.append(x)
xy_list.append(y)
all_coorodinates.append(xy_list)
else:
x = int(result.split(',')[0])
y = int(result.split(',')[1])
xy_list = []
xy_list.append(x)
xy_list.append(y)
all_coorodinates.append(xy_list)
print(all_coorodinates)
return all_coorodinates def touch_click_words(self, coorodinates):
code_img = self.bro.find_element_by_class_name('touclick-img-par') for coorodinate in coorodinates:
x = coorodinate[0]
y = coorodinate[1]
ActionChains(self.bro).move_to_element_with_offset(code_img, x, y).click().perform() def login(self):
self.bro.find_element_by_id('username').send_keys(USERNAME)
self.bro.find_element_by_id('password').send_keys(PASSWORD)
self.bro.find_element_by_id('loginSub').click()
time.sleep(10) def run(self): # 1 打开浏览器
self.open_browser() # 2 找到并获取验证码图片
location,size = self.find_code_img()
self.get_code_img(location,size) # 3 识别验证码上字的坐标
all_coorodinates = self.get_words_locations() # 4 点击验证码图片上的字
self.touch_click_words(all_coorodinates) # 5 登录
self.login() if __name__ == "__main__":
hcp = Huochepiao()
hcp.run()
输出结果:
result: 186,86
[[186, 86]]

注意:本篇博文仅供学习交流相关的爬虫知识,请勿过度使用,如有任何纠纷,与本人无关。(瑟瑟发抖)
验证码破解 | Selenium模拟登陆12306的更多相关文章
- 验证码破解 | Selenium模拟登陆微博
模拟登陆微博相对来说,并不难.验证码是常规的5个随机数字字母的组合,识别起来也比较容易.主要是用到许多Selenium中的知识,如定位标签.输入信息.点击等.如对Selenium的使用并不熟悉,请先移 ...
- 验证码破解 | Selenium模拟登录简书
使用超级鹰打码平台处理登录的文字点击验证码 import time from io import BytesIO from PIL import Image from selenium import ...
- 验证码破解 | Selenium模拟登录知乎
import requests import re import execjs import time import hmac from hashlib import sha1 class Zhi ...
- Selenium模拟登陆百度贴吧
Selenium模拟登陆百度贴吧 from selenium import webdriver from time import sleep from selenium.webdriver.commo ...
- selenium 模拟登陆豆瓣,爬取武林外传的短评
selenium 模拟登陆豆瓣,爬去武林外传的短评: 在最开始写爬虫的时候,抓取豆瓣评论,我们从F12里面是可以直接发现接口的,但是最近豆瓣更新,数据是JS异步加载的,所以没有找到合适的方法爬去,于是 ...
- 使用selenium模拟登陆新浪微博
1.selenium基本使用 1.selenium安装及基本操作 selenium是一个自动化测试工具,它支持各种浏览器,包括Chrome,Safari,Firefox等主流界面浏览器驱动,也包括Ph ...
- 使用selenium模拟登陆淘宝、新浪和知乎
如果直接使用selenium访问淘宝.新浪和知乎这些网址.一般会识别出这是自动化测试工具,会有反制措施.当开启开发者模式后,就可以绕过他们的检测啦.(不行的,哭笑) 如果网站只是对windows.na ...
- python selenium模拟登陆163邮箱。
selenium是可以模拟浏览器操作. 有些爬虫是异步加载的,通过爬取网页源码是得不到需要的内容.所以可以模拟浏览器去登陆该网站进行爬取操作. 需要安装selenium通过pip install xx ...
- Python爬虫 —— 知乎之selenium模拟登陆获取cookies+requests.Session()访问+session序列化
代码如下: # coding:utf-8 from selenium import webdriver import requests import sys import time from lxml ...
随机推荐
- Java学习:字符串概述与特点
字符串概述与特点 java.lang.String类 代表字符串 API当中说:Java程序中的所有字符串字面值(如“abc“)都作为此类的实例实现.其实就是说:程序当中所用的双引号字符串,都是Str ...
- Ubuntu 下安装zsh和oh-my-zsh
注意:安装前先备份/etc/passwd 一开始装oh-my-zsh我是拒绝的,因为这东西安装容易,卸载难,真的很难. Mac安装参考:http://www.cnblogs.com/EasonJim/ ...
- 错误排查:Cloudera Manager Agent 的 Parcel 目录位于可用空间小于 10.0 吉字节 的文件系统上。 /opt/cloudera/parcels
临时解决办法: 点击右上角的抑制,选中抑制复选框,然后重启服务即可.
- Nginx深入详解之upstream分配方式
一.分配方式 Nginx的upstream支持5种分配方式,下面将会详细介绍,其中,前三种为Nginx原生支持的分配方式,后两种为第三方支持的分配方式: 1.轮询 轮询是upstream的默认分配方式 ...
- 在vue-cli中如何安装scss,并全局引入scss
在vue-cli脚手架采用scss正确的使用姿势 步骤一: 安装node-sass.sass-loader.style-loader npm install node-sass --save-dev ...
- JavaScript 之 location 对象
一.location 对象 location 对象是 window 对象下的一个属性,使用的时候可以省略 window 对象. 常用属性: location.href = 'http://www.ba ...
- 汽车制造商表态:必须依靠MES系统来管控流程
汽车行业特点 汽车工业是一个高投入,高产出,集群式发展的产业部门. 汽车自身的投资,生产,研发,供应,销售,维修:前序的原材料,零部件,技术装备,物流:后序的油料,服务,信贷,咨询,保险,直至基础设施 ...
- Nginx配置多域名代理
目的 当我们有多个站点需要对外网开放,每个站点的域名都不一样,然而我们只有一个外网ip.这种情况下,我们就可以使用一个Nginx来配置多域名代理.这种代理方式可以解决,在同一个端口上针对不同域名代理不 ...
- 一款APP的完整开发流程 (转载)
来源:https://www.sohu.com/a/239089829_100063940 近年来,在市场和政策的双轮驱动下,我国服务外包产业快速发展,服务智能化趋势显现.随着企业核心业务外包活动的日 ...
- 《linux就该这么学》课堂笔记03 命令初识 echo、date、reboot、poweroff、wget...
Linux进程的六种状态(R.S.D.T.Z.X): R --- TASK_RUNNING(可执行状态) S --- TASK_INTERRUPTIBLE(可中断的睡眠状态) D --- TASK_U ...