破解流程 #1.输入账号.密码,然后点击登陆 #2.点击按钮,弹出没有缺口的图 #3.针对没有缺口的图片进行截图 #4.点击滑动按钮,弹出有缺口的图 #5.针对有缺口的图片进行截图 #6.对比两张图片,找出缺口,即滑动的位移 #7.按照人的行为行为习惯,把总位移切成一段段小的位移 #8.按照位移移动 #9.完成登录 模拟登陆案例一: from selenium import webdriver from selenium.webdriver import ActionChains from PI…
利用selenium库和超级鹰识别点触验证码(学习于静谧大大的书,想自己整理一下思路) 一.超级鹰注册:超级鹰入口 1.首先注册一个超级鹰账号,然后在超级鹰免费测试地方可以关注公众号,领取1000积分,基本上就够学习使用了.如果想一直用可以用,可以充值,不是很贵. 2.下载超级鹰的python库代码.代码 3.然后有测试案例,自己可以试着跑一跑代码. 二.使用selenium库来识别点触式验证码: 1.首先是找一个使用点触式二维码的网站:(这个真的是比较难找了,由于静谧大大书上的网站被封了,我找…
前言 在抓取常规的静态网页时,我们直接请求对应的 url 就可以获取到完整的 HTML 页面,但是对于动态页面,网页显示的内容往往是通过 ajax 动态去生成的,所以如果是用 urllib.request 直接获取页面的 HTML 时,就获取不到我们所想用的内容,这时我们就可以利用 selenium 库就可以获得我们所需要的内容了. 需安装的三方库 BeautifulSoup4 selenium lxml 示例代码 示例说明:获取德邦官网设立了网点的市区名称 import urllib.requ…
异常处理 处理程序的报错 语法 捕捉万能异常: try: print(a) except Exception as e: print("你的代码有问题") print("程序走下面的代码") 字符串内置方法 索引取值 切片 长度(len) 成员运算 移除两边空白字符 str切分 循环 startswith/endswith join() index() count() selenium 是一个自动化测试工具,可以通过驱动浏览器,自动点击完成功能 安装驱动 http:…
要爬取一个网站遇到了极验的验证码,这周都在想着怎么破解这个,网上搜了好多知乎上看到有人问了这问题https://www.zhihu.com/question/28833985,我按照这思路去大概实现了一下. 1.使用htmlunit(这种方式我没成功,模拟鼠标拖拽后轨迹没生成,可以跳过) 我用的是java,我首先先想到了用直接用htmlunit,我做了点初始化 private void initWebClient() { if (webClient != null) { return; } we…
[前提] 想要实现使用某种语言,比如Python,C#等,去实现模拟登陆网站的话,首先要做的事情就是使用某种工具,去分析本身使用浏览器去登陆网页的时候,其内部的执行过程,内部逻辑. 此登陆的逻辑过程,主要指的是,需要访问哪些地址,提交哪些http请求,其中包含了有哪些查询关键字,涉及到哪些post的数据,涉及到哪些cookie等等. 只有知道了内部逻辑过程,才能谈及,使用某种语言去实现,模拟,此套登陆网站的过程. 关于分析工具,其实有很多种,此处选用,之前在 [总结]浏览器中的开发人员工具(IE…
首先得确定php.ini设置有没有打开GD扩展功能,測试例如以下 print_r(gd_info()); 假设有打印出内容例如以下,则说明GD功能有打开: Array ( [GD Version] => bundled (2.0.34 compatible) [FreeType Support] => 1 [FreeType Linkage] => with freetype [T1Lib Support] => 1 [GIF Read Support] => 1 [GIF…
事前准备 部署好jenkins.申请一个码云账号.代码同步至码云 1.在码云上新建一个项目,并把代码同步上去 我设置成了私有项目 2.为项目添加部署公钥 因为是私有项目,所以需要添加一个部署公钥,不然到时候jenkins没有权限访问 步骤如下: (1)连接服务器,切换至~/.ssh目录 (2)输入命令ssh-keygen -t rsa -C "XXX" 生成公钥(XXX自己定义一个名字) 创建好的公钥如下 (3)在码云的项目上添加部署公钥 2.配置jenkins 这里需要注意两个地方,…
from selenium import webdriver from selenium.webdriver import ActionChains from PIL import Image import time def get_snap(driver): driver.save_screenshot('snap.png') snap_obj=Image.open('snap.png') return snap_obj def get_image(driver): img=driver.fi…
Python 2.7 IDE Pycharm 5.0.3 Selenium:Selenium的介绍及使用,强烈推荐@ Eastmount的博客 PIL : Pillow-3.3.0-cp27-cp27m-win_amd64.whl PIL第三方库的下载 win下安装whl文件 Pytesser:依赖于PIL ,Tesseract 了解pytesser及基本使用 Tesseract:3.0.2 tesseract下载及安装 Firefox浏览器:47.0.1 目的 自动识别验证码模拟登陆,注意是自…