selenium-wire简介
一.简介
以下来自chatGPT回答:
selenium-wire是一个基于selenium的Python库,它扩展了selenium的功能,使得我们可以在自动化测试中直接访问和修改浏览器的网络请求和响应。selenium-wire可以拦截和修改HTTP请求和响应,从而可以在测试过程中模拟 网络环境、调试和分析网络请求以及实现自定义的网络请求和响应处理逻辑。与selenium自带的webdriver不同,selenium-wire使用了第三方库mitmproxy来实现网络请求的拦截和修改。因此,使用selenium-wire需要先安装mitmproxy。
二.用法
1.安装selenium-wire库
pip install selenium-wire
mitmproxy安装使用可参考:https://www.cnblogs.com/lihongtaoya/p/17446958.html
2.获取请求信息
1)获取所有的请求信息
get_list = driver.requests # 返回的是个数组
当调用 driver.requests时,返回的是当前页面所有已经请求并响应过了的接口数据。如果某个请求还没有完成或者被阻塞,那么这个请求对应的数据不会出现在 requests 列表中。
2)获取请求行/头/体
for i in get_list:
if 'https://www.baidu.com/sugrec' in i.url:
print(i.url) # 请求地址
print(i.date) # 请求时间
print(i.method) # 请求方式
print(i.headers) # 请求头 or i.headers['Content-Type']
print(i.params) # 请求参数
print(i.host) # 请求域名
driver.requests获取的是当前页面所有的请求,因此我们在使用时需过滤下自己所要的接口信息。
3)create_response()方法
for i in get_list:
if 'text/html' not in i.response.headers['Content-Type']:
# create_response(status_code, headers=(), body=b'')
i.create_response(200, [('Content-Type', 'text/plain')], b'["Hello","world"]') # mock接口响应
create_response()为mock接口响应信息,返回我们需要的信息。
4)abort()方法
for i in get_list:
if 'text/html' not in i.response.headers['Content-Type']:
i.abort(error_code=403) # 中断请求,并返回状态码403
print(i.response.status_code)
这里需要注意的是3,4方法所可以改变响应数据,但服务端记录的数据还是实际请求的值。
3.获取响应信息
这里直接贴代码吧,备注很详细。
for i in get_list:
if 'https://www.baidu.com/sugrec' in i.url:
print(i.response.date) # 当前响应时间
print(i.response.reason) # 响应状态 ok or Not found
print(i.response.headers['Content-Type']) # 响应的数据类型
print(i.response.status_code) # 响应状态码 # 获取响应的body并转为json类型输出
from seleniumwire.utils import decode
body = decode(i.response.body, i.response.headers.get('Content-Encoding', 'identity'))
decoded_response = body.decode('utf-8') # 将二进制字节串解码为 UTF-8 编码的字符串
json_response = json.loads(decoded_response) # 将 JSON 字符串转换为 Python 对象
print(json_response)
4.实例
import json
import time
from selenium.webdriver.common.by import By
from seleniumwire import webdriver driver = webdriver.Chrome()
driver.implicitly_wait(10)
driver.get("https://www.baidu.com")
driver.find_element(By.ID, value='kw').send_keys('猪')
driver.find_element(By.ID, value='su').click()
time.sleep(5) # 等待5s,让所有接口请求完
get_list = driver.requests # 获取当前所有的请求信息 for i in get_list:
if 'https://www.baidu.com/sugrec' in i.url:
print(i.response.date) # 当前响应时间
print(i.response.reason) # 响应状态 ok or Not found
print(i.response.headers['Content-Type']) # 响应的数据类型
print(i.response.status_code) # 响应状态码 # 获取响应的body并转为json类型输出
from seleniumwire.utils import decode
body = decode(i.response.body, i.response.headers.get('Content-Encoding', 'identity'))
decoded_response = body.decode('utf-8') # 将二进制字节串解码为 UTF-8 编码的字符串
json_response = json.loads(decoded_response) # 将 JSON 字符串转换为 Python 对象
print(json_response) driver.quit()
selenium-wrie官方文档:https://pypi.org/project/selenium-wire/
selenium-wire简介的更多相关文章
- selenium工具简介
通过selenium百科可知: 组件 Selenium IDE:一个Firefox插件,可以录制用户的基本操作,生成测试用例.随后可以运行这些测试用例在浏览器里回放,可将测试用例转换为其他语言的自动化 ...
- 自动化测试基础篇--Selenium unittest简介
一.什么是unittest unittest是Python单元测试框架,类似于JUnit框架. unittest中有4个重要的概念:test fixture, test case, test suit ...
- Selenium库简介
Selenium是一个自动化测试工具,利用它可以驱动浏览器执行特定的动作,如点击.下拉等操作,同时还可以获取浏览器当前呈现的页面的源代码,做到可见即可爬.对于一些JavaScript动态渲染的页面来说 ...
- 爬虫入门【6】Selenium用法简介
Selenium 是什么? 一句话,自动化测试工具.它支持各种浏览器,包括 Chrome,Safari,Firefox 等主流界面式浏览器. 如果你在这些浏览器里面安装一个 Selenium 的插件, ...
- python - selenium模块简介
为什么要使用Selenium? 很多浏览器渲染页面的方式都很难找出其规律, 但是利用Selenium来驱动加载网页就可以直接拿到javaScript渲染后的结果了, 不需要再担心其相关的加密系统 声明 ...
- Selenium系列之--01 简介【转】
1.selenium 工具组件 1.1 selenium2,也称为selenium webdriver.webdriver原来是另一个自动化测试工具,后与selenium 合并了.webdriver直 ...
- Selenium IDE安装及简介
一.Selenium IDE安装 Selenium IDE是Firefox浏览器的一个插件,依附于Firefox浏览器.在网上搜了Selenium IDE的安装教程,大部分都是说在官网下载安装,其实最 ...
- selenium元素定位陷阱规避
为什么selenium可以在各个浏览器上运行?因为selenium在与各个浏览器驱动执行前,会先把脚本转化成webdriver, webdriver wire协议(一种json格式的协议),这样就与脚 ...
- 所有selenium相关的库
通过爬虫 获取 官方文档库 如果想获取 相应的库 修改对应配置即可 代码如下 from urllib.parse import urljoin import requests from lxml im ...
- Python爬虫小白入门(四)PhatomJS+Selenium第一篇
一.前言 在上一篇博文中,我们的爬虫面临着一个问题,在爬取Unsplash网站的时候,由于网站是下拉刷新,并没有分页.所以不能够通过页码获取页面的url来分别发送网络请求.我也尝试了其他方式,比如下拉 ...
随机推荐
- golang pprof 监控系列(1) —— go trace 统计原理与使用
golang pprof 监控系列(1) -- go trace 统计原理与使用 服务监控系列文章 服务监控系列视频 关于go tool trace的使用,网上有相当多的资料,但拿我之前初学golan ...
- WPF 界面布局、常用控件入门教程实例 WPF入门学习控件快速教程例子 WPF上位机、工控串口通信经典入门
WPF(Windows Presentation Foundation)是一种用于创建 Windows 桌面应用程序的框架,它提供了丰富的控件库和灵活的界面布局,可以创建现代化的用户界面.下面是 WP ...
- [MYSQL/JDBC]mysql-connector-java与MySQL、JDK对应的兼容版本[转载]
1 文由 MYSQL 数据库版本 与 驱动版本之间的兼容性,可能会涉及到 部分数据库特性(函数.语法)等是否能够正常使用的问题. 2 兼容性: mysql-connector-java VS Mysq ...
- [Java/Arthas]Arthas The telnet port 3658 is used by process 13988 instead of target process 11208, y[转载]
1 问题描述 Arthas 跟踪 一个已经在tomcat部署的工程quality,第一次使用过的是135091号进程,后来出现问题,换进程连接,报错如上图所示,提示端口占用.原因是上次连接了一个进程, ...
- [Java]排序算法>交换排序>【快速排序】(O(N*logN)/不稳定/N较大/无序/仅顺序存储)
1 快速排序 1.1 算法思想 快速排序是由冒泡排序改进而得的. 在冒泡排序过程中,只对相邻的2个记录进行比较:因此,每次交换2个相邻记录时,只能消除1个逆序. 若能通过2个(不相邻)记录的1次交换, ...
- 创建SpringBoot项目,在yml中配置数据库, driver-class-name: com.mysql.cj.jdbc.Driver标红报错解决方式
一.报错原因 com.mysql.cj.jdbc.Driver一直标红报错,原因在于pom.xml中mysql包没有下载下来,或者在创建项目的时候有问题 二.解决方案 在pom.xml添加 <d ...
- Python 明明安装了Crypto模,但报错No module named “Crypto“
安装网上的解决方法卸载:pip uninstall cryptopip uninstall pycryptodomepip uninstall pycrypto重装:pip install Crypt ...
- 最新版本 Stable Diffusion 开源 AI 绘画工具之中文自动提词篇
目录 标签生成器 提示词自动补全 标签生成器 由于输入正向提示词 prompt 和反向提示词 negative prompt 都是使用英文,所以对学习母语的我们非常不友好 使用网址:https://t ...
- VS 查看引用的DLL/Nuget包源码时,无法看到注释
一.问题描述 在下面的截图中,我们发现,源码有添加一段注释. 然后通过Nuget包引用,在VS中用Reshaper反编译时,发现没有注释: 原来,DLL是默认不带注释的.即你生成一个DLL,给另一个项 ...
- cf1774f解题报告
Magician and Pigs 分析一下三个操作分别干了些什么 新添一只猪 使血量为 \(x\) 的猪血量变为 \(\max(x-v,0)\) 设前面操作后猪总共会受到 \(s\) 的伤害,复制一 ...