selenium控制文件下载位置

我们在自动化下载文件的时候势必存在一种需求: 通过chrome将文件保存到指定位置

1. google窗口实现

​ 配置'prefs'将文件下载到指定位置, 并通过判断文件的大小来判断文件是否下载完成

import os
import time from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.common.by import By options = Options()
prefs = {'profile.default_content_settings.popups': 0, 'download.default_directory': os.getcwd() + '\\download'}
options.add_experimental_option("prefs", prefs)
web = webdriver.Chrome(options=options)
web.get("https://pypi.org/project/selenium/#files")
time.sleep(5)
web.find_element_by_xpath('//*[@id="files"]/div/div[2]/a[1]').click()
# 获取下载文件的路径
download_dir = os.getcwd() + '\\download'
# 注意需要和 Chrome 浏览器设置的下载路径一致 # 文件名
file_name = 'selenium-4.9.0.tar.gz' download_file_path = os.path.join(download_dir, file_name) # 等待文件下载完成
wait = WebDriverWait(web, timeout=30)
wait.until(lambda driver: os.path.exists(download_file_path)) # 获取文件的初始大小
init_size = os.path.getsize(download_file_path) # 等待指定时间,再次检查文件大小是否发生变化
time.sleep(2)
while True:
cur_size = os.path.getsize(download_file_path)
if cur_size == init_size:
break
else:
init_size = cur_size
time.sleep(2) # 文件大小不再发生变化,认为下载完成
web.close()

2. 基于无头浏览器实现

​ 当我们需要将selenium部署到centos服务器上运行的时候, 就会存在无法打开google的情况, 此时我们必须要配置无头浏览器, 这时候想下载文件到指定位置就不是刚才配置一下'prefs', 因为我们在无头浏览器中是无法导出下载管理的可视化窗口的, 这意味着'prefs'将没有作用, 所以我们应该怎么做?

基于无头浏览器将文件下载到指定目录:
1. 配置无头浏览器并下载文件到google指定目录(配置options)
2. 通过定时等待判断文件是否下载完成(os模块)
3. 关闭浏览器

下面是代码部分:

import os
import time from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.common.by import By # # 设置 ChromeOptions 配置
options = Options()
options.add_argument('--no-sandbox')
options.add_argument('--disable-dev-shm-usage')
options.add_argument('--headless')
options.add_argument('blink-settings=imagesEnabled=false')
web = webdriver.Chrome(options=options)
# 配置浏览器
web.command_executor._commands["send_command"] = ("POST", '/session/$sessionId/chromium/send_command')
params = {'cmd': 'Page.setDownloadBehavior',
'params': {'behavior': 'allow', 'downloadPath': r"%s" % os.path.join(os.getcwd(), 'download')}}
web.execute("send_command", params=params) web.get("https://pypi.org/project/selenium/#files")
web.find_element(By.XPATH, '//*[@id="files"]/div/div[2]/a[1]').click() # 等待下载完成
# 通过文件大小变化(在上面)或者定时等待的方式均可判断
# 这里用定时等待的方式
download_file = os.path.join('C://Users//86183//Downloads', "selenium-4.9.0.tar.gz")
while not os.path.exists(download_file):
time.sleep(2) # # 移动文件到指定的目录
# destination = os.path.join(os.getcwd(), 'download')
# shutil.move(download_file, destination) # 关闭浏览器
web.quit()

selenium控制文件下载位置的更多相关文章

  1. 通过selenium控制浏览器滚动条

    目的:通过selenium控制浏览器滚动条 原理:通过 driver.execute_script()执行js代码,达到目的 driver.execute_script("window.sc ...

  2. selenium控制超链接在当前标签页中打开或重新打开一个标签页

    selenium控制超链接在当前标签页中打开或重新打开一个标签页 在web页面源码中,控制超链接的打开是在当前标签页还是重新打开一个标签页,是由属性target=“_black”进行控制的.如果还有属 ...

  3. Java&Selenium控制滚动条方法封装

    Java&Selenium控制滚动条方法封装 package util; import org.openqa.selenium.JavascriptExecutor; import org.o ...

  4. selenium控制浏览器操作

    selenium控制浏览器操作 控制浏览器有哪些操作? 控制页面大小 前进.后退 刷新 自动输入.提交 ........  控制页面大小,实例: # -*- coding:utf-8 -*- from ...

  5. Selenium系列(22) - 通过selenium控制浏览器滚动条的几种方式

    如果你还想从头学起Selenium,可以看看这个系列的文章哦! https://www.cnblogs.com/poloyy/category/1680176.html 其次,如果你不懂前端基础知识, ...

  6. 使用selenium控制滚动条(非整屏body)

    方法原理:     (1)使用jQuery CSS 操作 - scrollTop() 方法,设置 <div> 元素中滚动条的垂直偏移,语法:$(selector).scrollTop(of ...

  7. BDD测试之selenium控制滚动条

    一.对于页面存在滚动条,可以通过插入JS控制滚动条(最常用的方法) (1)将滚动条移动到指定坐标位置处 ((JavascriptExecutor) driver).executeScript(&quo ...

  8. 【WP8】键盘弹出时控制Frame位置

    WP上,当使用TextBox输入文字的时候,键盘会把TextBox向上推一段距离 当编辑第二个TextBox的时候,页面被上推,键盘刚好和TextBox靠在一起 当编辑第一个TextBox的时候,页面 ...

  9. selenium+Python(文件下载)

    webdriver允许我们设置默认的文件下载路径,也就是说,文件会自动下载并保存到设置的目录中 下面以Firefox浏览器为例: from selenium import webdriver from ...

  10. 使用python+selenium控制手工已打开的浏览器

    我们可以利用Chrome DevTools协议.它允许客户检查和调试Chrome浏览器. 打开cmd,在命令行中输入命令: chrome.exe --remote-debugging-port=922 ...

随机推荐

  1. 6. 基础查(会员信息) - 创建查询Web Api - 配置Table Permission

    ​ Power Portal中的Web API可以对门户页面中所有的Microsoft Dataverse实体进行创建.更新和删除操作.我们可以直接使用门户Web API对产品创建新客户.更新联系人或 ...

  2. 一文读懂字符编码ASCII、Unicode与UTF-8

    先说一下,为什么写这篇文章? 最近在写一个Http协议栈当涉及CRLF控制字符写入时,发现自己对CRLF与\r\n的关系不太了解,因此决定详细学习一下:查阅资料的同时,又遇到UTF-8与ASCII编码 ...

  3. rosdep初始化顺利进行

    rosdep初始化顺利进行 rosdep初始化需要两条命令 sudo rosdep init rosdep update 但在国内,我们通常会出现因为网络状况访问服务器超时的问题 解决方案就是将资源手 ...

  4. Python查找存储区0KB文件并记录下地址

    查找存储区域中0KB大小文件,可以根据需要变更指定大小. #-*- coding: utf-8 -*- #!/usr/bin/python from os.path import isdir,absp ...

  5. # 1. C++概述

    1. C++概述 1.1 c++简介 "c++"中的++来自于c语言中的递增运算符++,该运算符将变量加1.c++起初也叫"c with clsss".通过名称 ...

  6. 如何针对海外不同地区进行音视频自动化测试?丨Dev for Dev 专栏

    近年来由于全球性的新冠疫情,世界各地对实时音视频的需求猛增.不同国家和地区由于经济发展.国家政策等原因,网络环境有很大不同,如果要做好音视频体验,就需要分地域进行音视频指标测试.但是不论是外包,还是云 ...

  7. Solon2 自定义 slf4j 日志添加器

    本案需要引入已适配的 slf4j 日志框架(solon.logging.simple 或 logback-solon-plugin 或 log4j-solon-plugin). 1.自定义添加器入门 ...

  8. C++温故补缺(十九):atomic类

    atomic 参考:c++11 多线程(3)atomic 总结 - 简书.c++11 atomic Npgw的博客.C++11 并发指南系列 - Haippy - 博客园. atomic_flag a ...

  9. 细节讲解并实操下: 去中心化社交协议 ---- Nostr

    作者:林冠宏 / 指尖下的幽灵.转载者,请: 务必标明出处. GitHub : https://github.com/af913337456/ 出版的书籍: <1.0-区块链DApp开发实战&g ...

  10. Oracle 服务器概念梳理

    Oracle 公司是世界上最大的信息管理软件及服务提供商,因其复杂的关系数据库产品而闻名.Oracle 的关系数据库是世界上第一个支持 SQL 语言的数据库.支持服务器/客户机等部署.Oracle 数 ...