Python selenium 文件自动下载（自动下载器）

MyGithub：https://github.com/williamzxl 最新代码已经上传到Github，以下版本为stupid版本。

由于在下载过程中需要下载不同文件，所以可以把所有类型放在Values的位置。但是公司要下载的uxz文件实在找不到对应的MIME类型。所以自己写了一个FireFox profile（firefox.exe -p），然后自己让对应的文件自动下载即可。

self.profile.set_preference('browser.helperApps.neverAsk.saveToDisk', 'application/xml,

application/xml')

Firefox 文件下载

对于Firefox，需要我们设置其Profile：

browser.download.dir：指定下载路径
browser.download.folderList：设置成 2 表示使用自定义下载路径；设置成 0 表示下载到桌面；设置成 1 表示下载到默认路径
browser.download.manager.showWhenStarting：在开始下载时是否显示下载管理器
browser.helperApps.neverAsk.saveToDisk：对所给出文件类型不再弹出框进行询问

2.实例。

需求：公司里面总是需要在OSS，根据OSS num下载相应的文件。

一共写了三部分：autoDownload.py,getUserInfo.py,userInfo.xlsx

#!/usr/bin/env python3

# -*- coding:utf-8 -*-

import xlrd

class XlUserInfo(object):

    def __init__(self,path=''):

        self.path = path

        self.xl = xlrd.open_workbook(self.path)

    def get_sheet_info(self):

        all_info = []

        info0 = []

        info1 = []

        for row in range(0,self.sheet.nrows):

            info = self.sheet.row_values(row)

            info0.append(info[0])

            info1.append(info[1])

        temp = zip(info0,info1)

        all_info.append(dict(temp))

        return all_info.pop(0)

    def get_sheetinfo_by_name(self,name):

        self.name = name

        self.sheet = self.xl.sheet_by_name(self.name)

        return self.get_sheet_info()

if __name__ == '__main__':

    xl = XlUserInfo('userInfo.xlsx')

    userinfo = xl.get_sheetinfo_by_name('userInfo')

    webinfo = xl.get_sheetinfo_by_name('WebEle')

    print(userinfo)

    print(webinfo)

主要用来从userInfo.xlsx中读取用户信息，web的元素。

#!/usr/bin/env python3

# -*- coding:utf-8 -*-

from selenium import webdriver

from getUserInfo import XlUserInfo

import threading

class AutoDownload(object):

    def __init__(self,file_type,args, args2):

        self.file_type = file_type

        self.args = args

        self.args2 = args2

    def openBrower(self):

        self.profile = webdriver.FirefoxProfile()

        self.profile.accept_untrusted_certs = True

        if self.args2['downloadpath'] is None:

            self.profile.set_preference('browser.download.dir', 'c:\\')

        else:

            self.profile.set_preference('browser.download.dir', self.args2['downloadpath'])

            print(self.args2['downloadpath'])

        self.profile.set_preference('browser.download.folderList', 2)

        self.profile.set_preference('browser.download.manager.showWhenStarting', False)

        if self.file_type == 'xml':

            self.profile.set_preference('browser.helperApps.neverAsk.saveToDisk', 'application/xml')

        elif self.file_type == 'uxz':

            self.profile.set_preference('browser.helperApps.neverAsk.saveToDisk', 'application/xml')

        elif self.file_type == 'txt':

            self.profile.set_preference('browser.helperApps.neverAsk.saveToDisk', 'text/plain')

        else:

            self.profile.set_preference('browser.helperApps.neverAsk.saveToDisk', 'text/plain')

        #3,6 xml,tml file

        # profile.set_preference('browser.helperApps.neverAsk.saveToDisk', 'application/xml')

        #2,4 txt,chg file

        # profile.set_preference('browser.helperApps.neverAsk.saveToDisk', 'text/plain')

        self.driver = webdriver.Firefox(firefox_profile=self.profile)

        self.driver.implicitly_wait(30)

        return self.driver

    def openUrl(self):

        try:

            self.driver.get(self.args2['url'])

            self.driver.maximize_window()

        except:

            print("Failed to get {}".format(self.args2['url']))

        return self.driver

    def login(self):

        '''

        user_name

        pwd_name

        logIn_name

        '''

        self.driver.find_element_by_name(self.args['user_name']).send_keys(self.args2['uname'])

        if isinstance(self.args2['pwd'],float):

            self.driver.find_element_by_name(self.args['pwd_name']).send_keys(int(self.args2['pwd']))

        else:

            self.driver.find_element_by_name(self.args['pwd_name']).send_keys(self.args2['pwd'])

        self.driver.find_element_by_name(self.args['logIn_name']).click()

        self.driver.implicitly_wait(10)

        return self.driver

    def download(self):

        self.driver.implicitly_wait(15)

        self.driver.find_element_by_link_text(self.args['Search_Forms_text']).click()

        self.driver.implicitly_wait(30)

        self.driver.find_element_by_id(self.args['OSS_Num_type_id']).send_keys(int(self.args2['OSS_num']))

        self.driver.find_element_by_id(self.args['Search_button_id']).click()

        self.driver.implicitly_wait(10)

        self.driver.find_element_by_link_text(str(int(self.args2['OSS_num']))).click()

        self.driver.implicitly_wait(20)

        # Attachments_text

        self.driver.find_element_by_link_text(self.args['Attachments_text']).click()

        self.driver.implicitly_wait(10)

        if self.file_type == 'xml':

            self.driver.find_element_by_xpath('//table[4]//tr[3]/td[1]/a').click()

            self.driver.implicitly_wait(30)

            self.driver.find_element_by_xpath('//table[4]//tr[6]/td[1]/a').click()

        elif self.file_type == 'uxz':

            self.driver.find_element_by_xpath('//table[4]//tr[5]/td[1]/a').click()

        elif self.file_type == 'txt':

            self.driver.find_element_by_xpath('//table[4]//tr[2]/td[1]/a').click()

            # driver.find_element_by_xpath('//table[4]//tr[6]/td[1]/a').click()

            self.driver.implicitly_wait(30)

            self.driver.find_element_by_xpath('//table[4]//tr[4]/td[1]/a').click()

        else:

            self.driver.quit()

    def quit(self):

        self.driver.quit()

    def Run(self):

        self.openBrower()

        self.openUrl()

        self.login()

        self.download()

        self.quit()

if __name__ == '__main__':

    xl = XlUserInfo('userInfo.xlsx')

    userinfo = xl.get_sheetinfo_by_name('userInfo')

    webinfo = xl.get_sheetinfo_by_name('WebEle')

    print(userinfo)

    print(webinfo)

    down_txt = AutoDownload('txt',webinfo,userinfo)

    down_xml = AutoDownload('xml',webinfo,userinfo)

    threads = []

    t1 = threading.Thread(target=down_txt.Run)

    t2 = threading.Thread(target=down_xml.Run)

    threads.append(t1)

    threads.append(t2)

    for t in threads:

        t.start()

    for i in threads:

        i.join()

Python selenium 文件自动下载（自动下载器）的更多相关文章

Python Selenium 文件上传之Autoit
今天补充一种文件上传的方法主要是因为工作中使用SendKeys方法不稳定,具体方法见: Python Selenium 文件上传之SendKeys 这种方法直接通过命令行执行脚本时没有问题,可以成功 ...
Python Selenium 文件上传之SendKeys
昨天写了Web 文件下载的ui自动化,下载之后,今天就要写web 文件上传的功能了. 当然从折腾了俩小时才上传成功.下面写一下自己操作的步骤首先网上说的有很多方法如 input 标签的最好做了,直 ...
Python selenium 实现大麦网自动购票过程
一些无关紧要的哔哔: 大麦网是中国综合类现场娱乐票务营销平台,业务覆盖演唱会. 话剧.音乐剧.体育赛事等领域今天,我们要用代码来实现他的购票过程开搞! 先来看看完成后的效果是怎么样的开发环境版 ...
python+selenium生成测试报告后自动发送邮件
标签(空格分隔): 自动化测试运行自动化脚本后,会产生测试报告,而将测试报告自动发送给相关人员,能够让对方及时的了解测试情况,查看测试结果. 整个脚本包括三个部分: 生成测试报告获取最新的测试报告 ...
python+selenium+webdriver+BeautifulSoup实现自动登录
from selenium import webdriverimport timefrom bs4 import BeautifulSoupfrom urllib import requestimpo ...
Python selenium Chrome正在受到自动软件的控制 disable-infobars无效的解决方法
问题解决前两天更新了google浏览器版本,今天运行以前的脚本,发现options一个参数的配置不生效了. 运行了几次都发现该参数没有生效,也检查了自己的代码参数,没有写错,于是就有了这一波“网中寻 ...
python+selenium 模拟登陆，自动下单
目前写的实在太粗糙,留着,以后来写上
Python+Selenium学习笔记19 - 自动发送邮件
发送简单的邮件用一个QQ邮箱发送到另一个QQ邮件. 首先设置QQ邮箱,邮箱设置 -> 账号开启SMTP服务,点击开启按钮,按提示进行操作,需要1毛钱的短信费.开启后如下所示 1 # codi ...
Python+Selenium练习篇之11-浏览器上前进和后退操作
本文来介绍上如何,利用webdriver中的方法来演示浏览器中地址栏旁边的前进和后退功能. 相关脚本代码如下: # coding=utf-8import timefrom selenium impor ...

随机推荐

Jquery 父级元素、同级元素、子元素
prev():获取指定元素的上一个同级元素(是上一个哦). prevAll():获取指定元素的前边所有的同级元素. find():查找子元素方式 next(): 获取指定元素的下一个同级元素(注意是下 ...
Alpha个人总结
一.我的问题: 1.第一章1.2.1 在软件的特殊性中说到,"大型软件有超过数百万行的源代码,上万个不同的文件,而软件工程师通常一次只能看到30-80行源代码,他们的智力.记忆力和常人差不多 ...
【Alpha阶段】第一次Scrum Meeting！
每日任务 1.本次会议为第一次 Meeting会议: 2.本次会议在中午12:30,在第五社区5号楼楼下,召开本次会议为30分钟讨论接下来的任务: 一.今日站立式会议照片二.每个人的工作 (有wor ...
第二次项目冲刺（Beta阶段）--第二天
一.站立式会议照片二.项目燃尽图三.项目进展功能模块的代码编写完成,界面布局规划已经定型,不会有大的修改,接下去就是主要解决存在的bug以及各种测试. 队员 ID 贡献比王若凡 201421 ...
【Alpha阶段】第六次scrum meeting
一.会议照片二.会议内容姓名学号负责模块昨日任务完成度今日任务杨爱清 099 界面设计和交互功能完成设计界面杨立鑫 100 数据库搭建和其他完成将数据库与其他模块连接林钊 ...
201521123080《Java程序设计》第6周学习总结
1. 本周学习总结 1.1 面向对象学习暂告一段落,请使用思维导图,以封装.继承.多态为核心概念画一张思维导图,对面向对象思想进行一个总结. 注1:关键词与内容不求多,但概念之间的联系要清晰,内容覆盖 ...
201521123006 《Java程序设计》第5周学习总结
1. 本周学习总结 1.1 尝试使用思维导图总结有关多态与接口的知识点. 1.2 可选:使用常规方法总结其他上课内容. 接口与抽象类拥有相同之处:(1)都代表系统的抽象层. (2)都不能被实例化(不能 ...
java课程设计（Calculator） 201521123027 陈龙
1.团队博客链接 http://www.cnblogs.com/DevilRay/p/7064482.html 2.个人负责模块或任务说明 (1)主函数的编写: (2)加减乘除运算的实现: (3)求倒 ...
Java第十二周学习总结
1. 本周学习总结 1.1 以你喜欢的方式(思维导图或其他)归纳总结多流与文件相关内容. 2. 书面作业将Student对象(属性:int id, String name,int age,doubl ...
在linux下通过hexdump生成一个十六进制的文本保存文件，解析此文件转变成正常源代码文件。
举例说明: 此十六进制保存的文件为此源代码hexdump生成的: #include<stdio.h> #include<string.h> #include<stdlib ...

Python selenium 文件自动下载 （自动下载器）

Firefox 文件下载

Python selenium 文件自动下载 （自动下载器）的更多相关文章

随机推荐

热门专题

Python selenium 文件自动下载（自动下载器）

Python selenium 文件自动下载（自动下载器）的更多相关文章