python Selenium chromedriver 自动化超时报错：你需要使用多标签保护罩护体

在使用selenium + chrome 作自动化测试的时候，有可能会出现网页连接超时的情况

如果出现网页连接超时，将会导致 webdriver 也跟着无法响应，不能继续进行任何操作

即时是去打开新的连接也会报Time out错误

那么如果有很多连接要去做弹窗抓取，却不想因为其中一两个页面超时而中断进程该怎么办呢？

这时候你需要一个备用标签做金刚保护罩来护体！

具体的思路是在打开需求页面之后，再次开启一个新的标签去访问一个一定不会超时的页面（如百度），此时窗口句柄不要切换，依旧按照自己的逻辑去操作，当出现页面超时情况的时候，关闭原有标签，设置主窗口句柄到百度页面所在的标签通过get访问后续的连接，同时在开启一个标签做保护罩即可。

    from selenium import webdriver

    from selenium.webdriver.chrome.options import Options

    chrome_options = Options()

    prefs = {

       'profile.default_content_setting_values': {

        'images': 2,    # 禁用图片的加载

        'javascript': 2 ##禁用js，可能会导致通过js加载的互动数抓取失效

        }

    }

    chrome_options.add_experimental_option("prefs", prefs)

    # chrome_options.add_argument("--headless") # 不弹出浏览器

    browser = webdriver.Chrome(chrome_options=chrome_options)

    browser.implicitly_wait(5) # 操作、获取元素时的隐式等待时间

    browser.set_page_load_timeout(10) # 页面加载超时等待时间

    main_win = browser.current_window_handle #记录当前窗口的句柄

    all_win = browser.window_handles

    # 开始访问页面

    print 'Opening page'

    urls = [] # 定义你想要抓取的全部的页面

    for url in urls:

      try:

        if len(all_win) == 1:

            print '弹出保护罩'

            js = 'window.open("https://www.baidu.com");'

            browser.execute_script(js)

            # 还是定位在main_win上的

            for win in all_win:

                if main_win != win:

                    print '保护罩WIN', win, 'Main', main_win

                    browser.switch_to.window(main_win)

        browser.get(url) # 此处访问你需要的URL

        body = browser.page_source

        html = etree.HTML(body)

        # 下面是你的抓取逻辑 省略

      except:

        # 超时

        print 'Time out'

        # 切换新的浏览器窗口

        for win in all_win:

            if main_win != win:

                print 'WIN', win, 'Main', main_win

                print '切换到保护罩'

                browser.close()

                browser.switch_to.window(win)

                main_win = win

        js = 'window.open("https://www.baidu.com");'

        browser.execute_script(js)

        if 'time' in str(traceback.format_exc()):

            print '页面访问超时'

python Selenium chromedriver 自动化超时报错：你需要使用多标签保护罩护体的更多相关文章

CentOS6 系统下升级python后yum命令使用时报错
CentOS6 系统下升级python后yum命令使用时报错,如下: [root@xxxxxxx]#yumFile"/usr/bin/yum",line30exceptKeyboa ...
【small项目】MySQL第二天早上第一次连接超时报错，解决方法com.mysql.jdbc.exceptions.jdbc4.CommunicationsException:
MySQL第二天早上第一次连接超时报错,解决方法com.mysql.jdbc.exceptions.jdbc4.CommunicationsException: Communications link ...
python中使用openpyxl模块时报错: File is not a zip file
python中使用openpyxl模块时报错: File is not a zip file. 最大的原因就是不是真正的 xlsx文件, 如果是通过库xlwt 新建的文件,或者是通过自己修改后缀名 ...
python+selenium实现自动化百度搜索关键词
通过python配合爬虫接口利用selenium实现自动化打开chrome浏览器,进行百度关键词搜索. 1.安装python3,访问官网选择对应的版本安装即可,最新版为3.7. 2.安装seleniu ...
使用python selenium进行自动化functional test
Why Automation Testing 现在似乎大家都一致认同一个项目应该有足够多的测试来保证功能的正常运作,而且这些此处的‘测试’特指自动化测试:并且大多数人会认为如果还有哪个项目依然采用人工 ...
python selenium+phantomjs alert()弹窗报错
问题:用selenium+phantomjs 模拟登陆,网页用JavaScript的alert("登陆成功")弹出框,但是用switch_to_alert().accept()报错 ...
python+selenium，打开浏览器时报selenium.common.exceptions.WebDriverException: Message: 'chromedriver' executable needs to be in PATH
有一年多没写web自动化了,今天搭建环境的时候报了一个常见错误,但是处理过程有点闹心,报错就是常见的找不到驱动<selenium.common.exceptions.WebDriverExcep ...
Python安装numpy,pandas慢，超时报错，下载不了的解决方法
由于python的默认源是国外的,所以下载的时候会很慢,甚至会出现超时下载失败,提供两个解决方法 1.设置pip的超时限制打开cmd 输入pip --default-timeout=100 inst ...
python selenium - web自动化环境搭建
前提: 安装python环境. 参考另一篇博文:https://www.cnblogs.com/Simple-Small/p/9179061.html web自动化:实现代码驱动浏览器进行点点点的操作 ...

随机推荐

Greenplum（PostgreSql）函数实现批量删除表
项目做库迁移,前期需要经常调整表结构语句,涉及多次的批量drop,本着偷懒精神写了这个函数.鉴于本函数在生产环境有巨大风险,建议测试完毕后立即删除. 主要步骤很简单:1)从pg_tables查询得到相 ...
Java-Class-C：org.springframework.http.HttpHeaders
ylbtech-Java-Class-C:org.springframework.http.HttpHeaders 1.返回顶部 1.1. import org.springframework.htt ...
NetBeans简介和简单使用
1.什么是NetBeans? NetBeans IDE:可以使开发人员利用Java平台能够快速创建Web.企业.桌面以及移动的应用程序: 支持语言:PHP.Ruby.JavaScript.Groovy ...
[zz]winform 窗体关闭事件
注册窗体关闭事件: 在Form1.Designer.cs 文件中添加: this.FormClosing += new System.Windows.Forms.FormClosingEventHan ...
shell 脚本999乘法表
99乘法表 vi st.sh 编辑一个脚本 chmod 777 st.sh 修改权限注意调整空格,否则打印不出效果执行脚本 ./st.sh 打印结果
Linux 实用指令（10）-RPM和YUM
目录 RPM 和 YUM 1 rpm 包的管理 1.1 介绍 1.2 rpm包的简单查询指令 1.3 rpm包名基本格式 1.4 rpm包的其他查询指令: 1.5 卸载rpm 包 1.6 安装rpm包 ...
2019-7-29-asp-dotnet-core-从-Frp-获取用户真实-IP-地址
title author date CreateTime categories asp dotnet core 从 Frp 获取用户真实 IP 地址 lindexi 2019-07-29 08:28: ...
Java怎样获取字符串最后出现的位置
lastIndexOf();表示获取字符串最后出现的位置,倒数的位置 @Test /** * lastIndexOf();//获取字符串最后出现的位置,倒数的位置 * */ public void f ...
C# - Finalize 和 Dispose
重要: https://www.cnblogs.com/Jessy/articles/2552839.html https://blog.csdn.net/daxia666/article/detai ...
Java 多线程 - Future
Java中Future的使用场景和解析 https://blog.csdn.net/hongtaolong/article/details/83349705 (细看!!!)

python Selenium chromedriver 自动化超时报错：你需要使用多标签保护罩护体

python Selenium chromedriver 自动化超时报错：你需要使用多标签保护罩护体的更多相关文章

随机推荐

热门专题