python一招完美搞定Chromedriver的自动更新

　　日常的web自动化过程中，我们常常用python selenium库来操纵Chrome浏览器实现网页的自动化。这其中有个比较头疼的问题：Chrome的更新频率非常频繁，与之对应的Chromedriver版本也必须相应更新。如果两者版本的主版本号相差超过1，selenium则会报异常，大概错误信息如下：

发生异常: SessionNotCreatedException

Message: session not created: This version of ChromeDriver only supports Chrome version 95 Current browser version is 105.0.5195.102 with binary path C:\Program Files (x86)\Google\Chrome\Application\chrome.exe

　　那有没有好的办法解决这个问题呢？方法当然有，首先我们需要知道哪里可以下载到不同版本的Chromedriver文件。这里推荐两个网站，国内首选chromedriver淘宝的镜像仓库：http://npm.taobao.org/mirrors/chromedriver/。其访问和下载速度很快，仅有如下几个缺点：

1、数据更新会比谷歌官方稍慢；

2、可供下载的版本有时不全；

3、网站域名和界面有时会变化，这间接影响到了自动下载的方法。

其网站界面如下：

　　如果希望稳定获取对应版本的chromedriver，这里更加推荐谷歌官方的源仓库（莫慌张，该域名在国内可以正常访问），网址为：https://chromedriver.storage.googleapis.com/index.html。界面与淘宝镜像仓库的别无二致：

　　那么问题来了，如何让python脚本自动帮我们下载和更新chromedriver，使其与chrome浏览器版本相一致呢？这就体现出python第三方库遍地开花的优势了。webdriver-manager库，没错，我们只需要通过pip install webdriver-manager来安装该三方库。通过库名也不难看出，该工具可以有效管理主流浏览器所需的webdriver：chrome、Edge、chromium、firefox、IE、Opera的支持都不在话下。本文以chrome来举例。

假设我们Chrome总是自动更新至最新版，我们自然每次使用selenium前需要确保chromedriver处于最新版（latest_release)，此时我们只需要寥寥几行代码即可搞定：

# selenium 4

from webdriver_manager.chrome import ChromeDriverManager

from selenium import webdriver

from selenium.webdriver.chrome.service import Service

driver_path=ChromeDriverManager().install() #下载latest release版本的chromedriver，并返回其在本机的下载存储路径

driver = webdriver.Chrome(service=Service(driver_path))

　　有了这段脚本webdriver-manager会灰常贴心地自动检查本地缓存路径，确认有无该版本的chromedriver，如果确认没有，它才会联网下载最新版本的chromedriver，控制台中还会显示下载速度和进度，极其用心。如果我们觉得webdriver的日志多余，官方也提供了方法供我们关闭相关日志，代码如下：

import logging

import os

os.environ['WDM_LOG'] = str(logging.NOTSET)

　　我们还可以方便地指定chromedriver的本地下载和保存路径，它既可以支持相对路径，也可以支持绝对路径的写法，代码示例如下：

from webdriver_manager.chrome import ChromeDriverManager

ChromeDriverManager(path = r".\\Drivers").install()

　　如果我们希望下载指定版本的chromedriver，可以给上面的ChromeDriverManager实例传入version参数，代码示例如下：

from webdriver_manager.chrome import ChromeDriverManager

ChromeDriverManager(version="106.0.5249.21").install()

　　这里引出了真正的问题，假使我们本机上使用的chrome不是最新版，我们又该如何去实现自动更新chromedriver呢？这就是小爬在本文中要重点解决的问题：

细细思考后不难看出，我们只需要分以下几个步骤来实现：

1、自动获取当前电脑的chrome浏览器版本；

2、提取浏览器版本的主版本号，如chrome版本为106.0.5249.21，那么其主版本号就是”106“；

3、利用requests库请求chromedriver的镜像仓库，解析返回的html源码，获得每个版本的chromedriver链接；

4、从步骤3获得的所有下载链接中，找到主版本与chrome一致的，从中随意取出一个即可满足要求（我们不妨取出第一个满足要求的chromedriver版本）；

5、将该版本号传入ChromeDriverManager实例，即可下载使用对应的chromedriver。

　　小爬直接带着各位童鞋开整啦，下面全是干货。示例代码如下：

from webdriver_manager.core.utils import get_browser_version_from_os

from webdriver_manager.chrome import ChromeDriverManager

import requests,re,time,os

browserVersion=get_browser_version_from_os("google-chrome") # 获取当前系统chrome浏览器的版本号

mainBrowserVersion=browserVersion.split(".")[0] # 获取浏览器的主版本号

resp=requests.get(url="https://chromedriver.storage.googleapis.com/")

content=resp.text

availableVersionList=re.search(f"<Contents><Key>({mainBrowserVersion}\.\d+\.\d+\.\d+)/chromedriver_win32\.zip</Key>.*?",content,re.S)

if availableVersionList==None:

    print(f"镜像网站上没有找到主版本号为{mainBrowserVersion}的chromedriver文件，请核实！")

    time.sleep(10)

    os._exit(0)

else:

    availableVersion=availableVersionList.group(1)

driver_path=ChromeDriverManager(version=availableVersion).install() # 找到镜像网站中主版本号与chrome主版本一致的，将匹配到的第一个完整版本号的chromedriver下载使用

　　有了这段代码，chromedriver与chrome版本同步的问题，就再也不会困扰屏幕前的你了！(●'◡'●)

　欢迎扫码关注我的公众号获取更多爬虫、数据分析的知识！

python一招完美搞定Chromedriver的自动更新的更多相关文章

[转] Android：用GSON 五招之内搞定任何JSON数组
[From] http://www.open-open.com/lib/view/open1472632967912.html 写在前面关于GSON的入门级使用,这里就不提了,如有需要可以看这篇博文 ...
Python 五个知识点搞定作用域
Python 五个知识点搞定作用域 1.块级作用域想想此时运行下面的程序会有输出吗?执行会成功吗? #块级作用域 if 1 == 1: name = "lzl" print(na ...
[转]用GSON 五招之内搞定任何JSON数组
关于GSON的入门级使用,这里就不提了,如有需要可以看这篇博文 <Google Gson的使用方法,实现Json结构的相互转换> ,写的很好,通俗易懂. 我为什么写这篇文章呢?因为前几晚跟 ...
python技巧一行命令搞定局域网共享
python超强玩法--一行命令搞定局域网共享今天刷到python的一个新玩法,利用python自带的http服务,快速创建局域网共享服务,命令如下: python -m thhp.server ...
python练习：一行搞定-统计一句话中每个单词出现的个数
一行搞定-统计一句话中每个单词出现的个数 >>> s'i am a boy a bood boy a bad boy' 方式一:>>> dict([(i,s.spl ...
简单案列完美搞定Mvc设计模式
一个小列子搞定Mvc模式,包括数据库以及如何提高用户体验度 1.首先来web.xml配置servlet的访问路径: <?xml version="1.0" encoding= ...
python爬虫19 | 遇到需要的登录的网站怎么办？用这3招轻松搞定！
你好由于你是游客无法查看本文请你登录再进谢谢合作当你在爬某些网站的时候需要你登录才可以获取数据咋整? 莫慌小帅b把这几招传授给你让你以后从容应对那么接下来就是学习 python ...
【Python selenium自动化环境配置】4步搞定ChromeDriver版本选择
很多刚做自动化的小伙伴,会在ChromeDriver版本选择时犯难,看来大家都被坑过,真正掌握独门绝技,都不是难事儿. 看好了主要步骤就4部 1.确定谷歌浏览器版本 2.找到谷歌浏览器版本与Chrom ...
当文件目录变得杂乱不堪怎么办，python帮你轻松搞定
这几天和几个小伙伴,在一起合做一个ppt. 做ppt之前有原版的ppt,和一个word大纲,在制作过程中,又不断添加图片.视频等素材,最终,整个目录变得杂乱不堪(见下图-处理之前) 那我想,可不可以做 ...

随机推荐

不可思议的返回功能——python
今天给大家分享 3 个比较冷门的知识.教程点这(https://jq.qq.com/?_wv=1027&k=zLK3I0M5) 第一个:神奇的字典键 (https://jq.qq.com/?_ ...
在docker中打开redis 客户端 cli
首先交互方式进入redis容器 docker exec -it redis /bin/bash 随后运行客户端 redis-cli
服务器与Ajax
前端相关的技术点 HTML 主要用来实现页面的排版布局 CSS 主要用来实现页面的样式美化 JavaScript 主要用来实现前端功能特效 Ajax基础知识铺垫客户端与服务器通信协议( ...
虚拟机启动时报’A start job is running for /etc/rc.local .. Compatibility错误。
虚拟机启动时报'A start job is running for /etc/rc.local .. Compatibility错误. 问题已经存在很长时间了,但是不影响ssh登录,遂置之未理. 经 ...
windows10：vscode下go语言的适配
ps:本篇依赖golang的sdk已经安装完成: url:https://www.cnblogs.com/mrwhite2020/p/16475731.html 一.下载vscode,选择wind ...
kube-shell安装
1.开源项目kube-shell可以为kubectl提供自动的命令提示和补全,对于初学kubernetes比较友好. https://github.com/cloudnativelabs/kube-s ...
vue2升级vue3指南（二）—— 语法warning&error篇
本文总结了vue2升级vue3可能会遇到的语法警告和错误,如果想知道怎样升级,可以查看我的上一篇文章:vue2升级vue3指南(一)-- 环境准备和构建篇 Warning 1.deep /deep/和 ...
第二十一天python3 python的正则表达式re模块学习
python的正则表达式 python使用re模块提供了正则表达式处理的能力: 常量 re.M re.MULTILINE 多行模式 re.S re.DOTALL 单行模式 re.I re.IGNORE ...
linux 判断变量是否相等方法
echo $? 输出上一个命令执行成功与否的情况 1表示失败 0 表示成功 test检测文件类型和比较值有空格时等号才是判断,否则为赋值
使用.NET简单实现一个Redis的高性能克隆版（六）
译者注该原文是Ayende Rahien大佬业余自己在使用C# 和 .NET构建一个简单.高性能兼容Redis协议的数据库的经历. 首先这个"Redis"是非常简单的实现,但是他 ...

python一招完美搞定Chromedriver的自动更新

python一招完美搞定Chromedriver的自动更新的更多相关文章

随机推荐

热门专题