吴裕雄--天生自然python学习笔记:python用 Selenium 组件实现浏览器操作自动化
一般情况下,我们都是用手工操作的方式来对浏览器进行各种操作 。 实际上,
只要我们安装一个自动化操作组件, Python 就可以让我们的很多操作实现自动化 。
Selenium 组件
在开发网页时,用户接口的测试向来是一件相当不容易的事情,如果用手动方
式进行测试的各种操作,不仅效率低而且容易出错 。 Selenium 的出现就是为了解决
这个问题,它可以通过指令实现对网页操作的自动化,从而完成自动测试的功能。
除此之外, Selenium 还可以将许多其他的网页操作实现自动化,井能在指定时间自
动运行,功能相当强大。
安装 Selenium
使用 Se l enium 前,我们首先必须安装 Selenium 组件,安装命令如下:
pip install selenium
下载 Chrome WebDriver
要自动操作 Google Chrome 浏览器,还须安装相关的驱动程序,请根据自己的
操系统( Linux, Mac, Windows )下载 Chrome WebDriver ,网址如下:
http://chromedriver.storage.googleapis.com/index.html?path=2.27/

下载文件chromedriver_win32.zip即可。即使电脑是64位也没有关系,因为你安装的谷歌是32位的
解压之后,将chromedriver.exe放到谷歌浏览器的安装目录中:在开始菜单中,找到谷歌浏览器,然后右键“打开文件位置”,我的是C:\Program Files (x86)\Google\Chrome\Application
将谷歌浏览器的安装目录,添加到系统环境变量path中。





创建 Google Chrome 浏览器对象后,就可以通过 getO 方法连接到指定网址,最
后用 quit()方法关闭浏览器。 以百度网的连接和退出为例,代码如下 :
from selenium import webdriver browser= webdriver.Chrome()
browser.get('http://www.baidu.com')
browser.quit()
我们还可以把要浏览的网站建立一个列表,这样就能依次访问这些网站。如先
打开 Chrome 浏览器,把窗 口 最大化,然后每 3 秒打开一个列表 中的网站 , 最后关 闭
浏览器 。
from time import sleep
from selenium import webdriver urls = ['http://www.baidu.com','http://news.sina.com.cn/','http://www.wsbookshow.com'] browser = webdriver.Chrome()
browser.maximize_window
for url in urls:
browser.get(url)
sleep(3)
browser.quit()
查找网页元素
如果我们想要与网页进行互动,比如,我们要单击下单锻钮、超链接或要输入
文字 ,那么我们必须先获得网页元素,这样才能对这些特定元素进行操作 。
Selenium Webdriver API 提供了 多种获取网页元素的方法。 如下表所示 :

在以上各个方法名称中的 element 后面加上 s ,会返回特定查找的元素列表。
下面我们通过用 Chrom 浏览器访问http://www.wsbookshow.com/bookshow/jc/bkcxsj/12442.html这个 HTh伍页面中的元素,来对以上方法进行示例说明。
from selenium import webdriver #导入webdriver url='http://www.wsbookshow.com/bookshow/jc/bk/cxsj/13054.html' #以此链接为例
browser=webdriver.Chrome() #生成Chrome浏览器对象(结果是打开Chrome浏览器)
browser.get(url) #在浏览器中打开url

login_form=browser.find_element_by_id("menu_1") ##查找id="menu_1"的元素
print(login_form.text) #显示元素内容
#browser.quit() #退出浏览器,退出驱动程序

username=browser.find_element_by_name("username") #查找name="username"的元素
password=browser.find_element_by_name("pwd") #查找name="pwd"的元素
login_form=browser.find_element_by_xpath("//input[@name='arcID']")
login_form=browser.find_element_by_xpath("//div[@id='feedback_userbox']")
continue_link=browser.find_element_by_link_text('科技类图书')
continue_link=browser.find_element_by_link_text('英语')
heading1=browser.find_element_by_tag_name('h1')
content=browser.find_elements_by_class_name('topbanner')
content=browser.find_elements_by_css_selector('.topsearch')
#print(content.get_property)
browser.quit() #退出浏览器,退出驱动程序
吴裕雄--天生自然python学习笔记:python用 Selenium 组件实现浏览器操作自动化的更多相关文章
- 吴裕雄--天生自然HADOOP学习笔记:hadoop集群实现PageRank算法实验报告
实验课程名称:大数据处理技术 实验项目名称:hadoop集群实现PageRank算法 实验类型:综合性 实验日期:2018年 6 月4日-6月14日 学生姓名 吴裕雄 学号 15210120331 班 ...
- 吴裕雄--天生自然MySQL学习笔记:MySQL UPDATE 更新
如果需要修改或更新 MySQL 中的数据,我们可以使用 SQL UPDATE 命令来操作. 语法 以下是 UPDATE 命令修改 MySQL 数据表数据的通用 SQL 语法: UPDATE table ...
- 吴裕雄--天生自然MySQL学习笔记:MySQL 插入数据
MySQL 表中使用 INSERT INTO SQL语句来插入数据. 可以通过 mysql> 命令提示窗口中向数据表中插入数据,或者通过PHP脚本来插入数据. 以下为向MySQL数据表插入数据通 ...
- 吴裕雄--天生自然MySQL学习笔记:MySQL简介
MySQL 是最流行的关系型数据库管理系统,在 WEB 应用方面 MySQL 是最好的 RDBMS(Relational Database Management System:关系数据库管理系统)应用 ...
- 吴裕雄--天生自然 oracle学习笔记:oracle理论学习详解及各种简单操作例子
1. 数据库的发展过程 层次模型 -->网状模型 -->关系模型 -->对象关系模型 2. 关于数据库的概念 DB:数据库(存储信息的仓库) DBMS:数据库管理系统(用于管理数据库 ...
- 吴裕雄--天生自然HADOOP学习笔记:基本环境配置
实验目的 学习安装Java 学习配置环境变量 学习设置免密码登陆的方法 掌握Linux环境下时间同步的配置 实验原理 1.Java的安装 java是大数据的黄金语言,这和java跨平台的特性是密不可分 ...
- 吴裕雄--天生自然HADOOP学习笔记:使用yum安装更新软件
实验目的 了解yum的原理及配置 学习软件的更新与安装 学习源代码编译安装 实验原理 1.编译安装 前面我们讲到了安装软件的方式,因为linux是开放源码的,我们可以直接获得源码,自己编译安装.例如: ...
- 吴裕雄--天生自然HADOOP学习笔记:Shell工具使用
实验目的 学习使用xshell工具连接Linux服务器 在连上的服务器中进入用户目录 熟悉简单的文件操作命令 实验原理 熟悉shell命令是熟悉使用linux环境进行开发的第一步,我们在linux的交 ...
- 吴裕雄--天生自然HTML学习笔记:HTML 布局
网页布局对改善网站的外观非常重要. 请慎重设计您的网页布局. <!DOCTYPE html> <html> <head> <meta charset=&qu ...
- 吴裕雄--天生自然MySQL学习笔记:MySQL 安装
所有平台的 MySQL 下载地址为: MySQL 下载:https://dev.mysql.com/downloads/mysql/ 注意:安装过程我们需要通过开启管理员权限来安装,否则会由于权限不足 ...
随机推荐
- 4. git目录探秘
HEAD当前指向的分支信息.cconfig,当前仓库的配置信息,core,用户,远程,分支等信息.(命令操作其实就是修改当前config文件)refs---heads,其实就是分支,里面包含所有的分支 ...
- 关于python请求库Selenium安装所遇到的问题
今天,初次接触python,在网上买了一本关于爬虫的书,因为之前电脑上存在python,所以就对着书直接进行的请求库的安装,安装的时候,主要遇到了下边一个问题,在安装Selenium的时候,出现以下提 ...
- 深度学习常用的数据源(MNIST,CIFAR,VOC2007系列数据)
MINIST手写数据集 压缩包版: http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz http://yann.lecun.com/ ...
- @Autowired和@Resourse关键字的区别
这个问题是平时我们面试时面试官非常喜欢问的一个问题.首先,@Resourse是javax.annother包提供的一个注解关键字,是Java EE的方法,但Spring也支持该注解的导入,而@Auto ...
- Mybatis 使用分页查询亿级数据 性能问题 DB使用ORACLE
一般用到了mybatis框架分页就不用自己写了 直接用RowBounds对象就可以实现,但这个性能确实很低 今天我用到10w级得数据分页查询,到后面几页就迭代了很慢 用于记录 1.10万级数据如下 [ ...
- 吴裕雄--天生自然 JAVA开发学习:String 类
public class StringDemo{ public static void main(String args[]){ char[] helloArray = { 'r', 'u', 'n' ...
- static_cast 与 dynamic_caste, reinterpreter 的区别
static_cast 强制转换 dynamic_caste 在运行时做检查,区别常见与子类转换为派生类 reinterpertor 意思时重解释,例如将void* 转换成其它类型
- ccf201403-3 记录一个神tmwa了的代码 莫非我没看懂题。。。
#include <string.h> #include<cstdio> #include<stdio.h> #include <iostream> # ...
- JavaSE--Java 的基本程序设计结构
Java 对大小写敏感 Java 中定义类名的规则很宽松.名字必须以字母开头,后面可以跟字母和数字的任意组合.长度基本上没有限制.但是不能使用 Java 保留字作为类名. 标准的命名规范为:类名是以大 ...
- linux安装nginx步骤
转载自:https://blog.csdn.net/t8116189520/article/details/81909574,修改部分内容 本文已收录至博客专栏linux安装各种软件及配置环境教程中 ...