Selenium的基本操作

获取浏览器驱动寻找方式

1. 通过手动指定浏览器驱动路径
2. 通过 `$PATH`环境变量找寻浏览器驱动

可参考Python学习--Selenium模块简单介绍(1)

控制浏览器访问URL

browser.get(https://www.baidu.com/) 
 

find系列函数定位元素

- `find_element_by_xxx`   返回第一个符合条件 `WebElement`
- `find_elements_by_xxx` 返回符合条件所有元素包含了`WebEelemnt`列表
- `find`函数系列说明
- `find_element_by_class_name` 通过class 查询元素
- `find_element_by_id` 通过 ID
- `find_element_by_name` 通过name
- `find_element_by_tag_name` 通过标签名称
- `find_element_by_css_selector` css样式选择
- `find_element_by_link_text` 通过链接内容查找
- `find_element_by_partial_link_text` 通过链接内容包含的内容查找,模糊查询
- `find_element_by_xpath` 通过 xpath 查找数据

获取元素属性和文本内容

# 获取属性
element.get_attribute('属性名')
# 获取文本内容
element.text

输入框输入内容

input_element.send_keys('博客园')

自动百度查找博客园

import time

# 1. 导入模块
from selenium import webdriver # 2. 创建浏览器对象,
browser = webdriver.Chrome() # 参数驱动路径,默认参数也是当前路径的chromedriver驱动 # 3. 输入网址
browser.get("https://www.baidu.com/") timeout = 60
start_time = time.time()
while True:
try:
time.sleep(0.1) # 兼顾其他程序使用CPU资源
# 4. 找到输入框,输入关键词
input_element = browser.find_element_by_id('kw')
input_element.send_keys("小a玖拾柒-博客园") # 查询博客园
# 5. 找到“百度一下”的按钮,点击一下按钮
button = browser.find_element_by_id('su')
button.click()
time.sleep(3) # 让网页加载完成
# 6. 找到作者的博客园链接
url_element = browser.find_element_by_link_text("小a玖拾柒 - 博客园")
url_element.click()
break
except Exception as e:
if time.time() > start_time: # 超时
print(e)
break # 退出浏览器
time.sleep(3)
browser.quit()

  

查看百度首页的链接(获取元素是文本内容和元素属性)

import time
# 1. 导入模块
from selenium import webdriver # 2. 创建浏览器对象,
browser = webdriver.Chrome() # 参数驱动路径,默认参数也是当前路径的chromedriver驱动 # 3. 输入网址
browser.get("https://www.baidu.com/") baidu_list = browser.find_elements_by_class_name("mnav")
for item in baidu_list:
# 获取元素是文本内容和元素属性
print("{0}:{1}".format(item.text, item.get_attribute("href"))) # 退出浏览器
time.sleep(5)
browser.quit()

扩展:Selenium的自动等待方式

当控制浏览器时,浏览器正在加载页面同时又去获取数据导致浏览器寻找不到需要操作的元素引发异常。
- 方式一:强制等待,浪费时间

import time
time.sleep(秒数)

- 方式二:隐性等待,缺点:无法控制 AJAX请求

browser.implicitly_wait(等待时间)

- 方式三:显性等待,每个元素都可以自己定义检查条件

手动编写:

timeout = 60
start_time = time.time()
while True:
try:
time.sleep(0.1) # 兼顾其他程序使用CPU资源
# 4. 找到输入框,输入关键词
input_element = browser.find_element_by_id('kw')
input_element.send_keys("小a玖拾柒-博客园") # 查询博客园
# 5. 找到“百度一下”的按钮,点击一下按钮
button = browser.find_element_by_id('su')
button.click()
time.sleep(3) # 让网页加载完成
# 6. 找到作者的博客园链接
url_element = browser.find_element_by_link_text("小a玖拾柒 - 博客园")
url_element.click()
break
except Exception as e:
if time.time() > start_time: # 超时
print(e)
break

Selenium提供:

# 导入显性等待的API需要的模块
# 1> 等待对象模块
from selenium.webdriver.support.wait import WebDriverWait
# 2> 导入等待条件模块
from selenium.webdriver.support import expected_conditions as EC
# 3> 导入查询元素模块
from selenium.webdriver.common.by import By # 使用selenium api 实现显性等待
# 1> 创建等待对象
# 参数一 浏览器对象
# 参数二 超时时间
# 参数三 检查元素时间间隔
wait = WebDriverWait(browser,60,0.1)
# presence_of_element_located 检查元素是否存在,参数是一个元祖,元祖内部描述等待元素查询方案
# visibility_of_element_located 检查元素是否可见
url_element= wait.until(EC.presence_of_element_located((By.CLASS_NAME,"favurl")))
    url_element.click()

Python学习--Selenium模块学习(2)的更多相关文章

  1. Python学习--Selenium模块

    1. Python学习--Selenium模块介绍(1) 2.Python学习--Selenium模块学习(2) 其他: 1. Python学习--打码平台

  2. python中confIgparser模块学习

    python中configparser模块学习 ConfigParser模块在python中用来读取配置文件,配置文件的格式跟windows下的ini配置文件相似,可以包含一个或多个节(section ...

  3. 【Python】logging模块学习笔记

    因为做接口自动化测试遇到的一个代码逻辑上的问题,又不知道具体问题出在哪里,所以在模块化代码之前,先学习下python的日志模块logging. 入门1 入门2 日志级别大小关系为:CRITICAL & ...

  4. python(五)常用模块学习

    版权声明:本文为原创文章,允许转载,转载时请务必以超链接形式标明文章 原始出处 .作者信息和本声明. https://blog.csdn.net/fgf00/article/details/52357 ...

  5. Python之常用模块学习(一)

    本节大纲: 模块介绍 time &datetime模块 random os sys shutil json & picle shelve xml处理 yaml处理 configpars ...

  6. Python爬虫——selenium模块

    selenium模块介绍 selenium最初是一个测试工具,而爬虫中使用它主要是为了解决requests无法直接执行JavaScript代码的问题 selenium本质是通过驱动浏览器,完全模拟浏览 ...

  7. Python中Selenium模块的使用

    目录 Selenium的介绍.配置和调用 Selenium的配置 Selenium的调用 Selenium的使用 定位 定位元素的使用 定位下拉标签元素 在iframe框架之间切换 上传文件 Webd ...

  8. day5模块学习 -- os模块学习

    python基础之模块之os模块 os模块 os模块的作用: os,语义为操作系统,所以肯定就是操作系统相关的功能了,可以处理文件和目录这些我们日常手动需要做的操作,就比如说:显示当前目录下所有文件/ ...

  9. Python学习--Selenium模块简单介绍(1)

    简介及运行流程 Selenium 是一个用于Web应用程序测试的工具.Selenium测试直接运行在浏览器中,就像真正的用户在操作一样.支持的浏览器包括IE(7, 8, 9, 10, 11),Mozi ...

随机推荐

  1. Deep learning with Python 学习笔记(1)

    深度学习基础 Python 的 Keras 库来学习手写数字分类,将手写数字的灰度图像(28 像素 ×28 像素)划分到 10 个类别 中(0~9) 神经网络的核心组件是层(layer),它是一种数据 ...

  2. HDU 1535 Invitation Cards(逆向思维+邻接表+优先队列的Dijkstra算法)

    题目链接: http://acm.hdu.edu.cn/showproblem.php?pid=1535 Problem Description In the age of television, n ...

  3. vue实用组件——表格

    之前用了一下vue-bootstrap,感觉里面的表格组件特别好用,但是如果仅仅为了使用表格就引入bootstrap,似乎有点不划算.所以自己就试着实现了一下bootstrap里面表格的部分功能,目前 ...

  4. .20-浅析webpack源码之compile流程-Template模块

    这里的编译前指的是开始触发主要的事件流this-compilaiton.compilation之前,由于还有一些准备代码,这一节全部弄出来. 模块基本上只走构造函数,具体的方法调用的时候再具体讲解. ...

  5. Mouse点击之后,复制GridView控件的数据行

    本篇是实现用mouse点击GridView控件任意一行,把所点击的数据复制至另一个GridView控件上. 实现大概思路,把所点击的数据行的记录主键找出来,再去过滤数据源. 点击功能,已经实现,可以参 ...

  6. Direct2D教程I——简介及首个例子

    在博客园里,系统的Direct2D的教程比较少,只有“万一”写了一个关于Direct2D的系列(Delphi 2009).于是,仿照其系列,写一个在VS下的Direct2D系列教程. 博客园中的高手还 ...

  7. 地区picker 各选择器,优劣分析

    移动端选择器picker有很多,各大ui组件都有自己的picker,比如light7,HUI,MUI,jqueryUI等等.但是,我发现他们都有各种各样的问题.这次的地区选择,需要地区的省份+市+经纬 ...

  8. element-ui Message组件源码分析整理笔记(八)

    Message组件源码: main.js import Vue from 'vue'; import Main from './main.vue'; import { PopupManager } f ...

  9. Mac 上用 Homebrew 安装 .NET Core 1.0 RC4 004771

    年级大了,其实并不是很喜欢升级到最新版,特别是不怎么爱用还没有 Release 的版本了.虽然 .NET Core 已经是 RC4,但毕竟还没有 Release.可过年回来,用 yeoman 创建了一 ...

  10. ionic 项目内部更新用到的插件,退出app插件

    一 cordova-plugin-app-version插件  用来获取APP版本 ionic plugin add cordova-plugin-app-version -----cordova-p ...