python selenium API 常用方法
配置使用环境
下载相应的浏览器驱动, Firefox 是默认的
本文以 chrome 为主 ,放在scripts目录下
ChromeDriver 官方下载地址 : 所有版本的 ChromeDriver
文档参考
一份简单的测试 demo
关于 360 haosou.com 的测试 :
1 #coding=utf-8
2 from selenium import webdriver
3 import os
4 import time 5 # set little time stop and big time stop for viewing changes
6 little_time_stop = 1
7 big_time_stop = 2
8 # 默认广告条数
9 ads_num_require = 8
10 # 请求连接
11 req_url = "http://www.haosou.com/s?ie=utf-8&shb=1&src=360sou_newhome&q=%E9%B2%9C%E8%8A%B1"
12 # 打开浏览器
13
14 browser = webdriver.Chrome()
15 # 开始请求
16 17 browser.get(req_url)
18 # 获取所有的广告
19
20 all_ads_li = browser.find_elements_by_css_selector('#e_idea_pp li')
21 # 当前广告条数
22 ads_num_current = len(all_ads_li)
23 print "Has been got %d ads" %(ads_num_current)
24 # 如果广告条数与默认不符
25 if ads_num_current < ads_num_require:
26 print "The number of ads is not enough ( current : %d require: %d)" %(ads_num_current,ads_num_require)
27 # exit()
28 # 获取顶部连接
29 i = 0
30 for ads_li in all_ads_li:
31 time.sleep(big_time_stop)
32 i = i+1
33 print "ads %d :" %i
34 try:
35 main = ads_li.find_element_by_css_selector('h3 a')
36 except:
37 print "\tError: ads %d cann't find" %(i)
38 else:
39 print "\tReady: visit ads %d" %(i)
40 main.click()
41 print "\tSucess: visit ads %d" %(i)
42 time.sleep(little_time_stop)
43 try:
44 img_link = ads_li.find_element_by_class_name('e_biyi_img')
45 except:
46 print "\tError : no img in ads %d " %(i)
47 else:
48 print "\tReady : visit img_link %d" %(i)
49 img_link.click()
50 print "\tSuccess : visit img_link %d" %(i)
51 time.sleep(little_time_stop)
52 try:
53 child_div = ads_li.find_element_by_class_name('e_biyi_childLink');
54 except:
55 print "\tError : no child link in ads %d" %(i)
56 else:
57 try:
58 child_links = child_div.find_elements_by_css_selector('a')
59 except:
60 print "\tError : find child_links error"
61 else:
62 num_links = len(child_links)
63 print "\tSuccess : there are %d child_links" %(num_links)
64 j = 0
65 for child_a in child_links:
66 j = j + 1
67 print "\t\tReady : visit child link %d in ads %d" %(j, i)
68 child_a.click()
69 print "\t\tSuccess : visit child link %d in ads %d" %(j, i)
70 time.sleep(little_time_stop)
71 print "End and thanks for your using!"
72 # 下面代码选择取消注释
73 # 延时
74 # time.sleep(5)
75 # 关闭当前窗口
76 # browser.close()
77 # 关闭所有已经打开的窗口
78 # browser.quit()
定位操作
以下是所有定位操作的 API :
返回一个匹配元素, 即一个 WebElement 元素
find_element_by_id()
find_element_by_name()
find_element_by_class_name()
find_element_by_tag_name()
find_element_by_link_text()
find_element_by_partial_link_text()
find_element_by_xpath()
find_element_by_css_selector()
返回一个列表, 包含所有匹配的元素, 即一个 WebElement 列表
find_elements_by_id()
find_elements_by_name()
find_elements_by_class_name()
find_elements_by_tag_name()
find_elements_by_link_text()
find_elements_by_partial_link_text()
find_elements_by_xpath()
find_elements_by_css_selector()
使用的时候需注意下面几点 :
- python selenium 提供了两种对象 :
WebDriver和WebElement
这两种对象都可以使用这些 API - 这些 API 一旦执行失败(即查找不到), 就会抛出异常
因此必须使用try: .. except: ...机制避免错误的行为影响程序继续进行 WebDriver调用以上 API 进行全局定位WebElement调用以上 API 可以进行层级定位, 即查找当前元素的子元素
WebDriver 的使用
开始的时候必须要有初始化一个 WebDriver 实例, 即下面的 browser 用来对浏览器进行控制以及页面的访问
# 请求连接req_url = "http://www.haosou.com/s?ie=utf-8&shb=1&src=360sou_newhome&q=%E9%B2%9C%E8%8A%B1"# 打开浏览器browser = webdriver.Chrome()# 开始请求browser.get(req_url)
接着, 就可以使用异常 API 进行当前页面的全局查找, 比如 :
# 获取所有的广告all_ads_li = browser.find_elements_by_css_selector('#e_idea_pp li')
WebElement 的使用
使用
browser.find_element_by_xx()得到的是一个WebElement实例
使用获得的实例调用上面的 API 即可进行层级查找使用
browser.find_elements_by_xx()得到的是一个元素是WebElement实例的 list
通过对 list 的遍历, 即可对各个实例进行相应的操作
WebDriver 的一些常用操作
browser.curren_url: 获取当前加载页面的 URLbrowser.close(): 关闭当前窗口, 如果当前窗口是最后一个窗口, 浏览器将关闭browser.quit(): 关闭所有窗口并停止 ChromeDriver 的执行browser.add_cookie(cookie_dict): 为当前会话添加 cookiebrowser.get_cookie(name): 得到执行 cookiebrowser.get_cookies(): 得到所有的 cookiedriver.add_cookie({‘name’ : ‘foo’, ‘value’ : ‘bar’}) driver.add_cookie({‘name’ : ‘foo’, ‘value’ : ‘bar’, ‘path’ : ‘/’}) driver.add_cookie({‘name’ : ‘foo’, ‘value’ : ‘bar’, ‘path’ : ‘/’, ‘secure’:True})
browser.delete_all_cookies(): 删除当前会话的所有cookiebrowser.delete_cookie(name): 删除指定 cookiebrowser.back(): 相当于浏览器的后退历史记录browser.forward(): 相当于浏览器的前进历史记录browser.execute_script(script, *args): 同步执行 js 脚本browser.execute_async_script(script, *args): 异步执行 js 脚本browser.get(url): 在当前窗口加载 urlbrowser.refresh(): 刷新当前页面browser.current_window_handle: 当前窗口的 handle, 相当于一个指针一样的东西, 用来指向当前窗口browser.window_handles: 当前浏览器中的已经打开的所有窗口, 是一个 listbrowser.switch_to_window(window_handle): 切换 window_handle 指向的窗口browser.title: 当前页面的 titlebrowser.name: 当前浏览器的名字
WebElement 的一些常用操作
webEle.clear(): 清楚元素的内容, 假如这个元素是一个文本元素webEle.click(): 点击当前元素webEle,is_displayed(): 当前元素是否可见webEle.is_enabled(): 当前元素是否禁止, 比如经常会禁用一些元素的点击webEle.is_selected(): 当前元素是否选中, 文本输入框的内容webEle.send_keys(*value): 向当前元素模拟键盘事件webEle.submit(): 提交表单webEle.tag_name: 当前元素的标签名webEle.text: 当前元素的内容webEle.get_attribute(name): 获取当前元素执行属性的值
python selenium API 常用方法的更多相关文章
- Python Selenium Webdriver常用方法总结
Python Selenium Webdriver常用方法总结 常用方法函数 加载浏览器驱动: webdriver.Firefox() 打开页面:get() 关闭浏览器:quit() 最大化窗口: m ...
- python+selenium+API
一.浏览器操作 1.浏览器最大化 driver.maximize_window() #将浏览器最大化显示 2.设置浏览器宽.高 driver.set_window_size(480, 800)#设置浏 ...
- python selenium --一些常用方法
· text 获取该元素的文本 · submit 提交表单 · get_attribute 获得属性值 text 用于获取元素的文本信息 下面把百度首页底部的声明打印输出 #coding=u ...
- Selenium API常用方法
driver.findElements()//定位一组List元素集合 driver.findElement()//定位一个元素 driver.getTitle()//获取页面标题 driver.ge ...
- Python+Selenium笔记(十四)鼠标与键盘事件
(一) 前言 Webdriver高级应用的API,允许我们模拟简单到复杂的键盘和鼠标事件,如拖拽操作.快捷键组合.长按以及鼠标右键操作,都是通过使用webdriver的Python API 中的Ac ...
- Python+selenium常用方法(Webdriver API)
小编整理了目前学习的Python+selenium常用的一些方法函数,以后有新增再随时更新. 加载浏览器驱动: webdriver.Firefox() 打开页面:get() 关闭浏览器:quit() ...
- WEB自动化(Python+selenium)的API
在做Web自动化过程中,汇总了Python+selenium的API相关方法,给公司里的同事做了第二次培训,分享给大家 ...
- Selenium2+python自动化27-查看selenium API
前言 前面都是点点滴滴的介绍selenium的一些api使用方法,那么selenium的api到底有多少呢?本篇就叫大家如何去查看selenium api,不求人,无需伸手找人要,在自己电脑就有. p ...
- python+selenium自动化软件测试(第2章):WebDriver API
2.1 操作元素基本方法 前言前面已经把环境搭建好了,从这篇开始,正式学习selenium的webdriver框架.我们平常说的 selenium自动化,其实它并不是类似于QTP之类的有GUI界面的可 ...
随机推荐
- 【转】分布式文件系统FastDFS架构剖析
FastDFS是一款类Google FS的开源分布式文件系统,它用纯C语言实现,支持Linux.FreeBSD.AIX等UNIX系统.它只能通过专有API对文件进行存取访问,不支持POSIX接口方式, ...
- 对Sting类型的探讨
string类型经常和基本数据类型一起被我们熟练运用,但却不被归为基本数据类型,他是特殊的引用类型.引用数据类型还有类,接口.数组.枚举类型和注解类型. 我们来看下jdk对他的解释: String是在 ...
- ThinkPHP系统常量
_ROOT__ : 网站根目录地址 __APP__ : 当前项目(入口文件)地址 __URL__ : 当前模块地址 __ACTION__ : 当前操作地址 __SELF__ : 当前 URL 地址 _ ...
- 6.Servlet、Filter过滤器以及监听器
Servlet 是运行在Web服务器端的Java程序,它使用Java语言编写,与Java程序的区别是Servlet对象主要封装了对HTTP请求的处理,并且它的运行需要Servlet容器的支持,在Jav ...
- 三元环HDU 6184
HDU - 6184 C - Counting Stars 题目大意:有n个点,m条边,问有一共有多少个‘structure’也就是满足V=(A,B,C,D) and E=(AB,BC,CD,DA,A ...
- noi.ac #535 生成树
题目链接:戳我 我们考虑按照编号依次加点,然后维护一个栈. 预设生成树的颜色为color. 对于当前点x,如果它和栈首的点连边颜色相同,那么他们的连边可以作为生成树上面的边,点i已经连接,直接brea ...
- Python基础之注释
有时候我们写的东西不一定都是给用户看的,或者不希望解释器执行,那么我们可以选择注释掉代码. 被注释的内容是不会执行的,可以方便在以后能读懂代码. 注释分为两种,一种是单行注释,一种是多行注释. 单行注 ...
- JavaWeb_(Struts2框架)Log4j的配置以及解决中文乱码
此系列博文基于同一个项目已上传至github 传送门 JavaWeb_(Struts2框架)Struts创建Action的三种方式 传送门 JavaWeb_(Struts2框架)struts.xml核 ...
- vue-loader+webpack配置项目流程
前提:安装了node.js与npm 1.建立一个npm项目 新建项目文件夹,打开终端,将路径移动至此文件夹,初始化输入 npm init 按照提示输入项目名称,描述,作者等信息(可回车跳过) 成功创建 ...
- django分页模块--django-pure-pagination
Django自带有分页的两个类,但是用起来没有第三方这个分页模块方便,下面介绍一下这个模块的使用方法. 1. 安装模块: pip install django-pure-pagination 2. ...