Selenium库的基本使用

 

  1.基本使用

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.wait import WebDriverWait brower = webdriver.Chrome()
try:
brower.get('https://www.baidu.com')
input = brower.find_element_by_id('kw')#查找id为kw的元素
input.send_keys('Python')#向input文本框输入python
input.send_keys(Keys.ENTER)#输入回车
wait = WebDriverWait(brower,10)#等待浏览器加载
wait.until(EC.presence_of_element_located((By.ID,'content_left')))#查找id为content——left的对象
print(brower.current_url)#输出当前的url
print(brower.get_cookies())#输出当前的cookies
print(brower.page_source)#输出当前的网页源码
finally:
brower.close()

  2.声明浏览器对象

from selenium import webdriver

brower = webdriver.Chrome()
brower = webdriver.Firefox()
brower = webdriver.Edge()
brower = webdriver.PhanromJS()
brower = webdriver.Safari()

  3.访问页面

from selenium import webdriver
brower = webdriver.Chrome()
brower.get('https://ww.taobao.com')
print(brower.page_source)
brower.colse()

  4.查找元素

  单个元素

from selenium import webdriver
browser = webdriver.Chrome()
browser.get('https://www.taobao.com')
input_first=browser.find_element_by_id('q')
input_second = browser.find_element_by_css_selector('#q')
input_third = browser.find_element_by_xpath('//*[@id="q"]')
print(input_first,input_second,input_third)
browser.close()

结果:

<selenium.webdriver.remote.webelement.WebElement (session="aafcd8308ef345a4014a0db417267640", element="0.8704970628206692-1")> <selenium.webdriver.remote.webelement.WebElement (session="aafcd8308ef345a4014a0db417267640", element="0.8704970628206692-1")> <selenium.webdriver.remote.webelement.WebElement (session="aafcd8308ef345a4014a0db417267640", element="0.8704970628206692-1")>

from selenium import webdriver from selenium.webdriver.common.by 
import By browser = webdriver.Chrome()
browser.get('https://www.taobao.com')
input_first=browser.find_element(By.ID,'q')
print(input_first) browser.close()

结果:
<selenium.webdriver.remote.webelement.WebElement (session="ad3663f850d6c3fd81751c5c8cf45511", element="0.6365953152365587-1")>
 

  多个元素

from selenium import webdriver
browser = webdriver.Chrome()
browser.get('https://www.taobao.com')
list=browser.find_elements_by_css_selector('.service-bd li')
print(list)
browser.close() from selenium import webdriver
browser = webdriver.Chrome()
browser.get('https://www.taobao.com')
list=browser.find_elements(By.CSS_SELECTOR,'.service-bd li')
print(list)
browser.close()

  5.元素交互操作

from selenium import webdriver
import time
browser = webdriver.Chrome()
browser.get('https://www.taobao.com')
input=browser.find_element_by_id('q')
input.send_keys('iPhone')
time.sleep(1)
input.clear()
input.send_keys('iPad')
button = browser.find_element_by_class_name('btn-search')
button.click()

  6.交互动作

from selenium import webdriver
from selenium.webdriver import ActionChains
brower=webdriver.Chrome()
url="https://www.runoob.com/try/try.php?filename=jqueryui-api-droppable"
brower.get(url)
brower.switch_to.frame('iframeResult')
source=brower.find_element_by_css_selector('#draggable')
target=brower.find_element_by_css_selector('#droppable')
action=ActionChains(brower)
action.drag_and_drop(source,target)
action.perform()

  7.执行JavaScript

from selenium import webdriver
brower = webdriver.Chrome()
brower.get('https://www.zhihu.com/explore')
brower.execute_script('window.scrollTo(0,document.body.scrollHeight)')
brower.execute_script('alert("To Bottom")')

  8.获取属性

from selenium import webdriver
from selenium.webdriver import ActionChains
brower = webdriver.Chrome()
url='https://www.zhihu.com/explore'
brower.get(url)
logo = brower.find_element_by_id('zh-top-link-logo')
print(logo)
print(logo.get_attribute('class'))

获取:
<selenium.webdriver.remote.webelement.WebElement (session="5578b6070e5cd404d5636c6c15d1062e", element="0.2337143497044789-1")>
zu-top-link-logo

  9.获取文本值

from selenium import webdriver
brower = webdriver.Chrome()
url='https://www.zhihu.com/explore'
brower.get(url)
input=brower.find_element_by_class_name('zu-top-add-question')
print(input.text)

结果:
提问

  10.获取ID,位置,标签名,大小

from selenium import webdriver
brower = webdriver.Chrome()
url='https://www.zhihu.com/explore'
brower.get(url)
input=brower.find_element_by_class_name('zu-top-add-question')
print(input.id)
print(input.location)
print(input.tag_name)
print(input.size)

结果:
0.5790966028649505-1
{'x': 760, 'y': 7}
button
{'height': 32, 'width': 66}

  11.Frame

import time
from selenium import webdriver
from selenium.common.exceptions import NoSuchElementException
brower = webdriver.Chrome()
url="https://www.runoob.com/try/try.php?filename=jqueryui-api-droppable"
brower.get(url)
brower.switch_to.frame('iframeResult')
source=brower.find_element_by_css_selector('#draggable')
print(source)
try:
logo=brower.find_element_by_class_name('logo')
except NoSuchElementException:
print('No Logo')
brower.switch_to.parent_frame()
logo=brower.find_element_by_class_name('logo')
print(logo)
print(logo.text) 结果:
<selenium.webdriver.remote.webelement.WebElement (session="4515a548a628f32ec7ebb86b845cafbc", element="0.47138378750440957-1")>
No Logo
<selenium.webdriver.remote.webelement.WebElement (session="4515a548a628f32ec7ebb86b845cafbc", element="0.590628320406164-2")>
RUNOOB.COM

  12.隐式等待

from selenium import webdriver
brower = webdriver.Chrome()
brower.get('https://www.zhihu.com/explore')
brower.implicitly_wait(10)
input=brower.find_element_by_class_name('zu-top-add-question')
print(input) 结果:
<selenium.webdriver.remote.webelement.WebElement (session="df8f8bebb2cf5356c12442f1bcc5c2f7", element="0.40275892523916035-1")>

  13.显示等待

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.wait import WebDriverWait
brower = webdriver.Chrome()
brower.get('https://www.taobao.com')
wait=WebDriverWait(brower,10)
input=wait.until(EC.presence_of_element_located((By.ID,'q')))
button=wait.until(EC.element_to_be_clickable((By.CSS_SELECTOR,'.btn-search')))
print(input,button) 结果:
<selenium.webdriver.remote.webelement.WebElement (session="036c1bc8fad6ee8e9ee42266ce163be7", element="0.8588910449888032-1")> <selenium.webdriver.remote.webelement.WebElement (session="036c1bc8fad6ee8e9ee42266ce163be7", element="0.8588910449888032-2")>

  14.前进后退

from selenium import webdriver
import time
brower = webdriver.Chrome()
brower.get('https://www.baidu.com')
brower.get('https://www.taobao.com')
brower.get('https://www.python.org')
brower.back()
time.sleep(1)
brower.forward()
brower.close()

  15.Cookies

from selenium import webdriver
brower = webdriver.Chrome()
brower.get('https://www.zhihu.com/explore')
print(brower.get_cookies())
brower.add_cookie({'name':'name','domain':'www.zhihu.com','value':'germey'})
print(brower.get_cookies())
brower.delete_all_cookies()
print(brower.get_cookies())

  16.选项卡管理

import time
from selenium import webdriver brower = webdriver.Chrome()
brower.get('https://www.baidu.com')
brower.execute_script('window.open()')
print(brower.window_handles)
brower.switch_to_window(brower.window_handles[1])
brower.get('https://www.taobao.com')
time.sleep(1)
brower.switch_to_window(brower.window_handles[0])
brower.get('https://www.python.org')

结果:
['CDwindow-4971CB8E7903DFAE9CBA82A6A5F05DB2', 'CDwindow-652D8829B41E67E7F7E8C2E146F8C353']

  17.异常处理

from selenium import webdriver
brower=webdriver.Chrome()
brower.get('https://www.baidu.com')
brower.find_element_by_id('hello')
from selenium import webdriver
from selenium.common.exceptions import TimeoutException,NoSuchElementException
brower=webdriver.Chrome()
try:
brower.get('https://www.baidu.com')
except TimeoutException:
print('Time Out')
try:
brower.find_element_by_id('hello')
except NoSuchElementException:
print('No Element')
finally:
brower.close() 结果:
No Element

Selenium 库的基本用法的更多相关文章

  1. python爬虫---selenium库的用法

    python爬虫---selenium库的用法 selenium是一个自动化测试工具,支持Firefox,Chrome等众多浏览器 在爬虫中的应用主要是用来解决JS渲染的问题. 1.使用前需要安装这个 ...

  2. PYTHON 爬虫笔记七:Selenium库基础用法

    知识点一:Selenium库详解及其基本使用 什么是Selenium selenium 是一套完整的web应用程序测试系统,包含了测试的录制(selenium IDE),编写及运行(Selenium ...

  3. python爬虫---从零开始(六)Selenium库

    什么是Selenium库: 自动化测试工具,支持多种浏览器.支持的浏览器包括IE(7, 8, 9, 10, 11),Mozilla Firefox,Safari,Google Chrome,Opera ...

  4. Python Selenium库

    Selenium库 自动化测试工具,支持多种游览器 爬虫中主要用来解决JavaScript渲染的问题 安装Selenium pip3 install selenium 安装游览器驱动 下载驱动地址:h ...

  5. 为采集动态网页安装和测试Python Selenium库

    1. 引言上一篇<为编写网络爬虫程序安装Python3.5>中测试小例子对静态网页做了一个简单的采集程序,而动态网页因为需要动态加载js获取数据,所以使用urllib直接openurl已经 ...

  6. c/c++ 重载运算符 标准库function的用法

    重载运算符 标准库function的用法 问题:int(int, int)算不算一种比较通用的类型?? 比如函数: int add(int a, int b); 比如lambda:auto mod = ...

  7. python利用selenium库识别点触验证码

    利用selenium库和超级鹰识别点触验证码(学习于静谧大大的书,想自己整理一下思路) 一.超级鹰注册:超级鹰入口 1.首先注册一个超级鹰账号,然后在超级鹰免费测试地方可以关注公众号,领取1000积分 ...

  8. Python爬虫入门之Urllib库的高级用法

    1.设置Headers 有些网站不会同意程序直接用上面的方式进行访问,如果识别有问题,那么站点根本不会响应,所以为了完全模拟浏览器的工作,我们需要设置一些Headers 的属性. 首先,打开我们的浏览 ...

  9. Python爬虫Urllib库的高级用法

    Python爬虫Urllib库的高级用法 设置Headers 有些网站不会同意程序直接用上面的方式进行访问,如果识别有问题,那么站点根本不会响应,所以为了完全模拟浏览器的工作,我们需要设置一些Head ...

随机推荐

  1. 关于Redis客户端显示中文或中文乱码问题的解决

    关于Redis客户端不显示中文或者显示中文乱码,网上有些解决办法不全面的,都是漏了步骤不讲,简直瞎扯.在此记录一下解决方式. 刚开始使用Redis客户端的时候,本身就是默认不支持显示中文的. 例如,进 ...

  2. 使用MyQR模块生成二维码

    一.介绍 MyQR 模块是 python 的一个外部库,能够将文本或网址转为二维码,扫了之后就能查看文本或跳转到相应网站. 它是一个外部库,需要导入: pip install -i https://p ...

  3. Weekly Contest 184

    1408. String Matching in an Array Given an array of string words. Return all strings in words which ...

  4. 病毒木马查杀实战第012篇:QQ盗号木马之逆向分析

    前言 在本系列的文章中,对每一个病毒分析的最后一个部分,若无特殊情况,我都会采用逆向分析的手段来为读者彻底剖析目标病毒.但是之前的"熊猫烧香"病毒,我用了三篇文章的篇幅(每篇250 ...

  5. hdu1671 字典树记录前缀出现次数

    题意:       给你一堆电话号,问你这些电话号后面有没有相互冲突的,冲突的条件是当前这个电话号是另一个电话号的前缀,比如有 123456789 123,那么这两个电话号就冲突了,直接输出NO. 思 ...

  6. hdu 5059 判断数字表示方式以及范围合法(int型之内)

    题意:       给你一个串和两个整数a,b,问你这个串表示的数字是否合法,并且在a,b之间, 和法的要求是无论是正数还是负数都没有前导0,并且注意 -0 是不合法的. 思路:       写了将近 ...

  7. Web漏洞小结

    本文是对Web中最常见漏洞的一个小结: 注入类漏洞: SQL注入:SQL注入漏洞详解 XML注入:XXE(XML外部实体注入) 代码注入:代码注入漏洞 CRLF注入:CRLF注入 注入类漏洞是应用违背 ...

  8. Tomcat反序列化漏洞(CVE-2016-8735)

    目录​​​​​​​ CVE-2016-8735 漏洞复现 漏洞修复: CVE-2016-8735 漏洞描述: 该漏洞与之前Oracle发布的 mxRemoteLifecycleListener 反序列 ...

  9. pr加字幕

    选择免费字体 自由字体整理了免费的商用字体 安装字体 将下载好的.ttf文件,右键选择为所有用户安装 如果没有选择为所有用户安装,你在Arctime或者premiere中可能无法找到这个字体 而且想要 ...

  10. 2021最新Java面试题全集-20210326版

    在手撕了数千道网络流传的面试题,外加十多个不眠之夜, 终于从里面精心挑选出约500道题目, 做为大家求职.跳槽前复习准备面试使用. 一:挑选题目的原则: 常考的.常被面试问到的 题目有一定的深度和难度 ...