0x01 初始化:

dcap = dict(DesiredCapabilities.PHANTOMJS)  #一些属性的设置
dcap["phantomjs.page.settings.loadImages"] = False #为了速度不加载图片信息,这个根据需要使用
 
obj = webdriver.PhantomJS(desired_capabilities=dcap, service_args=['--ssl-protocol=any '])  #--ssl-protocol=any 可以处理https请求
#phantomjs安装路径设置为环境变量,不需要指定executable_path,否则需要指定路径:
self.obj = webdriver.PhantomJS(executable_path='C:\Anaconda3\envs\python2\phantomjs.exe',
desired_capabilities=self.dcap,
service_args=['--ssl-protocol=any '])
obj.set_window_size(1920, 1080)   #设置页面尺寸
 
obj.switch_to.frame(0)  #切换frame    (有时候在一个页面上找不到这个控件,可能因为是不在一个frame下)
 

0x02 隐式等待implicitly_wait

obj.implicitly_wait(30)  
obj.set_page_load_timeout(30)
obj.set_script_timeout(30)
 
隐式等待只需要设置一次,影响范围是全局的,每次driver找不到元素时,最大的等待时间为这里设置的值,超时会抛出异常。
 
 

0x03 显示等待WebDriverWait(driver,time).until(EC.method(特征)):

使用方法如下所示:
#EC:expected condition
userName = WebDriverWait(self.obj, 30).until(
EC.presence_of_element_located((By.ID, 'login-username'))
)
 
常用方法有:
EC.presence_of_element_located(By.ID,'verification-code-field')  #通过元素ID名称查找
EC.presence_of_element_located(By.XPATH,'//*[@id="verification-code-field"]') #通过xpath表达式查找
EC.title_is('yahoo')  #判断页面title是否跳转
EC.title_contains('yahoo ') #判断页面title是否包含某字符串
 
xpath可以直接chrome浏览器F12,对控件右键copy xpath获取
 

0x04 控件常用属性

userName = obj.find_element_by_xpath('//*[@id="login-username"]')
userName.send_keys('username***')
 
nextStep =obj.find_element_by_xpath('//*[@id="login-signin"]')
nextStop.click()
 
tag = obj.find_element_by_xpath('//*[@id="j-dynamicMobile-code"]')
tag.get_attribute('style')  #获取html标签中style属性的值display: none;  <div id = "j-dynamicMobile-code" style=display: none; ></div>
 
code_click = obj.find_element_by_xpath( '//*[@id="j-msg-verifyCode"]')
code_click.text    #获取html标签中的text值text123456  <div id = "j-msg-verifyCode" >text123456</div>

0x05 页面常用属性

obj.title #获取页面title
obj.get_cookies() #获取cookies,list格式
obj.save_screenshot('1.png')  #截屏
obj.current_url  #当前页面url
obj.execute_script(js) #执行js脚本
 
其中get_cookies()获取的cookies格式如下:
[{u'domain': u'****.com', u'name': u'YM.NEO_120471291574672572', u'expires': u'\u5468\u4e8c, 10 \u56db\u6708 2018 01:24:35 GMT', u'value': u'width=400&height=300', u'expiry': 1523323475, u'path': u'/', u'httponly': False, u'secure': False},
{u'domain': u'****.com', u'name': u'AO', u'expires': u'\u5468\u516d, 09 \u4e00\u6708 2038 21:35:44 GMT', u'value': u'u=1', u'expiry': 2146685744, u'path': u'/', u'httponly': False, u'secure': False},
{u'domain': u'****.com', u'name': u'SSL', u'expires': u'\u5468\u56db, 10 \u4e00\u6708 2019 13:20:15 GMT', u'value': u'v=1&s=JRss2by53Dp_UyAgHAnKtQ7WbHyBKh2YVVPNqJTMZ47CbXzGGr3PFR.8LSZjSyfcRnuxeBpqhUlQAACFV4LD8A--&kv=0&ku=ca.60NUxQ6IC9KaLQ5hR1YPMAduovCmJxi0Q2VkWPntcZTYU1SkzPN7nOc1uSxAIaqd.6mkNItze8BTfcbK0PiRX9c21QXWzx7b_lrq6iVQsrwhkVKvavdeX.oZZmr9xL0ichLzj18.HdSCvu3zBAuukYUb.VnVWxpYXsUZiAfc-~A', u'expiry': 1547126415, u'path': u'/', u'httponly': True, u'secure': True},
{u'domain': u'****.com', u'name': u'Y', u'expires': u'\u5468\u56db, 10 \u4e00\u6708 2019 13:20:15 GMT', u'value': u'v=1&n=6p3rcmrtjkpr7&l=woe7pfn55vx38s3n6ab8nxgwpwha7fwxgvfxbcpf/o&p=o2rvvcn00000000&r=11k&lg=en-US&intl=us', u'expiry': 1547126415, u'path': u'/', u'httponly': False, u'secure': False},
{u'domain': u'****.com', u'name': u'PH', u'expires': u'\u5468\u56db, 10 \u4e00\u6708 2019 13:20:15 GMT', u'value': u'fn=NYKBW_gBAPLJS0KnfA--&l=en-US&i=us', u'expiry': 1547126415, u'path': u'/', u'httponly': False, u'secure': False},
{u'domain': u'****.com', u'name': u'F', u'expires': u'\u5468\u56db, 10 \u4e00\u6708 2019 13:20:15 GMT', u'value': u'd=Lph4flc9vLx42LHbzw2xpg6w1hwE02jYICiygdAC8MqZdQ--', u'expiry': 1547126415, u'path': u'/', u'httponly': True, u'secure': False},
{u'domain': u'****.com', u'name': u'T', u'expires': u'\u5468\u56db, 10 \u4e00\u6708 2019 13:20:15 GMT', u'value': u'z=2pWVaB299ZaBRjRRa42/gO4MzUxMQY2NTczMDY1TjYyMDMxMD&a=QAE&sk=DAAIpmMzwKlcVe&ks=EAAz5.zbUZKYh8EJPb3NzxJDw--~G&kt=EAA44rjxv3eEkIzNGQZb_woVw--~I&ku=FAACZjNX655IPazEVYcTxc3MzzP1A1xQOZaKRBCAs.e2rx.Hr6DJJMlxFQ5nFK.xn55VIs9Jg9kCH4Wu6lR8tH3j4iiKUoAcJNvqbOYaWkAOpIYOD5og0Q74ZwJTrVN3i8BxcXBEp.OSmDN9nZyzQ_j3Ryi5_SCc1Uu83mz25_Ys9U-~A&d=bnMBeWFob28BZwE0QjJXVEFJRDZUV1c0Wk9GNkE3S1ZQTUpESQFzbAFOREkyTmdFeE1qQTBOekV5T1RFMU56UTJOekkxTnpJLQFhAVFBRQFhYwFBQkpHbVZlYwFhbAF0b21va28xMjM0NTY3OAFzYwFkZXNrdG9wX3dlYgFmcwFZX05zbUF4YVZXcDIBenoBMnBXVmFCQTdF&af=JnRzPTE1MTU1NDcyNTQmcHM9UE8wTHBSV281dE9YT01tYUdsWXIwQS0t', u'expiry': 1547126415, u'path': u'/', u'httponly': True, u'secure': True},
{u'domain': u'****.com', u'name': u'B', u'expires': u'\u5468\u56db, 10 \u4e00\u6708 2019 13:20:15 GMT', u'value': u'2phekgdd5aqij&b=4&d=q5ScCIJpYFT.w1RzSOBSzDA_xpI-&s=c2&i=fbvNBhmwO6muMVqEznua', u'expiry': 1547126415, u'path': u'/', u'httponly': False, u'secure': False}
]
 
转换成dict格式的方法:
         cookie_list =obj.get_cookies()
print cookie_list
cookie_dict = {}
for cookie in cookie_list:
cookie_dict[cookie['name']] = cookie['value']
return cookie_dict
 
 
 

selenium + phantomJS 常用方法总结的更多相关文章

  1. selenium + phantomjs 爬取落网音乐

    题记: 作为一个业余程序猿,最大的爱好就是电影和音乐了,听音乐当然要来点有档次的.落网的音乐的逼格有点高,一听听了10年.学习python一久了,于是想用python技术把落网的音乐爬下来随便听. 目 ...

  2. 使用selenium+phantomJS实现网页爬取

    有些网站反爬虫技术设计的非常好,很难采用WebClient等技术进行网页信息爬取,这时可以考虑采用selenium+phantomJS模拟浏览器(其实是真实的浏览器)的方式进行信息爬取.之前一直使用的 ...

  3. Selenium + PhantomJS + python 简单实现爬虫的功能

    Selenium 一.简介 selenium是一个用于Web应用自动化程序测试的工具,测试直接运行在浏览器中,就像真正的用户在操作一样 selenium2支持通过驱动真实浏览器(FirfoxDrive ...

  4. 数据抓取的艺术(一):Selenium+Phantomjs数据抓取环境配置

     数据抓取的艺术(一):Selenium+Phantomjs数据抓取环境配置 2013-05-15 15:08:14 分类: Python/Ruby     数据抓取是一门艺术,和其他软件不同,世界上 ...

  5. 动态网页爬取例子(WebCollector+selenium+phantomjs)

    目标:动态网页爬取 说明:这里的动态网页指几种可能:1)需要用户交互,如常见的登录操作:2)网页通过JS / AJAX动态生成,如一个html里有<div id="test" ...

  6. python+selenium自动化软件测试(第6章):selenium phantomjs页面解析使用

    我们都知道Selenium是一个Web的自动化测试工具,可以在多平台下操作多种浏览器进行各种动作,比如运行浏览器,访问页面,点击按钮,提交表单,浏览器窗口调整,鼠标右键和拖放动作,下拉框和对话框处理等 ...

  7. 学习用java基于webMagic+selenium+phantomjs实现爬虫Demo爬取淘宝搜索页面

    由于业务需要,老大要我研究一下爬虫. 团队的技术栈以java为主,并且我的主语言是Java,研究时间不到一周.基于以上原因固放弃python,选择java为语言来进行开发.等之后有时间再尝试pytho ...

  8. 利用Selenium+PhantomJS 实现截图

    using OpenQA.Selenium; using OpenQA.Selenium.PhantomJS; using System; using System.Drawing; using Sy ...

  9. python selenium+phantomjs alert()弹窗报错

    问题:用selenium+phantomjs 模拟登陆,网页用JavaScript的alert("登陆成功")弹出框,但是用switch_to_alert().accept()报错 ...

随机推荐

  1. nohup npm start &启动之后关闭终端程序没有后台运行

    感谢:https://blog.csdn.net/nsj820/article/details/5862231 “在当shell中提示了nohup成功后,还需要按终端上键盘任意键退回到shell输入命 ...

  2. 通过ssh-copy-id免密码连接Linux主机

    Login Raspberry Pi without passcode via ssh-copy-id Generate public key $ ssh-keygen -t rsa Upload p ...

  3. vjudge 最大公约数GCD 直接求最大共约束和最小公倍数的指令

    原题链接https://vjudge.net/contest/331993#problem/C 输入2个正整数A,B,求A与B的最大公约数. Input2个数A,B,中间用空格隔开.(1<= A ...

  4. 打铁选手的 CDQ分治 刷题记录

    BZOJ3262 模板题,三位偏序. 注意第一维排完序之后再给二三维排序的时候还是要考虑下第一维的:如果二三维都相等的话第一维小的要在前面 代码: #include <bits/stdc++.h ...

  5. 二维数组填充datagridview

    public void TwoDArrayShowINDatagridview(string[,] arr) { DataTable dt = new DataTable(); for (int co ...

  6. Wannafly Camp 2020 Day 1I K小数查询 - 分块

    给你一个长度为\(n\)序列\(A\),有\(m\)个操作,操作分为两种: 输入\(x,y,c\),表示对\(i\in[x,y]\),令\(A_{i}=min(A_{i},c)\) 输入\(x,y,k ...

  7. Unable to create initial connections of pool. spring boot mysql

    Unable to create initial connections of pool. 在链接url里添加 将useSSL=true改为useSSL=false 只能说明服务器没有打开SSL功能

  8. pick the stone game

    我该如何去触摸这类问题嘞! 取石子游戏 1堆石子有n个,两人轮流取. 先取者第1次可以取任意多个,但不能全部取完. 以后每次取的石子数不能超过上次取子数的2倍. 取完者胜.先取者负输出"Se ...

  9. ubuntu系统定时运行 crontab

    1,crontab是个啥? ubuntu系统自带cron工具,cron是一个系统上的定时工具,用它的好处在于,不同的程序可以用同一个计时器,这样就省得不同程序各自sleep了,另外它还支持比较多的个性 ...

  10. sql server和my sql 命令(语句)的区别,sql server与mysql的比较

    sql与mysql的比较 1.连接字符串sql  :Initial Catalog(database)=x;  --数据库名称      Data Source(source)=x;        - ...