from selenium import webdriver
import time
# 打开浏览器
dr = webdriver.Chrome()
# 打开某个网址
dr.get('https://user.qzone.qq.com/2330331400/main')
# 切换框架
dr.switch_to_frame('login_frame')
time.sleep(1)
dr.find_element_by_link_text('帐号密码登录').click()
# 输入账号
dr.find_element_by_xpath('//*[@id="u"]').send_keys('')
time.sleep(8)
# 点击登录
dr.find_element_by_xpath('//*[@id="login_button"]').click()
time.sleep(2)
# 点击个人档
dr.find_element_by_xpath('//*[@id="menuContainer"]/div/ul/li[6]/a').click()
time.sleep(2)
# 请求好友的空间地址
dr.get('https://user.qzone.qq.com/481135195')
time.sleep(3)
# dr.switch_to_alert()
# dr.find_element_by_link_text('我知道了').click()
# 点击好友的个人档
dr.find_element_by_xpath('//*[@id="menuContainer"]/div/ul/li[6]/a').click()
time.sleep(1)
# 切换框架
dr.switch_to_frame('app_canvas_frame')
# 点击好友的个人资料
dr.find_element_by_link_text('个人资料').click()
# dr.find_element_by_link_text('//*[@id="info_link"]').click()
# 输入当前页面的源代码
print(dr.page_source) dr.get('https://user.qzone.qq.com/495483884')
time.sleep(3)
# dr.switch_to_alert()
# dr.find_element_by_link_text('我知道了').click()
dr.find_element_by_xpath('//*[@id="menuContainer"]/div/ul/li[6]/a').click()
time.sleep(1)
dr.switch_to_frame('app_canvas_frame')
dr.find_element_by_link_text('个人资料').click()
# dr.find_element_by_link_text('//*[@id="info_link"]').click()
print(dr.page_source)

python selenium爬取QQ空间方法的更多相关文章

  1. selenium爬取qq空间,requests爬取雪球网数据

    一.爬取qq空间好友动态数据 # 爬取qq空间好友状态信息(说说,好友名称),并屏蔽广告 from selenium import webdriver from time import sleep f ...

  2. python+selenium+requests爬取qq空间相册时遇到的问题及解决思路

    最近研究了下用python爬取qq空间相册的问题,遇到的问题及解决思路如下: 1.qq空间相册的访问需要qq登录并且需是好友,requests模块模拟qq登录略显麻烦,所以采用selenium的dri ...

  3. 使用Python+Selenium模拟登录QQ空间

    使用Python+Selenium模拟登录QQ空间爬QQ空间之类的页面时大多需要进行登录,研究QQ登录规则的话,得分析大量Javascript的加密解密,这绝对能掉好几斤头发.而现在有了seleniu ...

  4. Python+Selenium爬取动态加载页面(2)

    注: 上一篇<Python+Selenium爬取动态加载页面(1)>讲了基本地如何获取动态页面的数据,这里再讲一个稍微复杂一点的数据获取全国水雨情网.数据的获取过程跟人手动获取过程类似,所 ...

  5. Python+Selenium爬取动态加载页面(1)

    注: 最近有一小任务,需要收集水质和水雨信息,找了两个网站:国家地表水水质自动监测实时数据发布系统和全国水雨情网.由于这两个网站的数据都是动态加载出来的,所以我用了Selenium来完成我的数据获取. ...

  6. Python爬虫使用selenium爬取qq群的成员信息(全自动实现自动登陆)

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者: python小爬虫 PS:如有需要Python学习资料的小伙伴可以 ...

  7. Python_小林的爬取QQ空间相册图片链接程序

    前言 昨天看见某人的空间有上传了XXXX个头像,然后我就想着下载回来[所以本质上这是一个头像下载程序],但是一个个另存为太浪费时间了,上网搜索有没有现成的工具,居然要注册码,还卖45一套.你们的良心也 ...

  8. 用python爬取QQ空间

    好久没写博文了,最近捣鼓了一下python,好像有点上瘾了,感觉python比js厉害好多,但是接触不久,只看了<[大家网]Python基础教程(第2版)[www.TopSage.com]> ...

  9. Python爬虫实战:使用Selenium抓取QQ空间好友说说

    前面我们接触到的,都是使用requests+BeautifulSoup组合对静态网页进行请求和数据解析,若是JS生成的内容,也介绍了通过寻找API借口来获取数据. 但是有的时候,网页数据由JS生成,A ...

随机推荐

  1. win8.1安装密钥

    https://zhidao.baidu.com/question/374064869043943484.html

  2. git merge和git rebase的区别

    git merge是用来合并两个分支的.# 将b分支合并到当前分支git merge b git cherry-pick可以选择某一个分支中的一个或几个commit(s)来进行操作.例如,假设我 们有 ...

  3. php curl 并发

    1.比较普通的curl 请求 $ch = curl_init();//初始化curl curl_setopt($ch, CURLOPT_URL,$postUrl);//抓取指定网页 curl_seto ...

  4. mysql处理以逗号隔开的字段内容

    有一个字段保存了CheckBox内容,比如职业目标选择对于数据库字段otWorkgoal,保存了1,2,3,4内容 现在需要使用纯mysql语句,将字段otWorkgoal根据内容,进行翻译成中文的内 ...

  5. CF-339D-线段树

    http://codeforces.com/problemset/problem/339/D 给出一个序列.每次更改其中一个值然后询问序列的f(),序列的f()定义为: 每相邻两个元素按位或得到长度减 ...

  6. PAT 1008 Elevator

    1008 Elevator (20 分)   The highest building in our city has only one elevator. A request list is mad ...

  7. Space Ant

    Space Ant The most exciting space discovery occurred at the end of the 20th century. In 1999, scient ...

  8. 2015-09-16 html课程总结1

    HTML (HyperText Makeup Language)是超文本标记语言. 1.HTML结构 <html> <head> <title>标题</tit ...

  9. openssh安装/更新教程(CentOS)

    由于rpm包版本总落后于tar包,对于想安装新版本或由于漏洞需要更新到新版本那只能选择源代方式编译安装. 更新执行和安装一样的步骤就行了. 1.下载 官方网址:http://www.openssh.c ...

  10. a标签在编辑器中可以整体删除并且a标签为不可编辑的情况下 标签依然存在(棒棒哒)

    a标签在编辑器中可以整体删除并且a标签为不可编辑的情况下 标签依然存在 因为给a标签的后面 添加了一个空元素,如<i></i>(棒棒哒)<div contentEdita ...