使用Selenium登录新浪微博

为了总结一下Selenium的用法，具体用了这个例子来说明一下。

Selenium简单来说，就是通过程序驱动一个浏览器，并且可以通过程序来帮你做一些事情，例如点击、填表呀之类的。

换句话说，你在浏览器上面看到的东西，他都能给你呈现；你能在页面上做的东西，它也能做。

Selenium厉害的地方在于，它是一个真正的浏览器，可以对js，css进行渲染，所以WebMagic这个爬虫也整合了这个DownLoader。

但是效率低，因为要打开一个个浏览器。

言归正传，下面介绍使用方法。

1、首先，要有Selenium的jar包。

2、其次、要有合适的浏览器驱动。（例如Chrome的驱动是chromedriver.exe）

3、辅助工具，Selenium IDE，可以跟踪你在页面上做了什么。（不过一些复杂的页面的话，效果不好）

public static void main(String args[]) throws InterruptedException{

//设置浏览器驱动的位置，很重要，不然打开的话可能是空白页
System.setProperty("webdriver.chrome.driver", "C:\\Program Files (x86)\\Google\\Chrome\\Application\\chromedriver_x64.exe");

//实例化一个浏览器对象
WebDriver driver = new ChromeDriver();

//网址（手机版的新浪微博，因为这个网站登录不要验证码）
String baseUrl = "https://passport.weibo.cn/signin/login?entry=mweibo&res=wel&wm=3349&r=http%3A%2F%2Fm.weibo.cn%2F";

//打开浏览器
driver.get(baseUrl);

//这个时候会打开一个浏览器，连接到你所get的网站

//因为网站不一定可以马上打开，让进程停一下，否则页面的元素会找不到。
Thread.sleep(5000);

//打开后的页面

//我们要填写的地方有两个，帐号、密码，然后再点击登录。

//找到名为"loginName"的元素，填写帐号
driver.findElement(By.id("loginName")).clear();
driver.findElement(By.id("loginName")).sendKeys("帐号");

//找到名为"loginPassword"的元素，填写密码
driver.findElement(By.id("loginPassword")).clear();
driver.findElement(By.id("loginPassword")).sendKeys("密码");

//找到登录按钮，点击
driver.findElement(By.id("loginAction")).click();

//然后这个页面就会进入到登录后的界面了

//因为网站不一定可以马上打开，让进程停一下，否则页面还没有加载出来就进行下一步了。
Thread.sleep(5000);

}

//一些延伸

//获取cookies

Set<Cookie> cookies = driver.manage().getCookies();
String cookieStr = "";
for (Cookie cookie : cookies) {
cookieStr += cookie.getName() + "=" + cookie.getValue() + "; ";
}

//不过一个WebDriver在登录后自带了Cookies了，直接打开其他地方也是可以的

注意： WebDriver打开的是一个纯净的，不带任何插件和Cookies的浏览器！

使用Selenium登录新浪微博的更多相关文章

【Python3爬虫】最新的模拟登录新浪微博教程
一.写在前面首先呢,由于之前重装系统,又要重新配置环境,然后还有一些别的事,导致我一直没有写爬虫了,不过现在又可以继续写了. 然后我这次说的模拟登录新浪微博呢,不是使用Selenium模拟浏览器操作 ...
Python+selenium登录测试
我们以登录新浪微博为案例来讲解,首先进入登录页面,输入用户名和密码,点击登录按钮,并且获得用户信息以验证是否登录成功. Web地址:https://login.sina.com.cn/signup/s ...
Cookies与保持登录(新浪微博的简单模拟登录)
Cookies与保持登录(新浪微博的简单登录) .note-content {font-family: "Helvetica Neue",Arial,"Hiragino ...
Python爬虫学习——使用Cookie登录新浪微博
1.首先在浏览器中进入WAP版微博的网址,因为手机版微博的内容较为简洁,方便后续使用正则表达式或者beautifulSoup等工具对所需要内容进行过滤 https://login.weibo.cn/l ...
测试开发Python培训：模拟登录新浪微博-技术篇
测试开发Python培训:模拟登录新浪微博-技术篇一般一个初学者项目的起点就是登陆功能的自动化,而面临的项目不同实现的技术难度是不一样的,poptest在做测试开发培训中更加关注技术难点,掌握技 ...
Java实现模拟登录新浪微博
毕设题目要使用到新浪微博数据,所以要爬取新浪微博的数据.一般而言,新浪微博的爬虫有两种模式:新浪官方API和模拟登录新浪微博.两种方法的异同点和适用情况就无须赘述了.前辈的文章已经非常多了.写这篇文章 ...
模拟登录新浪微博（Python)
PC 登录新浪微博时, 在客户端用js预先对用户名.密码都进行了加密, 而且在POST之前会GET 一组参数,这也将作为POST_DATA 的一部分. 这样, 就不能用通常的那种简单方法来模拟POST ...
模拟登录新浪微博（Python) - 转
Update: 如果只是写个小爬虫,访问需要登录的页面,采用填入cookie 的方法吧,简单粗暴有效,详细见:http://www.douban.com/note/264976536/模拟登陆有时需要 ...
使用Selenium对新浪微博模拟登录
Selenium的配置在项目中引入Selenium库下载chromedriver.exe 在项目代码中加入chromedriver位置的配置使用Selenium Selenim语法智能等待隐 ...

随机推荐

【Python】小技巧
1. 退出python shell 在windows下,Ctrl + Z退出在unix下,Ctrl + D退出
用fail2ban阻止ssh暴力破解root密码
安装fail2ban工具来实现防暴力破解,防止恶意攻击,锁定恶意攻击IP. 1.如果是centos系统,先yum安装fail2ban [root@VM_152_184_centos /]# yum - ...
全局ajax事件
必须当页面上存在任何ajax请求的时候都将触发这些特定的全局ajax处理函数. 如果在jQuery.ajaxSetup()中的global属性设置成true,那么这些全局函数将会在每一个ajax上面都 ...
《模式工程化实现及扩展 (设计模式 C#版)》 - 书摘精要
(P3) 面向对象的典型原则可以划分为两类 —— “面向类”的和“面向包”的: “面向类”的,包括:SRP —— 单一职责原则:OCP —— 开放封闭原则:LSP —— 里氏替换原则:DIP —— 依 ...
L129
Iraq Sees Spike in Water-Borne IllnessesIraqi health officials say that a health crisis stemming fro ...
一个css3 旋转效果 -- 待续
<div class="container"> <div> <figure></figure> <figure>< ...
vim自动打开跳到上次的光标位置
只需要vimrc里面加一个稍微复杂一点的autocmd就搞定了: if has("autocmd") au BufReadPost * && line(" ...
伪元素:focus-within
1.盒子边框的线条动画: <div class="cont"> <div class="bb"></div> </di ...
【MFC】MFC技巧学习当做字典来查
MFC技巧学习摘自:http://www.cnblogs.com/leven20061001/archive/2012/10/17/2728023.html 1．"属性页的添加:创建对话框 ...
深入理解java虚拟机-第六章
第6章类文件 6.3 Class类文件的结构 Class文件是一组以8位字节为基础单位的二进制流. Class文件格式采用一种类似C语言结构伪结构存储数据,这种伪结构中只有两种数据类型:无符号数和表 ...

使用Selenium登录新浪微博

使用Selenium登录新浪微博的更多相关文章

随机推荐

热门专题