Python爬虫(二十二)_selenium案例：模拟登陆豆瓣

本篇博客主要用于介绍如何使用selenium+phantomJS模拟登陆豆瓣，没有考虑验证码的问题，更多内容，请参考：Python学习指南

#-*- coding:utf-8 -*-

from selenium import webdriver

from selenium.webdriver.common.keys import Keys

import time

#如果获取页面时获取不到文本内容，加入下面参数

driver = webdriver.PhantomJS(service_args=['--ignore-ssl-errors=true', '--ssl-protocol=any'])

driver.set_window_size(1366, 768)

driver.get("http://www.douban.com/")

print(driver.page_source)

#输入账号和密码

driver.find_element_by_name("form_email").send_keys("1216938752@qq.com")

driver.find_element_by_name("form_password").send_keys('chenqi1992')

#模拟点击登录

driver.find_element_by_xpath("//input[@class='bn-submit']").click()

#等待3秒

time.sleep(3)

#生成登录后快照

with open('douban.html', 'w') as file:

    file.write(driver.page_source.encode('UTF-8'))

driver.quit()

期初使用driver = webdriver.PhantomJS(),返回的只是,增加了参数就可以了

参考：

Python爬虫(二十二)_selenium案例：模拟登陆豆瓣的更多相关文章

Python爬虫实例（四）网站模拟登陆
一.获取一个有登录信息的Cookie模拟登陆下面以人人网为例,首先使用自己的账号和密码在浏览器登录,然后通过抓包拿到cookie,再将cookie放到请求之中发送请求即可,具体代码如下: # -*- ...
Python爬虫(二十四)_selenium案例：执行javascript脚本
本章叫介绍如何使用selenium在浏览器中使用js脚本,更多内容请参考:Python学习指南隐藏百度图片 #-*- coding:utf-8 -*- #本篇将模拟执行javascript语句 fr ...
[Python爬虫] 之十二：Selenium +phantomjs抓取中的url编码问题
最近在抓取活动树网站 (http://www.huodongshu.com/html/find.html) 上数据时发现,在用搜索框输入中文后,点击搜索,phantomjs抓取数据怎么也抓取不到,但是 ...
Python爬虫实战点触验证码，模拟登陆bilibili
爬虫思路如下: 利用自动化爬虫工具 Selenium 模拟点击输入等操作来进行登录分析页面,获取点触验证码的点触图片,通过将图片发送给超级鹰打码平台识别后获取坐标信息根据超级鹰返回的数据,模拟坐标 ...
用python爬虫，对12306网站进行模拟登陆
from selenium import webdriver from time import sleep from PIL import Image from selenium.webdriver ...
爬虫系列(十二) selenium的基本使用
一.selenium 简介随着网络技术的发展,目前大部分网站都采用动态加载技术,常见的有 JavaScript 动态渲染和 Ajax 动态加载对于爬取这些网站,一般有两种思路: 分析 Ajax 请 ...
二十二. Python基础(22)--继承
二十二. Python基础(22)--继承 ● 知识框架 ● 继承关系中self的指向当一个对象调用一个方法时,这个方法的self形参会指向这个对象 class A: def get(s ...
Python爬虫学习：二、爬虫的初步尝试
我使用的编辑器是IDLE,版本为Python2.7.11,Windows平台. 本文是博主原创随笔,转载时请注明出处Maple2cat|Python爬虫学习:二.爬虫的初步尝试 1.尝试抓取指定网页 ...
Python爬虫初学（二）—— 爬百度贴吧
Python爬虫初学(二)-- 爬百度贴吧昨天初步接触了爬虫,实现了爬取网络段子并逐条阅读等功能,详见Python爬虫初学(一). 今天准备对百度贴吧下手了,嘿嘿.依然是跟着这个博客学习的,这次仿照 ...

随机推荐

.net表达式计算器（中缀表达式转后缀表达式，支持20多个数学函数，支持函数嵌套）
最近在网上查了一下表达工计算器的类库,发现Java版本的有一个比较成熟的叫W3EVal,好像是一个IBM工程师写的,.net就很少了(可能是我了解不够多),但投机取巧的实现思路有很多,比如: (1)将 ...
python进阶------进程线程（五）
Python中的IO模型同步(synchronous) IO和异步(asynchronous) IO,阻塞(blocking) IO和非阻塞(non-blocking)IO分别是什么,到底有什么区别 ...
怎么设置按钮的disabled属性
首先我们要知道怎么去设置两种方法设置disabled属性 $('#area').attr("disabled",true); $('#area').attr("disa ...
Orchard Core一分钟搭建ASP.NET Core CMS
Orchard Core 是Orchard CMS的ASP.NET Core版本. Orchard Core是全新一代的ASP.NET Core CMS. 官方文档介绍:http://orchardc ...
Java提高十七：TreeSet 深入分析
前一篇我们分析了TreeMap,接下来我们分析TreeSet,比较有意思的地方是,似乎有Map和Set的地方,Set几乎都成了Map的一个马甲.此话怎讲呢?在前面一篇讨论HashMap和HashSet ...
laravel whereDate()方法的使用
今天在做日期查询,过过滤的时候,发现了一个问题,用where()语句,要求时间格式比较严格,比如你要查2017-09-23这一天的活动,你在输入框传入2017-09-23,系统会默认帮你补上后面缺少的 ...
Function Programming - 纯函数（Pure Function）
纯函数的定义,非常重要!! Pure function 意指相同的输入,永远会得到相同的输出,而且没有任何显著的副作用. 老样子,我们还是从最简单的栗子开始: var minimum = 21; va ...
使用Maven Archetype插件构建Maven工程原型模板
创建原型模板 1.在空目录运行archetype:generate上面的命令,待下载完必要的jar包后,首先需要输入内置的原型编号: 1 Choose archetype: 2 1: internal ...
nyoj 63 小猴子下落思维
nyoj 63 小猴子下落题目链接: http://acm.nyist.net/JudgeOnline/problem.php?pid=63 思路: 不需要用指针创建二叉树,也不需要用数组来模拟二叉 ...
php代码在服务器中查看接值
error_log("You messed up!", 3, "/var/tmp/my-errors.log");

Python爬虫(二十二)_selenium案例：模拟登陆豆瓣

参考：

Python爬虫(二十二)_selenium案例：模拟登陆豆瓣的更多相关文章

随机推荐

热门专题