爬虫（cookie）——renren模拟登陆

工具：python3

步骤：

1）使用cookiejar.CookieJar()构建一个CookieJar（）构建一个对象，用来保存cookie的值

2）使用HTTPCookieProcessor（）构建一个处理器对象，用来处理cookie

3）使用build_opener构建自定义opener

4)）使用opener的addheaders参数添加请求头参数

5）构造url和data

6）使用Request()构造请求

7）使用opener.open()发送请求

8）读取响应信息

import urllib.request

from http import cookiejar

# 通过CookieJar()类构建一个cookieJar()对象，用来保存cookie的值

cookie = cookiejar.CookieJar()

# 通过HTTPCookieProcessor()处理器类构建一个处理器对象，用来处理cookie

cookie_handler = urllib.request.HTTPCookieProcessor(cookie)

# 构建一个自定义的opener

opener = urllib.request.build_opener(cookie_handler)

# 通过opener的addheaders参数可以添加HTTP报头参数,参数为元组类型

opener.addheaders = [("User-Agent", "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.181 Safari/537.36")]

# renren网的登录接口

url = "http://www.renren.com/PLogin.do"

# 需要登陆的账户密码

data = {"email":"xxx", "password": "xxx"}

data = urllib.parse.urlencode(data)

# data = bytes(data,  encoding="utf8")

# 第一次是post请求，发送登陆需要的参数，获取cookie

request = urllib.request.Request(url, data=data)

# 发送第一次的post请求，生成登录后的cookie

response = opener.open(request)

response = response.read()

response = response.decode("utf-8")

with open("renren.html","w") as f:

    f.write(str(response))

爬虫（cookie）——renren模拟登陆的更多相关文章

【Python爬虫】教务处模拟登陆
Python2模拟登陆获取cookie import urllib import urllib2 import cookielib filename = 'cookie.txt' #声明一个Mozil ...
Go -- client 302 自动转 200 问题 cookie存储模拟登陆问题
不久前用go写了个http client,去模拟某网站(*.com)的登录操作.网站的登录逻辑:1.验证登录账号和密码:2.下发token.此token通过cookie下发:3.redirect到主页 ...
【小白学爬虫连载（10）】–如何用Python实现模拟登陆网站
Python如何实现模拟登陆爬取Python实现模拟登陆的方式简单来说有三种:一.采用post请求提交表单的方式实现.二.利用浏览器登陆网站记录登陆成功后的cookies,采用get的请求方式,传入c ...
Scrapy 中的模拟登陆
目前,大部分网站都具有用户登陆功能,其中某些网站只有在用户登陆后才能获得有价值的信息,在爬取这类网站时,Scrapy 爬虫程序先模拟登陆,再爬取内容 1.登陆实质其核心是想服务器发送含有登陆表单数据 ...
通过cookies信息模拟登陆
import requests # 这个练习演示的是通过传入cookie信息模拟登陆,这样操作的前提是需要预先在浏览器登陆账户抓包得到cookie字段信息 url = "http://www ...
爬虫之 cookie ，验证码，模拟登陆，线程
需求文档的定制糗事百科的段子内容和作者(xpath的管道符)名称进行爬取,然后存储到mysql中or文本 http://sc.chinaz.com/jianli/free.html爬取简历模板 HT ...
爬虫入门之scrapy模拟登陆(十四)
注意:模拟登陆时,必须保证settings.py里的COOKIES_ENABLED(Cookies中间件) 处于开启状态 COOKIES_ENABLED = True或# COOKIES_ENABLE ...
Python 爬虫模拟登陆知乎
在之前写过一篇使用python爬虫爬取电影天堂资源的博客,重点是如何解析页面和提高爬虫的效率.由于电影天堂上的资源获取权限是所有人都一样的,所以不需要进行登录验证操作,写完那篇文章后又花了些时间研究了 ...
python爬虫模拟登陆校园网-初级
最近跟同学学习爬虫的时候看到网上有个帖子,好像是山大校园网不稳定,用py做了个模拟登陆很有趣,于是我走上了一条不归路..... 先上一张校园网截图首先弄清一下模拟登陆的原理: 1:服务器判定浏览器登 ...

随机推荐

SocketSessionConfig参数设制
Mina 是一个韩国人写的基本java NIO的一个高性能的传输框架,我们的搜索就是基本它作为一个搜索服务开放接口了.对于系统的TIME_WAIT过多,造成服务器的负载过高,这个问题我也不用多说了,这 ...
hdu 6109 数据分割
/** * 题目描述有点坑,勉强能读懂,大致意思,有多组约束条件.原本每组数据之间是有分界符号的 * 现在分界符号没了,让你找出原来每组数据多少个条件,并且告诉,每组的最后一个条件会使得与前面的 * ...
android自定义控件(三) 自定义属性
书接上回在xml里建立属性,然后java代码里用typedArray获得这些属性,得到属性后,利用属性做一些事.例:得到xml里的color,赋给paint. 1.在res/values/下新建at ...
AtCoder AGC #3 Virtual Participation
Havana真好听qwq AB题就不写了 SB C.BBuBBBlesort! 有一个长度为$n$的数列你每次可以用两种操作 1.交换两个相邻元素 2.交换两个隔且仅隔了一个的元素求把数列排成有序 ...
nginx 轮询模式 nginx_upstream_jvm_route 插件安装
使用nginx_upstream_jvm_route插件的目的是为了保证在轮询机制下的session的共享前提:源码方式安装nginx.patch命令 1.下载nginx_upstream_jvm_ ...
webapi 跨域（MVC-Web API: 405 method not allowed问题）
使用webapi cors 1.安装包:Install-Package Microsoft.AspNet.WebApi.Cors –IncludePrerelease 2.在webapiconfig. ...
xgene：之illumina，，ion-torrent
illumina技术: 工具:flowcell(流动池):8通道,每个通道都有 2种DNA引物种在玻璃表面(用共价键连到Flowcell上),这引物和文库中的接头互补 Flowcell:8个l ...
Mysql多列索引经典案例
一个经典的多列索引案例,如题: 假设某个表有一个联合索引(c1,c2,c3,c4)一下--只能使用该联合索引的 c1,c2,c3 部分 Awhere c1=x and c2=x and c4>x ...
luogu P2570 [ZJOI2010]贪吃的老鼠【二分+最大流】
首先考虑只满足第一个条件,二分答案,把过期时间加上mid之后的2n个时间离散,老鼠拆成每个时间的,第i个时间第j个老鼠为id[i][j],连接(s,i,p[i]),对于离散后时间(g[j-1]~g[j ...
Fire (poj 2152 树形dp)
Fire (poj 2152 树形dp) 给定一棵n个结点的树(1<n<=1000).现在要选择某些点,使得整棵树都被覆盖到.当选择第i个点的时候,可以覆盖和它距离在d[i]之内的结点,同 ...

爬虫（cookie）——renren模拟登陆

爬虫（cookie）——renren模拟登陆的更多相关文章

随机推荐

热门专题