python 携带cookie获取页面内容

有时会遇到爬取的页面需要登录，这就要带上cookie了。

下面记录了几种携带cookie的方法

# coding=utf-8

import requests

s = requests.Session()

login_data = {'username': 'teacher', 'password': 'teacher'}

# 方法1

# resp1 = s.post('http://192.168.2.132/login/', data=login_data)

# r = s.get('http://192.168.2.132/personal_live/')

# 方法2

# resp1 = requests.post('http://192.168.2.132/login/', data=login_data)

# print('cookie:' + str(resp1.cookies))

# r = requests.get('http://192.168.2.132/personal_live/', cookies=resp1.cookies)

# 方法3

# c = {'sessionid': '3ps7ouyox1l43alcb7rafxg9dtfnurcb'}

# r = requests.get('http://192.168.2.132/personal_live/', cookies=c)

c = {

    '.CNBlogsCookie': 'D020D...07',

    '.Cnblogs.AspNetCore.Cookies': 'CfDJ...WA',

    'SyntaxHighlighter': 'java',

    'SERVERID': '560...34'

}

r = requests.get('https://i.cnblogs.com/EditPosts.aspx?opt=1', cookies=c)

resp = r.text

print(resp)

方法1是利用同一个Session，先登录，再访问有限制页面。

方法2是直接使用requests，和1一样，同样是先登录，获取cookie,携带cookie访问限制页面。

方法3是手动从浏览器获取cookie，再携带cookie访问限制页面。

优缺点：

1,2差不多，都是直接运行脚本就可以了，但是需要登录页面没有验证码一类的处理。

3可以应对各种网站，但是需要手动获取cookie。

python 携带cookie获取页面内容的更多相关文章

Python+Selenium自动化-获取页面信息
Python+Selenium自动化-获取页面信息 1.获取页面title title:获取当前页面的标题显示的字段 from selenium import webdriver import t ...
PHP curl获取页面内容，不直接输出到页面，CURLOPT_RETURNTRANSFER参数设置
使用PHP curl获取页面内容或提交数据,有时候希望返回的内容作为变量储存,而不是直接输出.这个时候就必需设置curl的或true. 1.curl获取页面内容, 直接输出例子: <?php $ ...
PHP CURL获取页面内容输出例子
使用PHP curl获取页面内容或提交数据,有时候希望返回的内容作为变量储存,而不是直接输出.这个时候就必需设置curl的CURLOPT_RETURNTRANSFER选项为1或true. 1.curl ...
C#获取页面内容的几种方式
常见的Web页面获取页面内容用 WebRequest 或者 HttpWebRequest 来操作 Http 请求. 例如,获取百度网站的 html 页面 var request = WebReques ...
python+selenium 页面中存在选项卡时，获取页面内容的小技巧
最近用selenium读取页面内容时,遇到包含选项卡的页面,由于选项卡多由js加载其中的内容,所以在网址打开时只能获取到默认显示的选项卡中的内容,而tab2.tab3等等都需要傻傻的点击一下才会获取到 ...
python爬虫之获取页面script里面的内容
这是网页上的script 我要获取的是00914这个数字直接使用正则表达式即可运行结果: 源码: import re from bs4 import BeautifulSoup from url ...
python 携带cookie访问网站（python接口测试post）
最近在使用自己研究性能测试工具的时候想到,使用python向服务器不断发送数据以作为并发测试.大概情况如下: #coding=utf-8 import urllib2 import urllib im ...
POST信息模拟登录获取页面内容
最近项目里有一个是要模拟登录后,访问固定页面获取内容的要求,一开始用JQ AJAX好像不支持跨域请求.后使用.net中HttpWebRequest对象来获取.一开始访问总是无法在第二个页面正常访问,好 ...
php利用simple_html_dom类，获取页面内容，充当爬虫角色
PHP脚本扮演爬虫的角色,可能大家第一时间想到可能会是会正则,个人对正则的规则老是记不住,表示比较难下手,今天工作中有个需求需要爬取某个网站上的一些门店信息无意间在网上看到一个比较好的类库叫:sim ...

随机推荐

(Dijkstra) POJ1797 Heavy Transportation
Heavy Transportation Time Limit: 3000MS Memory Limit: 30000K Total Submissions: 53170 Accepted: ...
SQL Server 经典案例
1.先进先出例1 WITH [ta] ([商品编号], [批次号], [库存数量]) AS ( UNION ALL UNION ALL UNION ALL ),[tb] ([商品编号], [订货数量 ...
基础教程：Mac 电脑小白应该了解哪些东西？
文章素材来源:知乎文章收录于:风云社区(www.scoee.com),提供1700多款mac软件下载. 本文提供给那些从 PC 阵营初入 Mac 的同学而准备的,我们希望从硬件和软件.设计风格和使用 ...
Linux如何修改和查询时区时间
Linux如何修改和查询时区时间我在日常工作中,最近遇到了在解压源码包的时候,提示时间比较旧,解压安装出现问题.原因是,租用的vps所在时区和自己所需要的时区不一致,于是在网上找了相关资料.并亲自实 ...
Springboot -- 由于jar版本不匹配遇到的问题
网上整合dubbo的例子很多,我这边今天整合了一个例子,但是发现启动dubbo service时候,提示log4j日志类无法找到,启动client的时候,注入的service为空,调试了半天,编码并无 ...
go 学习资源和GitHub库
go httprouter 源码包 https://github.com/julienschmidt/httprouter 用例 https://github.com/gsingharoy/httpr ...
Win7下mysql的安装
一.简述 mysql与oracle相比小,便宜,装机量大,下载地址:https://www.mysql.com/downloads/,去找Community Edition,然后根据自己的Window ...
centos 7.4 安装gitlab
centos 7.4 安装gitlab #curl -s https://packages.gitlab.com/install/repositories/gitlab/gitlab-ce/scrip ...
net-snmp开发教程
目录 1................................................................................................ ...
IIS 为应用程序池提供服务的进程在与 Windows Process Activation Service 通信时出现严重错误的解决方法
系统环境:Windows Server 2008 R2 64位, IIS 7.0 错误信息: 为应用程序池提供服务的进程在与 Windows Process Activation Service 通信 ...

python 携带cookie获取页面内容

python 携带cookie获取页面内容的更多相关文章

随机推荐

热门专题