GitHub登录

分析登录页面

开发者工具分析请求

从session请求分析得知：

1.请求的URL为：https://github.com/session

2.该请求为post请求，即需要上传data表单，所以我们需要分析form-data

由form-data分析得知：

1.login：GitHub的账号

2.password：GitHub的密码

3.authenticity_token：每次请求时都发生变动

4.其余参数没有特殊的变动

因此需要分析authenticity_token的规律，经过分析源代码得知：

在login页面中存在该参数，且每次请求该页面时该参数都发生变动

因此我们需要使用维持会话的方式抓取该参数

import requests

session = requests.Session()    #实例化，维持会话

url_login = 'https://github.com/login'

    response = session.get(url_login)

    #通过正则获取token值

    authenticity_token = re.findall('name="authenticity_token" value="(.*?)" />',response.text)[0]

    print(authenticity_token)

当我们获取该参数后，即可以代入form-data中完成登录

附上全部代码

import requests

import re

session = requests.Session()    #实例化，维持会话

def token():

    url_login = 'https://github.com/login'

    response = session.get(url_login)

    #通过正则获取token值

    authenticity_token = re.findall('name="authenticity_token" value="(.*?)" />',response.text)[0]

    return authenticity_token     #返回token值

def url_session(token):

    url = 'https://github.com/session'

    data = {

        'commit': 'Sign in',

        'utf8': '✓',

        'authenticity_token': token,     #authenticity_token参数

        'login': '输入账号',              #你的账号

        'password': '输入密码',          #你的密码

        'webauthn-support': 'supported',

        'required_field_852e': '',

        'timestamp': '',

        'timestamp_secret': '850cb01230466a48f29899e2202265961cdcde8375c4ee69399cd9e9805e1ede',

    }

    response = session.post(url,data=data)  #传入form-data表单

    return response.text   #返回源码

def save_github(response_text):

    with open('github.html','w',encoding='utf-8') as fp:

        fp.write(response_text)

if __name__ == '__main__':

    token = token()   #获取authenticity_token参数

    response_text = url_session(token)    #获取网页源码

    save_github(response_text)    #把爬取到的源码保存为html格式

python day2-爬虫实现github登录的更多相关文章

利用Python模拟GitHub登录
最近学习了Fiddler抓包工具的简单使用,通过抓包,我们可以抓取到HTTP请求,并对其进行分析.现在我准备尝试着结合Python来模拟GitHub登录. Fiddler抓包分析首先,我们想要模拟一 ...
Python爬虫之模拟登录微信wechat
不知何时,微信已经成为我们不可缺少的一部分了,我们的社交圈.关注的新闻或是公众号.还有个人信息或是隐私都被绑定在了一起.既然它这么重要,如果我们可以利用爬虫模拟登录,是不是就意味着我们可以获取这些信息 ...
Python爬虫-百度模拟登录（二）
上一篇-Python爬虫-百度模拟登录(一) 接上一篇的继续参数 codestring codestring jxG9506c1811b44e2fd0220153643013f7e6b1898075 ...
第三百四十三节，Python分布式爬虫打造搜索引擎Scrapy精讲—scrapy模拟登陆和知乎倒立文字验证码识别
第三百四十三节,Python分布式爬虫打造搜索引擎Scrapy精讲—scrapy模拟登陆和知乎倒立文字验证码识别第一步.首先下载,大神者也的倒立文字验证码识别程序下载地址:https://gith ...
Python分布式爬虫抓取知乎用户信息并进行数据分析
在以前的文章中,我写过一篇使用selenium来模拟登录知乎的文章,然后在很长一段时间里都没有然后了... 不过在最近,我突然觉得,既然已经模拟登录到了知乎了,为什么不继续玩玩呢?所以就创了一个项目, ...
Python 网络爬虫干货总结
Python 网络爬虫干货总结爬取对于爬取来说,我们需要学会使用不同的方法来应对不同情景下的数据抓取任务. 爬取的目标绝大多数情况下要么是网页,要么是 App,所以这里就分为这两个大类别来进行了介 ...
Python分布式爬虫打造搜索引擎完整版-基于Scrapy、Redis、elasticsearch和django打造一个完整的搜索引擎网站
Python分布式爬虫打造搜索引擎基于Scrapy.Redis.elasticsearch和django打造一个完整的搜索引擎网站 https://github.com/mtianyan/Artic ...
Python基础+爬虫基础
Python基础+爬虫基础一.python的安装: 1.建议安装Anaconda,会自己安装一些Python的类库以及自动的配置环境变量,比较方便. 二.基础介绍 1.什么是命名空间:x=1,1存在 ...
python网络爬虫实战PDF高清完整版免费下载|百度云盘|Python基础教程免费电子书
点击获取提取码:vg1y python网络爬虫实战帮助读者学习Python并开发出符合自己要求的网络爬虫.网络爬虫,又被称为网页蜘蛛,网络机器人,是一种按照一定的规则,自动地抓取互联网信息的程序或者脚 ...

随机推荐

GO语言学习笔记2-int类型的取值范围
相比于C/C++语言的int类型,GO语言提供了多种int类型可供选择,有int8.int16.int32.int64.int.uint8.uint16.uint32.uint64.uint. 1.i ...
在 Cloudera Data Flow 上运行你的第一个 Flink 例子
文档编写目的 Cloudera Data Flow(CDF) 作为 Cloudera 一个独立的产品单元,围绕着实时数据采集,实时数据处理和实时数据分析有多个不同的功能模块,如下图所示: 图中 4 个 ...
CSS设置背景色
最好用background-color:rgba(37,77,113,1); 因为用opacity会让所有自标签都改变
使用WireMock伪造REST服务
在真正的rest api服务还没有写好之前,为了方便前端测试调用,后端可以写个服务,伪造rest服务(写假数据) 1.官网: http://wiremock.org/ 下载可执行jar:http:// ...
html area标签语法
html area标签语法作用:带有可点击区域的图像映射说明:<img> 中的 usemap 属性可引用 <map> 中的 id 或 name 属性(由浏览器决定),所以 ...
HTML5 大文件断点续传完整思路整理
需求: 支持大文件批量上传(20G)和下载,同时需要保证上传期间用户电脑不出现卡死等体验: 内网百兆网络上传速度为12MB/S 服务器内存占用低支持文件夹上传,文件夹中的文件数量达到1万个以上,且包 ...
JUnit——单元测试
写了个类,要给别人用,会不会有bug?怎么办?测试一下. JUnit可以测试JDBC.Servelet.Struts.Spring.Hibernate等等. 单元测试是开发人员的工作,测试人员负责测试 ...
Android中播放声音
在Android系统中,有两种播放声音的方式,一种是通过MediaPlayer,另外一种是通过SoundPool.前者主要用于播放长时间的音乐,而后者用于播放小段小段的音效,像按键音这种,其优点是资源 ...
C++二维数组（指针）做参数
一.问题描述使用C++编程过程中经常需要使用到二维数组,然而初级程序员在使用过程中经常会出错使程序崩溃.下面就二维指针的定义,初始化,以及二维指针做参数给出简单介绍. 1.二维数组的定义与初始化在 ...
[BZOJ3990]:[SDOI2015]排序（搜索）
题目传送门题目描述小A有一个1-${2}^{N}$的排列A[1..${2}^{N}$],他希望将A数组从小到大排序,小A可以执行的操作有N种,每种操作最多可以执行一次,对于所有的i(1≤i≤N), ...

python day2-爬虫实现github登录

GitHub登录

分析登录页面

附上全部代码

python day2-爬虫实现github登录的更多相关文章

随机推荐

热门专题