模拟登陆github

import requests

from lxml import etree

class Login(object):

    def __init__(self):

        self.headers = {

            'Referer': 'https://github.com/',

            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.133 Safari/537.36',

            'Host': 'github.com'

        }

        self.login_url = 'https://github.com/login'

        self.post_url = 'https://github.com/session'

        self.logined_url = 'https://github.com/settings/profile'

        self.session = requests.Session()  #方便请求头cookie的处理

    def token(self):

        response = self.session.get(self.login_url, headers=self.headers)

        selector = etree.HTML(response.text)

        token = selector.xpath('//div//input[2]/@value')

        return token

    def login(self, email, password):

        post_data = {

            'commit': 'Sign in',

            'utf8': '✓',

            'authenticity_token': self.token()[0],

            'login': email,

            'password': password

        }

        response = self.session.post(self.post_url, data=post_data, headers=self.headers)

        if response.status_code == 200:

            self.dynamics(response.text)

        response = self.session.get(self.logined_url, headers=self.headers)

        if response.status_code == 200:

            self.profile(response.text)

    def dynamics(self, html):

        selector = etree.HTML(html)

        dynamics = selector.xpath('//div[contains(@class, "news")]//div[contains(@class, "alert")]')

        for item in dynamics:

            dynamic = ' '.join(item.xpath('.//div[@class="title"]//text()')).strip()

            print(dynamic)

    def profile(self, html):

        selector = etree.HTML(html)

        name = selector.xpath('//input[@id="user_profile_name"]/@value')[0]

        email = selector.xpath('//select[@id="user_profile_email"]/option[@value!=""]/text()')

        print(name, email)

if __name__ == "__main__":

    login = Login()

    login.login(email='cqc@cuiqingcai.com', password='password')

模拟登陆github的更多相关文章

Python爬虫教程：requests模拟登陆github
1. Cookie 介绍 HTTP 协议是无状态的.因此,若不借助其他手段,远程的服务器就无法知道以前和客户端做了哪些通信.Cookie 就是「其他手段」之一. Cookie 一个典型的应用场景,就是 ...
python模拟登陆Github示例
首先进入github登录页:https://github.com/login 输入账号密码,打开开发者工具,在Network页勾选上Preserve Log(显示持续日志),点击登录,查看Sessio ...
模拟登陆Github示例
首先进入github登录页:https://github.com/login 输入账号密码,打开开发者工具,在Network页勾选上Preserve Log(显示持续日志),点击登录,查看Sessio ...
Python爬虫学习笔记之模拟登陆并爬去GitHub
(1)环境准备: 请确保已经安装了requests和lxml库 (2)分析登陆过程: 首先要分析登陆的过程,需要探究后台的登陆请求是怎样发送的,登陆之后又有怎样的处理过程. 如果已经 ...
模拟登陆并爬取Github
因为崔前辈给出的代码运行有误,略作修改和简化了. 书上例题,不做介绍. import requests from lxml import etree class Login(object): def ...
pytho简单爬虫_模拟登陆西电流量查询_实现一键查询自己的校园网流量
闲来无事,由于校园内网络是限流量的,查询流量很是频繁,于是萌生了写一个本地脚本进行一键查询自己的剩余流量. 整个部分可以分为三个过程进行: 对登陆时http协议进行分析利用python进行相关的模拟 ...
使用webdriver+urllib爬取网页数据(模拟登陆，过验证码)
urilib是python的标准库,当我们使用Python爬取网页数据时,往往用的是urllib模块,通过调用urllib模块的urlopen(url)方法返回网页对象,并使用read()方法获得ur ...
第三百四十三节，Python分布式爬虫打造搜索引擎Scrapy精讲—scrapy模拟登陆和知乎倒立文字验证码识别
第三百四十三节,Python分布式爬虫打造搜索引擎Scrapy精讲—scrapy模拟登陆和知乎倒立文字验证码识别第一步.首先下载,大神者也的倒立文字验证码识别程序下载地址:https://gith ...
python-爬虫之requests模块介绍（登陆github）
介绍使用requests可以模拟浏览器的请求,比起之前用到的urllib,requests模块的api更加便捷(本质就是封装了urllib3) 注意 requests库发送请求将网页内容下载下来以后 ...

随机推荐

工作中遇到的一些linux常用命令总结
零.查看历史命令,linux中可按“↑” “↓”查找之前输入的命令,亦可用 history 命令查看之前的输入,linux中的亦有“Tab”键可联想输入一.root权限: 1.su 之后输入root ...
UOJ 275. 【清华集训2016】组合数问题
UOJ 275. [清华集训2016]组合数问题组合数 $C_n^m $表示的是从 $n$ 个物品中选出 $m$ 个物品的方案数.举个例子,从$ (1,2,3)(1,2,3)$ 三个物品中选 ...
Python异常处理总结
一.何谓异常处理在我们调试程序时,经常不可避免地出现意料之外的情况,导致程序不得不停止运行,然后提示大堆提示信息,大多是这种情况都是由异常引起的.异常的出现一方面是因为写代码时粗心导致的语法错误,这 ...
【新特性速递】FineUIPro/Mvc/Core 全新移动端访问体验（示例首页）！
移动端支持虽然 FineUIPro 早在 2016 年就已经完成对移动端的适配工作,并新增了 50 多个官网示例. 并且,我们也新增了一个移动端的首页 http://pro.fineui.com/m ...
nextInt()和nextLine()一起使用时的注意点
问题原因:nextLine()会把nextInt(),next(),nextDouble(),nextFloat()的结束换行符作为字符串读入,进而不需要从键盘输入字符串nextLine便已经转向了下 ...
Bootstrap起步
Bootstrap 是最受欢迎的 HTML.CSS 和 JS 框架,用于开发响应式布局.移动设备优先的 WEB 项目. Bootstrap 插件全部依赖 jQuery 请注意,Bootstrap 的所 ...
springboot项目从硬盘指定位置读取文件(获取静态资源)
方法一:继承WebMvcConfigurerAdapter类 package com.imooc.demo.config; import org.springframework.context.ann ...
CentOS 安装 Ansible 以及连接Windows server的办法
1. CentOS机器上面按住那ansible yum install ansible 2. 安装 pywinrm 如果不安装这个的话 ansible 会提示没有 winrm 模块注意需要先 ...
iOS企业开发者账号实现内部分发
前言上个月由于公司开发的棋牌类游戏接近尾声,需要大量的苹果测试机来支持,之前只有一个公司开发者账号,每添加新的测试机都需要添加一次UDID,做了不少无用功,再加上本身外包性质的公司导致客户方面频繁更 ...
java文件运行的过程
javac .java——>编译成.class文件(字节码) 参考: https://www.cnblogs.com/yxwkf/p/3855363.html https://www.jians ...

模拟登陆github

模拟登陆github的更多相关文章

随机推荐

热门专题