python-微博模拟登陆

微博的的模拟登陆是比较坑的，看了网上很多大神的帖子，自己又看了微博的登陆时的json数据：1、发现登陆时在输入账号时用chrome可以看到会有一个prelogin之类的网址，网址后面会有大串的随机数。我测试了下，发现在没有随机数的情况下的网址也能得到所需要的severtime、nonce、等几个数据。2、通过chrome查看json数据就可以看到用户名和密码的加密方式，再找了网上大神的资料就可以得到用户名su、和密码sp。再把数据post 上去就可以得到一个重定向的微博登陆网址。3、将这个网址用正则表达式提取出来，再带上cookie数据就可以登陆了。然后你想干什么就干什

# _*_coding:utf-8 _*_

import base64

import urllib

import urllib2

import re

import rsa

import cookielib

class Weibo(object):

    def __init__(self, username, password):

        self.user = base64.b64encode(username)

        self.pwd = password

    @property

    def get_pre_url_values(self):

        values_dict = {}

        su = self.user

        pre_url = 'https://login.sina.com.cn/sso/prelogin.php?entry=weibo&callback=sinaSSOController.preloginCallBack&su=' \

                       + str(su[:-1]) + '%3D&rsakt=mod&checkpin=1&client=ssologin.js(v1.4.18)'

        header = {

            'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/35.0.1916.153 Safari/537.36'

        }

        request = urllib2.Request(pre_url, headers=header)

        html = urllib2.urlopen(request).read().decode('utf-8')

        p = re.compile(r'"servertime":(.*?),')

        values_dict['servertime'] = p.search(html).group(1).strip('\"')

        p1 = re.compile(r'"pcid":(.*?),')

        values_dict['pcid'] = p1.search(html).group(1).strip('\"')

        p2 = re.compile(r'"nonce":(.*?),')

        values_dict['nonce'] = p2.search(html).group(1).strip('\"')

        p3 = re.compile(r'"pubkey":(.*?),')

        values_dict['pubkey'] = p3.search(html).group(1).strip('\"')

        p4 = re.compile(r'"rsakv":(.*?),')

        values_dict['rsakv'] = p4.search(html).group(1).strip('\"')

        return values_dict

    def get_password(self, blog_values):

        '''

            这个函数是微博的json数据和网上的大神方法的出来的（抄来的）^_^

        '''

        rsapubkey = int(blog_values['pubkey'], 16)

        key = rsa.PublicKey(rsapubkey, 65537)

        massage = str(blog_values['servertime']) + '\t' + str(blog_values['nonce']) + '\n' + str(self.pwd)

        password = rsa.encrypt(massage, key)

        sp = password.encode('hex')

        return sp

    def login_weibo(self, blog_values, sp):

        values = {

            'entry': "weibo",

            'gateway': '',

            'from': '',

            'savestate': '',

            'userticket': '',

            'pagerefer': "",

            'cfrom': '',

            'vsnf': '',

            'su': self.user,

            'service': 'miniblog',

            'servertime': blog_values['servertime'],

            'nonce': blog_values['nonce'],

            'pwencode': 'rsa2',

            'rsakv': blog_values['rsakv'],

            'sp': sp,

            'sr': "1440*900",

            'encoding': 'UTF-8',

            'prelt': '',

            'url': 'http://weibo.com/ajaxlogin.php?framelogin=1&callback=parent.sinaSSOController.feedBackUrlCallBack',

            'returntype': 'META'

        }

        header = {

            'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/35.0.1916.153 Safari/537.36'

        }

        url = 'http://login.sina.com.cn/sso/login.php?client=ssologin.js(v1.4.18)'

        '''获取cookie信息 '''

        cj = cookielib.CookieJar()

        cj_support = urllib2.HTTPCookieProcessor(cj)

        opener = urllib2.build_opener(cj_support)

        data = urllib.urlencode(values)

        try:

            response = urllib2.Request(url, headers=header, data=data)

            html = opener.open(response).read().decode('gbk')

        except Exception, e:

            print e.message

        p = re.compile(r'location\.replace\(\'(.*?)\'\)')

        url = p.search(html).group(1)

        try:

            url_request = urllib2.Request(url)

            response_url = opener.open(url_request)

            page = response_url.read().decode('utf-8')

            p2 = re.compile(r'"userdomain":"(.*?)"')

            dom = p2.search(page).group(1)

            login_url = 'http://weibo.com/' + dom

            request_login_url = urllib2.Request(login_url)

            response_login_url = opener.open(request_login_url)

            per_html = response_login_url.read().decode('utf-8')

        except Exception:

            per_html = '登陆失败'

        return per_html

if __name__ == '__main__':

    wbobj = Weibo('用户名', '密码')

    sp = wbobj.get_password(wbobj.get_pre_url_values)

    html = wbobj.login_weibo(blog_values=wbobj.get_pre_url_values, sp=sp)

    print html

么，比如：把女神的照片全要了、自动查看女神的微博并将邮件发给你，下次再来弄这个。最近失眠的厉害，快点找到工作吧！！

python-微博模拟登陆的更多相关文章

Python实现模拟登陆
大家经常会用Python进行数据挖掘的说,但是有些网站是需要登陆才能看到内容的,那怎么用Python实现模拟登陆呢?其实网路上关于这方面的描述很多,不过前些日子遇到了一个需要cookie才能登陆的网站 ...
【小白学爬虫连载（10）】–如何用Python实现模拟登陆网站
Python如何实现模拟登陆爬取Python实现模拟登陆的方式简单来说有三种:一.采用post请求提交表单的方式实现.二.利用浏览器登陆网站记录登陆成功后的cookies,采用get的请求方式,传入c ...
python爬虫模拟登陆
python爬虫模拟登陆学习了:https://www.cnblogs.com/chenxiaohan/p/7654667.html 用的这个学习了:https://www.cnblogs.co ...
Python 爬虫模拟登陆知乎
在之前写过一篇使用python爬虫爬取电影天堂资源的博客,重点是如何解析页面和提高爬虫的效率.由于电影天堂上的资源获取权限是所有人都一样的,所以不需要进行登录验证操作,写完那篇文章后又花了些时间研究了 ...
腾讯微博模拟登陆+数据抓取(java实现)
不多说,贴出相关代码. 参数实体: package token.def; import java.io.Serializable; import java.util.Properties; publi ...
python爬虫模拟登陆校园网-初级
最近跟同学学习爬虫的时候看到网上有个帖子,好像是山大校园网不稳定,用py做了个模拟登陆很有趣,于是我走上了一条不归路..... 先上一张校园网截图首先弄清一下模拟登陆的原理: 1:服务器判定浏览器登 ...
Python作业模拟登陆(第一周)
模拟登陆:1. 用户输入帐号密码进行登陆2. 用户信息保存在文件内3. 用户密码输入错误三次后锁定用户思路: 1. 用户名密码文件为passwd,锁定用户文件为lock 2. 用户输入账号密码采用i ...
python+requests模拟登陆学校选课系统
最近学校让我们选课,每天都有不同的课需要选....然后突发奇想试试用python爬学校选课系统的课程信息先把自己的浏览器缓存清空,然后在登陆界面按f12 如图: 可以看到登陆时候是需要验证码的,验证 ...
python selenium模拟登陆163邮箱。
selenium是可以模拟浏览器操作. 有些爬虫是异步加载的,通过爬取网页源码是得不到需要的内容.所以可以模拟浏览器去登陆该网站进行爬取操作. 需要安装selenium通过pip install xx ...
Python脚本模拟登陆DVWA
目录 requests模拟登陆 Selenium自动化测试登陆环境:python3.7 windows requests模拟登陆我们登陆DVWA的时候,看似只有一步:访问网站,输入用户名和密码,登 ...

随机推荐

QTP知识总结（一）
QTP知识总结(一) (2010-12-22 16:30:41) 转载▼ 标签: 杂谈分类: QTP File menu Process guidance management,View > ...
jquery表格datagrid单元格显示图片及分页使用
要想达到自定义显示表格框的目的比如显示图片,超链接,按钮的形式,只需要给列添加formatter属性即可,比如显示图片: columns: [[ ...
大规模web服务开发技术
大规模web服务开发技术总评这本书是日本一个叫hatena的大型网站的CTO写的,通过hatena网站从小到大的演进来反应一个web系统从小到大过程中的各种系统和技术架构变迁,比较接 ...
Javascript技巧实例精选(5)—显示当前的日期和时间
用Javascript实现在屏幕中打印当前的日期和时间 >>点击这里下载完整html源码<< 这是显示的效果目前的日期/时间是:Wed Sep 25 2013 23:40:0 ...
实现Client Credentials Grant
[OAuth]基于DotNetOpenAuth实现Client Credentials Grant Client Credentials Grant是指直接由Client向Authorizatio ...
开发框架(OrchardNoCMS)--BootStrap
基于ASP.NET MVC的热插拔模块式开发框架(OrchardNoCMS)--BootStrap 按照几个月之前的计划,也应该写一个使用Bootstrap作为OrchardNoCMS的UI库.之前这 ...
Android学习笔记-Intent(一)
Intent对象在Android官方API这样描述:It is a passive data structure holding an abstract description of an opera ...
MongoDB：利用官方驱动改装为EF代码风格的MongoDB.Repository框架五 --- 为List<MongoDBRef>增加扩展方法
本次改动主要内容:为List<MongoDBRef>增加扩展方法在MongoDB.Repository的使用过程中,发现在一个类中只定义一个List<MongoDBRef>是 ...
.NET面向对象特性之封装
.NET面向对象特性之封装面向对象的基本内容由:类.对象.属性.方法.字段构成. 面向对象的三大特性:继承.多态.封装. 关于面向对象的特性很多人都把目光转向了继承.多态和接口,却很少有人提及过封装 ...
socket网络编程快速上手（二）——细节问题（4）
5.慢系统调用及EINTR 还记得前面readn和writen函数么?里面有个EINTR,现在就来谈谈这个,这个很重要. Linux世界有个叫信号的东西,感觉他就像一位隐士,很少遇到他,而他又无处不在 ...

python-微博模拟登陆

python-微博模拟登陆的更多相关文章

随机推荐

热门专题