Python 爬虫实例（3）—— 爬取今日头条as cp 算法解密

关于今日头条的 as cp 算法，只是对时间进行了加密，他们的js代码是压缩处理的，正常格式化就可以了

url = "http://www.toutiao.com/api/pc/feed/"

        data = {

            "category":"news_game",

            "utm_source":"toutiao",

            "widen":str(i),

            "max_behot_time":"",

            "max_behot_time_tmp":"",

            "tadrequire":"true",

            "as":"479BB4B7254C150",

            "cp":"7E0AC8874BB0985",

        }

        headers = {

                "Host":"www.toutiao.com",

                "Connection":"keep-alive",

                "Accept":"text/javascript, text/html, application/xml, text/xml, */*",

                "X-Requested-With":"XMLHttpRequest",

                "User-Agent":"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/60.0.3112.113 Safari/537.36",

                "Content-Type":"application/x-www-form-urlencoded",

                "Referer":"http://www.toutiao.com/ch/news_hot/",

                "Accept-Encoding":"gzip, deflate",

                "Accept-Language":"zh-CN,zh;q=0.8",

        }

        result1 = session.get(url=url,params=data,headers=headers).text

        result2 =json.loads(result1)

今日头条 as cp算法解析，我们在提交的时候"as":"479BB4B7254C150", "cp":"7E0AC8874BB0985",就可以了，有兴趣的同学可以去看看他们的js代码，只是简单的对进行了加密

var e = {};

    e.getHoney = function() {

        var t = Math.floor((new Date).getTime() / 1e3),

            e = t.toString(16).toUpperCase(),

            n = md5(t).toString().toUpperCase();

        if (8 != e.length) return {

            as: "479BB4B7254C150",

            cp: "7E0AC8874BB0985"

        };

        for (var o = n.slice(0, 5), i = n.slice(-5), a = "", r = 0; 5 > r; r++) a += o[r] + e[r];

        for (var l = "", s = 0; 5 > s; s++) l += e[s + 3] + i[s];

        return {

            as: "A1" + a + e.slice(-3),

            cp: e.slice(0, 3) + l + "E1"

        }

    }, t.ascp = e

}(window, document), function() {

    var t = ascp.getHoney(),

        e = {

            path: "/",

            domain: "i.snssdk.com"

        };

    $.cookie("cp", t.cp, e), $.cookie("as", t.as, e), window._honey = t

}(), Flow.prototype = {

    init: function() {

        var t = this;

        this.url && (t.showState(t.auto_load ? NETWORKTIPS.LOADING : NETWORKTIPS.HASMORE), this.container.on("scrollBottom", function() {

            t.auto_load && (t.lock || t.has_more && t.loadmore())

        }), this.list_bottom.on("click", "a", function() {

            return t.lock = !1, t.loadmore(), !1

        }))

    },

    loadmore: function(t) {

        this.getData(this.url, this.type, this.param, t)

    },

as cp 算法 Python 实现

import time

import hashlib 

def get_as_cp():

    zz ={}

    now = round(time.time())

    print now  #获取计算机时间

    e = hex(int(now)).upper()[2:]  #hex()转换一个整数对象为十六进制的字符串表示

    print e

    i = hashlib.md5(str(int(now))).hexdigest().upper() #hashlib.md5().hexdigest()创建hash对象并返回16进制结果

    if len(e)!=8:

        zz = {'as': "479BB4B7254C150",

            'cp': "7E0AC8874BB0985"}

        return zz

    n=i[:5]

    a=i[-5:]

    r = ""

    s = ""

    for i in range(5):

        s = s+n[i]+e[i]

    for j in range(5):

        r = r+e[j+3]+a[j]

    zz = {

            'as': "A1" + s + e[-3:],

            'cp': e[0:3] + r + "E1"

        }

    print zz

if __name__ == "__main__":

    get_as_cp()

Python 爬虫实例（3）—— 爬取今日头条as cp 算法解密的更多相关文章

Python爬虫实例：爬取B站《工作细胞》短评——异步加载信息的爬取
很多网页的信息都是通过异步加载的,本文就举例讨论下此类网页的抓取. <工作细胞>最近比较火,bilibili 上目前的短评已经有17000多条. 先看分析下页面右边 li 标签中的就是短 ...
Python爬虫实例：爬取猫眼电影——破解字体反爬
字体反爬字体反爬也就是自定义字体反爬,通过调用自定义的字体文件来渲染网页中的文字,而网页中的文字不再是文字,而是相应的字体编码,通过复制或者简单的采集是无法采集到编码后的文字内容的. 现在貌似不少网 ...
Python爬虫实例：爬取豆瓣Top250
入门第一个爬虫一般都是爬这个,实在是太简单.用了 requests 和 bs4 库. 1.检查网页元素,提取所需要的信息并保存.这个用 bs4 就可以,前面的文章中已经有详细的用法阐述. 2.找到下一 ...
爬虫—分析Ajax爬取今日头条图片
以今日头条为例分析Ajax请求抓取网页数据.本次抓取今日头条的街拍关键字对应的图片,并保存到本地一,分析打开今日头条主页,在搜索框中输入街拍二字,打开开发者工具,发现浏览器显示的数据不在其源码里面 ...
PYTHON 爬虫笔记九:利用Ajax+正则表达式+BeautifulSoup爬取今日头条街拍图集（实战项目二）
利用Ajax+正则表达式+BeautifulSoup爬取今日头条街拍图集目标站点分析今日头条这类的网站制作,从数据形式,CSS样式都是通过数据接口的样式来决定的,所以它的抓取方法和其他网页的抓取方 ...
使用scrapy爬虫,爬取今日头条搜索吉林疫苗新闻（scrapy+selenium+PhantomJS）
这一阵子吉林疫苗案,备受大家关注,索性使用爬虫来爬取今日头条搜索吉林疫苗的新闻依然使用三件套(scrapy+selenium+PhantomJS)来爬取新闻以下是搜索页面,得到吉林疫苗的搜索信息, ...
Python爬虫教程-17-ajax爬取实例（豆瓣电影）
Python爬虫教程-17-ajax爬取实例(豆瓣电影) ajax: 简单的说,就是一段js代码,通过这段代码,可以让页面发送异步的请求,或者向服务器发送一个东西,即和服务器进行交互对于ajax: ...
爬虫七之分析Ajax请求并爬取今日头条
爬取今日头条图片这里只讨论出现的一些问题,代码在最下面github链接里. 首先,今日头条取消了"图集"这一选项,因此对于爬虫来说效率降低了很多: 在所有代码都完成后,也许是爬取 ...
使用scrapy爬虫,爬取今日头条首页推荐新闻（scrapy+selenium+PhantomJS）
爬取今日头条https://www.toutiao.com/首页推荐的新闻,打开网址得到如下界面查看源代码你会发现全是js代码,说明今日头条的内容是通过js动态生成的. 用火狐浏览器F12查看得知 ...

随机推荐

【微信小程序】在js中导入第三方js或自己写的js，使用外部js中的function的两种方法 import和require的区别使用方法【外加：使用第三方js导出的默认function的调用方法】
如下定义了一个外部js文件,其中有一个function import lunaCommon from '../lunaCommon.js'; var ctx = wx.getStorageSync( ...
jquery通过ajax提交form
$.ajax({ type: "POST", url: "some.php", data: "name=John&location=Bosto ...
《.NET最佳实践》
<.NET最佳实践> 基本信息原书名:Pro .NET Best Practices 原出版社: Apress 作者: (美)Stephen Ritchie 译者: 黄灯桥黄浩宇李永 ...
1)Linux程序设计入门--基础知识
)Linux程序设计入门--基础知识 Linux下C语言编程基础知识前言: 这篇文章介绍在LINUX下进行C语言编程所需要的基础知识.在这篇文章当中,我们将会学到以下内容: 源程序编译 Makef ...
Maven配置浅析
<?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://mave ...
[Todo] Nodejs学习及Spider实验（包括php入门学习、React入门学习）
/Users/baidu/Documents/Data/Interview/Web-Server开发深入浅出Node.js-f46c http://blog.csdn.net/u012273376/ ...
如何在android模拟器中导入搜狗输入法？
1.下载输入法程序,如:sogouinput_android_1.6_sweb.apk 2.然后cmd进入sdk的tools(有的是platform-tools)目录,输入adb install C: ...
ReportStudio中创建日期提示默认值模板
很多人已经知道可以通过JS给RS中的日期提示控件设置运行前的默认值---------例如: 日期时间段默认为上一个月的开始日和结束日在系统所有的报表中都这样操作,我们如何快速的引入?和方便下次修改统 ...
js 构造函数(construction)与原型（prototype）
1.面向对象:js原型 java有class和instance,js仅仅有构造函数(function Cat(name,age){this.name=name;this.age=age}),为了实现数 ...
Emacs在RHEL 5上的安装和使用
1. install latest emacs xz -d emacs-24.3.tar.xz tar xvf emacs-24.3.tar ./configure make make install ...

Python 爬虫实例（3）—— 爬取今日头条as cp 算法 解密

Python 爬虫实例（3）—— 爬取今日头条as cp 算法 解密的更多相关文章

随机推荐

热门专题

Python 爬虫实例（3）—— 爬取今日头条as cp 算法解密

Python 爬虫实例（3）—— 爬取今日头条as cp 算法解密的更多相关文章