Python模拟登陆TAPD
因为在wiki中未找到需要的数据,查询也很迷,打算用python登录tapd抓取所需项目下的wiki数据,方便查找。
2018-9-30 19:12:44
几步走
- 模拟登录tapd
- 抓取wiki页左侧链接
- 拿到每页markdown
- 存储数据库
模拟登录TAPD
请求参数
data[Login][ref] https://www.tapd.cn/my_worktable?left_tree=1
data[Login][encrypt_key] GxYimlauXYHXtqflCRfP4MLxInPBlMJIfvw7D+vCxQE=
data[Login][encrypt_iv] M7IkutCvI9/jFyQc3owL+Q==
data[Login][site] TAPD
data[Login][via] encrypt_password
data[Login][email] xxxxx@vchangyi.com
data[Login][password] T0cbRTIoaM1z9ktIM6Wl2Q==
data[Login][login] login
dsc_token dDdgn7oC89YL6Waz
变量
data[Login][encrypt_key] 0royxaa8qvuNkffv0zGRpLKZg+80lBje4fEz876igzw=
data[Login][encrypt_iv] 2ouJgjQ6j3jp4O5hFH6k4A==
data[Login][password] m6YLZH4DVzXjD/eLyVT/nQ==
dsc_token 30CfdZ59sH3JIaNh
dsc_token 通过 dsc+180208173064.js 生成,多次请求地址没有变化说明后面数字尾巴不是时间戳之类动态,试着获取一下dsc_token。
获取 token
tapd_dsc.gen_token_and_set_to_cookie()
PyV8装不上,用execjs读取
import execjs
sign_js_path = "./dsc+180208173064.js"
def get_js(path):
f = open(path, 'r', encoding='UTF-8') # 打开JS文件
line = f.readline()
html_str = ''
while line:
html_str = html_str + line
line = f.readline()
return html_str
def load_sign_js(js_str):
return execjs.compile(js_str)
def writeFile(js):
fo = open("dsc.js", "w")
fo.write(js)
fo.close()
sign_js = load_sign_js(get_js(sign_js_path))
writeFile(sign_js._source)
print(sign_js.call('tapd_dsc.gen_token_and_set_to_cookie'))
调用方法不成功,报错,写文件并用html测试,则是好的。调用姿势不对。
提取函数放单独文件,改一下就好了。先这样
获取encrypt
轻车熟路在首页里找到了一串疑似生成encrypt的代码,拿出来封装一下
function encrypt(password){
var key = CryptoJS.MD5(Math.random() + '').toString();
password = CryptoJS.AES.encrypt(password, key, {mode:CryptoJS.mode.CBC,padding:CryptoJS.pad.ZeroPadding});
password_encode = password.ciphertext.toString(CryptoJS.enc.Base64);
//360è®°ä½Â密ç Â在val的时候会有bug,导致登录ä¸ÂæˆÂ功
while($("#password_input").val() != password_encode){
$("#password_input").val(password_encode);
}
$("#encrypt_iv").val(password.iv.toString(CryptoJS.enc.Base64));
$("#encrypt_key").val(password.key.toString(CryptoJS.enc.Base64));
}
发现一个形似的
Python3 模拟手机登录熊猫直播(panda.tv)
我还是先用js直接搞。
CryptoJS用的是
pad-zeropadding+151112164124.js
开始重点的,用上面执行js的方法,执行这个试试。
第一次报错缺少对象,加上返回后成功!太牛了。
还缺少个必要的参数,password,相比上面那 password_encode 就是本尊了。返回加上,ok.

最紧张的时刻来临。到底数据加密的对不对呢?
组合数据,模拟登陆
找了一个登录的改了一下,发现没效果。Fiddler抓包时编辑器才报错SSL。为什么呢?
强行忽略SSL,尝试登录了几次还不成功。发现有验证码了。真有意思。加上验证码处理之后又发现没有验证码了导致解析报错,加个异常处理。ok
执行,看日志,跳转成功!开森!

还没测有验证码的,可能因为用浏览器成功登录一次就没了。试错几次又出来了验证码。

F5运行,输入验证码。Bingo! 一次过的感觉超级好。再回去刷新浏览器登录页,无验证码。

p.s. 还是想说破解的有点暴力,真没想到上面获取的token 和 encrypt 会有效很顺利(看来其他js都是假动作)。
待优化
- 报错输出,如密码错误等。 var errorMsg = "邮箱或手机不存在"; 用python正则表达式提取字符串
- 内容代码优化,做第一篇新搭建博客日志。
参考资料及注释
感谢前辈们的详细总结
- Windows环境安装PyV8并执行js语句
- python 调用js中的方法 | python 调用js中的函数
- CryptoJS aes加密,需key 和偏移量 iv
- Python模拟京东登录 登录和验证码全用到,感谢
- [原创]Python模拟登陆某网教师教育网 看雪出品必属精品,值得细看一次,只看到给js打断点用到了并没再细看了
- Requests高级用法
- urllib3 User Guide
- python requests 模拟网站登录 取消ssl安全认证
self.s.verify = False - 超详细的Python实现百度云盘模拟登陆(模拟登陆进阶) 学到了pyv8或者pyexecjs库能处理js
Couldn't find a tree builder with the features you requested: lxml. Do you need to install a parser library?,模块bs4引用报错需要安装lxml,网上说安装麻烦,我这里直接pip可以的
Python模拟登陆TAPD的更多相关文章
- Python模拟登陆新浪微博
上篇介绍了新浪微博的登陆过程,这节使用Python编写一个模拟登陆的程序.讲解与程序如下: 1.主函数(WeiboMain.py): import urllib2 import cookielib i ...
- Python模拟登陆万能法-微博|知乎
Python模拟登陆让不少人伤透脑筋,今天奉上一种万能登陆方法.你无须精通HTML,甚至也无须精通Python,但却能让你成功的进行模拟登陆.本文讲的是登陆所有网站的一种方法,并不局限于微博与知乎,仅 ...
- Python模拟登陆淘宝并统计淘宝消费情况的代码实例分享
Python模拟登陆淘宝并统计淘宝消费情况的代码实例分享 支付宝十年账单上的数字有点吓人,但它统计的项目太多,只是想看看到底单纯在淘宝上支出了多少,于是写了段脚本,统计任意时间段淘宝订单的消费情况,看 ...
- python 模拟登陆,请求包含cookie信息
需求: 1.通过GET方法,访问URL地址一,传入cookie参数 2.根据地址一返回的uuid,通过POST方法,传入cooki参数 实现思路: 1.理解http的GET和POST差别 (网上有很多 ...
- python模拟登陆之下载
好长时间没有更新博客了,哈哈. 今天公司给了这么一个需求,现在我们需要去淘宝获取上一天的订单号,然后再根据订单号去另一个接口去获取订单详情,然后再给我展示到web! 中间涉及到的技术点有: 模拟登陆 ...
- 使用python模拟登陆百度
#!/usr/bin/python # -*- coding: utf- -*- """ Function: Used to demostrate how to use ...
- Python模拟登陆某网教师教育网
本文转载自看雪论坛[作者]rdsnow 不得不说,最近的 Python 蛮火的,我也稍稍了解了下,并试着用 Python 爬取网站上的数据 不过有些数据是要登陆后才能获取的,我们每年都要到某教师教育网 ...
- python模拟登陆知乎并爬取数据
一些废话 看了一眼上一篇日志的时间 已然是5个月前的事情了 不禁感叹光阴荏苒其实就是我懒 几周前心血来潮想到用爬虫爬些东西 于是先后先重写了以前写过的求绩点代码 爬了草榴贴图,妹子图网,后来想爬婚恋网 ...
- Python模拟登陆
模拟人人登陆 #encoding=utf-8 import urllib2 import urllib import cookielib def renrenBrower(url,user,passw ...
随机推荐
- AWK入门
AWK类型 AWK:源于AT&T实验室的AWK NAWK:AWK的升级版 GAWK:GNU AWK,兼容AWK和NAWK 程序结构 BEGIN语句块,可选 ...
- NVMe协议1.3c(一) 概述
刚开始接触NVMe,对此理解不深,如有错误敬请指出 1.1概述 NVM ExpressTM(NVMeTM)接口允许主机软件与非易失性存储器子系统通信. 此接口针对企业和客户端固态驱动器进行了优化,通常 ...
- 关于数据安全RSA,MD5,TOKEN
网络上明文传输时 1.数据可能被窃取:2.数据可能被篡改:3.数据被泄露 如何解决: 1.数据被窃取是由于数据能随意的被拿到,且能够被识别.可以有2个方式解决 a.使数据不能随意被获取: 使用toke ...
- IO调度算法的理解(转载)
IO调度器(IO Scheduler)是操作系统用来决定块设备上IO操作提交顺序的方法.存在的目的有两个,一是提高IO吞吐量,二是降低IO响应时间.然而IO吞吐量和IO响应时间往往是矛盾的,为了尽量平 ...
- 2017年3月30日15:00:19 fq以后的以后 动态代理
代理与继承,组合不同的是,继承是继承父类特性,组合是拼装组合类的特性,代理是使用代理类的指定方法并可以做自定义. 静态类是应用单个类,当代理的类数量较多时可用动态代理,动态代理在概念上很好理解 htt ...
- java基础(1)IntelliJ IDEA入门和数组操作 解决idea启动速度慢--配置JVM
一. IntelliJ IDEA入门 1 快捷键和技巧 智能补全代码,比如只写首字母按回车: psvm+Enter :public stactic void main(String[] args) s ...
- 开源中国/码云 README.md上传图片的爬坑记录
整理代码,将电脑中长期没有用过的代码放到码云上托管,给项目录制gif动画,在写项目README.md时使用,结果在上传图片时一直出问题,现记录下最后解决方法: 1. 最初直接将录制好的图片放入到img ...
- Windows7 密码修改
一:不用输入原密码的方式修改用户的密码 1 命令行输入命令:mmc #进入到控制台 2 点击左上角的文件,选择添加/删除管理单元 3 选择本地用户和组管理单元,添加到本地计算机,完成,确定 4 添加 ...
- 使用maven profile指定配置文件打包适用多环境
新建maven项目, 在pom.xml中添加 profile节点信息如下: <profiles> <profile> <!-- 开发环境 --> <id& ...
- IO流小笔记
File file=new File ();括号里面写路径 exists()判断文件是否存在:isfile()是判断已经存在的文件是文件还是目录: mkdir()和createNewFile()区别在 ...