Python破解js加密实例（有道在线翻译）

在爬虫爬取网站的时候，经常遇到一些反爬虫技术，比如：

加cookie，身份验证UserAgent
图形验证，还有很难破解的滑动验证
js签名验证，对传输数据进行加密处理

对于js加密
经过加密传输的就是密文，但是加密函数或者过程一定是在浏览器完成，
也就是一定会把js代码暴露给使用者
通过阅读加密算法，就可以模拟出加密过程，从而达到破解
怎样判断网站有没有使用js加密，很简单，例如有道在线翻译

1.打开【有道在线翻译】网页：http://fanyi.youdao.com/
2.【右键检查】，选中【Network】
3.【输入单词】
4.在请求中，找到关于翻译内容的Form Data，可以看到有下面两项说明js加密

“salt”: “1523100789519”,

“sign”: “b8a55a436686cd8973fa46514ccedbe”,

分析js

一定要按照下面的顺序，不然的话会有很多无用的东西干扰
1.打开【有道在线翻译】网页：http://fanyi.youdao.com/
2.【右键检查】，选中【Network】
3.【输入单词】，【抓取js代码】
操作截图：

我们得到的js代码是一行代码，是压缩后的min代码，我们需要进行格式转换
4.打开在线代码格式化网站：http://tool.oschina.net/codeformat/js
5.将拷贝的一行格式的js代码，粘贴在表单中，点击【格式化】
操作截图：

然后将格式化后的js代码，拷贝到一个可以搜索的代码编码器，备用
编写第2个版本
案例v18文件：
https://xpwi.github.io/py/py%E7%88%AC%E8%99%AB/py18js2.py

# 破解js加密，版本2

'''

通过在js文件中查找salt或者sign，可以找到

1.可以找到这个计算salt的公式

r = "" + ((new Date).getTime() + parseInt(10 * Math.random(), 10))

2.sign：n.md5("fanyideskweb" + t + r + "ebSeFb%=XZ%T[KZ)c(sy!");

md5 一共需要四个参数，第一个和第四个都是固定值得字符串，第三个是所谓的salt，

第二个参数是输入的需要翻译的单词
Python学习交流群：857662006

'''

from urllib import request, parse

def getSalt():

    '''

    salt的公式r = "" + ((new Date).getTime() + parseInt(10 * Math.random(), 10))

    把它翻译成python代码

    '''

    import time, random

    salt = int(time.time()*1000) + random.randint(0, 10)

    return salt

def getMD5(v):

    import hashlib

    md5 = hashlib.md5()

    md5.update(v.encode('utf-8'))

    sign = md5.hexdigest()

    return sign

def getSign(key, salt):

    sign = "fanyideskweb" + key + str(salt) + "ebSeFb%=XZ%T[KZ)c(sy!"

    sign = getMD5(sign)

    return sign

def youdao(key):

    # url从http://fanyi.youdao.com输入词汇右键检查得到

    url = "http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=true"

    salt = getSalt()

    # data从右键检查FormData得到

    data = {

        "i": key,

        "from": "AUTO",

        "to": "AUTO",

        "smartresult": "dict",

        "client": "fanyideskweb",

        "salt": str(salt),

        "sign": getSign(key, salt),

        "doctype": "json",

        "version": "2.1",

        "keyform": "fanyi.web",

        "action": "FY_BY_REALTIME",

        "typoResult": "false"

    }

    print(data)

    # 对data进行编码，因为参数data需要bytes格式

    data = parse.urlencode(data).encode()

    # headers从右键检查Request Headers得到

    headers = {

        "Accept": "application/json, text/javascript, */*; q=0.01",

        "Accept-Language": "zh-CN,zh;q=0.9",

        "Connection": "keep-alive",

        "Content-Length": len(data),

        "Content-Type": "application/x-www-form-urlencoded; charset=UTF-8",

        "Cookie": "OUTFOX_SEARCH_USER_ID=685021846@10.168.8.76; OUTFOX_SEARCH_USER_ID_NCOO=366356259.5731474; _ntes_nnid=1f61e8bddac5e72660c6d06445559ffb,1535033370622; JSESSIONID=aaaVeQTI9KXfqfVBNsXvw; ___rl__test__cookies=1535204044230",

        "Host": "fanyi.youdao.com",

        "Origin": "http://fanyi.youdao.com",

        "Referer": "http://fanyi.youdao.com/",

        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.75 Safari/537.36",

        "X-Requested-With": "XMLHttpRequest"

    }

    req = request.Request(url=url, data=data, headers=headers)

    rsp = request.urlopen(req)

    html = rsp.read().decode()

    print(html)

if __name__ == '__main__':

    youdao("girl")

运行结果

返回翻译后的值，才算是成功

注意

按照步骤，熟悉流程最重要

---------------------

原文：https://blog.csdn.net/qq_40147863/article/details/82079649

Python破解js加密实例（有道在线翻译）的更多相关文章

Python爬虫教程-16-破解js加密实例（有道在线翻译）
python爬虫教程-16-破解js加密实例(有道在线翻译) 在爬虫爬取网站的时候,经常遇到一些反爬虫技术,比如: 加cookie,身份验证UserAgent 图形验证,还有很难破解的滑动验证 js签 ...
爬虫破解js加密（一）有道词典js加密参数 sign破解
在爬虫过程中,经常给服务器造成压力(比如耗尽CPU,内存,带宽等),为了减少不必要的访问(比如爬虫),网页开发者就发明了反爬虫技术. 常见的反爬虫技术有封ip,user_agent,字体库,js加密, ...
Python爬虫—破解JS加密的Cookie
前言在GitHub上维护了一个代理池的项目,代理来源是抓取一些免费的代理发布网站.上午有个小哥告诉我说有个代理抓取接口不能用了,返回状态521.抱着帮人解决问题的心态去跑了一遍代码.发现果真是这样. ...
python爬虫---js加密和混淆,scrapy框架的使用.
python爬虫---js加密和混淆,scrapy框架的使用. 一丶js加密和js混淆 js加密对js源码进行加密,从而保护js代码不被黑客窃取.(一般加密和解密的方法都在前端) http:// ...
python爬虫_从零开始破解js加密（一）
除了一些类似字体反爬之类的奇淫技巧,js加密应该是反爬相当常见的一部分了,这也是一个分水岭,我能解决基本js加密的才能算入阶. 最近正好遇到一个比较简单的js,跟大家分享一下迅雷网盘搜索_838888 ...
Python 爬虫js加密破解（四） 360云盘登录password加密
登录链接:https://yunpan.360.cn/mindex/login 这是一个md5 加密算法,直接使用 md5加密即可实现本文讲解的是如何抠出js,运行代码第一部:抓包如图第二步: ...
Python 爬虫js加密破解（三）百度翻译 sign
第一步: 模拟抓包分析加密参数第二步: 找到加密字段调试出来的sign和抓取得到的数据一致,都是 275626.55195 第三部: 分析js加密方法第四部:运行js代码: 仅供交流学习使用
记第一次破解js加密代码
首先,我要爬的是这个网站:http://www.66ip.cn/nm.html,我想做个直接调用网站的接口获取代理的爬虫这个接口看上去似乎很简单,直接输入需要的代理条件后,点击提取即可点击提取后就 ...
python爬虫之有道在线翻译
今天初学了python这门课老师简单的讲解了一下 python的安装环境,配置环境变量,当前主流Python使用的是3.x版本, 下午简单的讲解了python的起源,发展以及在各个方面的应用然后晚 ...

随机推荐

如何给HTML页面的文本设置字符和单词间距
设置字符和单词间距介绍属性名单位描述 letter-spacing px 设置字符间距 word-spacing px 设置单词间距 letter-spacing设置字符间距 letter-sp ...
Dynamics 365利用HTML页面创建实体记录并同步上传附件
我是微软Dynamcis 365 & Power Platform方面的工程师罗勇,也是2015年7月到2018年6月连续三年Dynamics CRM/Business Solutions方面 ...
仓库管理移动应用解决方案——C#开发的移动应用开源解决方案
产品简介 SmoWMS是一款仓库管理移动解决方案,通过Smobiler平台开发,包含了仓库管理中基础的入库.出库.订单管理.调拨.盘点.报表等功能.支持扫码条码扫描.RFID扫描等仓库中常见的场景. ...
SparkStreaming整合flume
SparkStreaming整合flume 在实际开发中push会丢数据,因为push是由flume将数据发给程序,程序出错,丢失数据.所以不会使用不做讲解,这里讲解poll,拉去flume的数据,保 ...
DataGuard搭建逻辑StandBy
DataGuard搭建逻辑StandBy 原创作者:bayaim 时间:2016-03-31 17:23:48 272 0删除编辑物理StandBy优点是效率高,缺点是只读模式不能恢复,恢复模 ...
使用vs code编写Markdown文档以及markdown语法详解
首先安装vscode工具,下载地址如下: https://code.visualstudio.com/ 在vs code的扩展中安装: Markdown Preview Enhanced 这款插件,安 ...
python测试mysql写入性能完整实例
这篇文章主要介绍了python测试mysql写入性能完整实例,具有一定借鉴价值,需要的朋友可以参考下本文主要研究的是python测试mysql写入性能,分享了一则完整代码,具体介绍如下. 测试环境: ...
Python类定义、属性、初始化和析构
类的定义,属性和方法概念方法中self的作用和意义初始化( __init__ ) 和析构方法( __del__ ) 类的定义 class 类名实例实例名 = 类名() 一个“实例”的“特征” ...
nginx 配置实例-负载均衡
1.实现效果 (1)浏览器地址栏输入地址 http://www.123.com/edu/a.html,负载均衡效果,平均 8080 和 8081 端口中 2.准备工作 (1)准备两台 tomcat 服 ...
Vue之methods watch和compute的区别和联系
computed是用来把多个基础的数据组合成一个复杂的数据:同时获得了vue提供的自动变更通知机制. 即将基础数据变为复杂数据,同时获得自动变更通知机制 watch是利用了vue的自动变更通知机制,用 ...

Python破解js加密实例（有道在线翻译）

分析js

运行结果

注意

Python破解js加密实例（有道在线翻译）的更多相关文章

随机推荐

热门专题