爬取WX小程序的数据

方法一：

使用TBS工具，调试跟踪获取URL

https://x5.tencent.com/tbs/guide/debug/download.html

https://x5.tencent.com/tbs/guide/debug/season1.html

方法二：

下载小程序的包，反编译，查看代码或者用微信开发者工具调试跟踪

1、node.js运行环境

如果没有安装nodejs，请先安装一下
下载地址：https://nodejs.org/en/

2、反编译的脚本

这里提供一个Github上qwerty472123大神写的node.js版本的，当然也有其它版本的，例如python版本，这里我只是简单地用node.js版本举例
地址：https://github.com/qwerty472123/wxappUnpacker

3、安卓模拟器（要求自带root权限）

我使用的是夜神模拟器，你也可以自选
下载地址：https://www.yeshen.com/cn/download/fullPackage、

4、下载包

在模拟器微信中运行一下后，直接切回模拟器桌面，运行RE浏览器来到目录
根目录/data/data/com.tencent.mm/MicroMsg/{一串16进制字符}/appbrand/pkg/
把包压缩成zip，并传到电脑

5、反编译

在node命令窗口中安装依赖：npm install
安装好依赖之后，就是最后一步了，反编译 .wxapkg 文件
在当前目录下输入
node wuWxapkg.js [-d] <files…> //files就是你想要反编译的文件名
例如：我有一个需要反编译的文件 _163200311_32.wxapkg 已经解压到了D盘根目录下,那么就输出命令
node .\wuWxapkg.js D:\_163200311_32.wxapkg

6、使用微信开发者工具打开并调试，需要有微信号登录，并设置可信域名(域名一般在代码的config.js里面)

开发工具下载网址：https://developers.weixin.qq.com/miniprogram/dev/devtools/download.html
设置可信域名：https://mp.weixin.qq.com/
开发工具说明：　https://developers.weixin.qq.com

爬取WX小程序的数据的更多相关文章

python爬取微信小程序（实战篇）
python爬取微信小程序(实战篇) 本文链接:https://blog.csdn.net/HeyShHeyou/article/details/90452656 展开一.背景介绍近期有需求需要抓 ...
Python爬取微信小程序（Charles）
Python爬取微信小程序(Charles) 本文链接:https://blog.csdn.net/HeyShHeyou/article/details/90045204 一.前言最近需要获取微信小 ...
scrapy爬取微信小程序社区教程（crawlspider）
爬取的目标网站是: http://www.wxapp-union.com/portal.php?mod=list&catid=2&page=1 目的是爬取每一个教程的标题,作者,时间和 ...
scarpy crawl 爬取微信小程序文章（将数据通过异步的方式保存的数据库中）
import scrapy from scrapy.linkextractors import LinkExtractor from scrapy.spiders import CrawlSpider ...
scarpy crawl 爬取微信小程序文章
import scrapy from scrapy.linkextractors import LinkExtractor from scrapy.spiders import CrawlSpider ...
burpsuite抓取小程序的数据包（指定DNS）
目标:burpsuite抓取微信小程序的数据包,而且该系统需指定DNS!否则无法访问! 大家都知道小程序是https传输的,所以手机端是需要安装burp证书的. 已忽略安装证书的步骤,可自己百度搜索, ...
小程序的数据存储，与Django等服务发送请求
目录官方文档快速归纳存取改删 1.wx存储数据到本地以及本地获取数 1.1 wx.setStorageSync(string key, any data) 存(同步) 1.2 wx.setSto ...
Java爬虫系列四：使用selenium-java爬取js异步请求的数据
在之前的系列文章中介绍了如何使用httpclient抓取页面html以及如何用jsoup分析html源文件内容得到我们想要的数据,但是有时候通过这两种方式不能正常抓取到我们想要的数据,比如看如下例子. ...
python爬取快手小姐姐视频
流程分析一.导入需要的三方库 import re #正则表表达式文字匹配 import requests #指定url,获取网页数据 import json #转化json格式 import os ...

随机推荐

leetcode python 030 Substring with Concatenation of All Words
## 您将获得一个字符串s,以及一个长度相同单词的列表.## 找到s中substring(s)的所有起始索引,它们只包含所有单词,## eg:s: "barfoothefoobarman&q ...
linux c++ curl https 请求并双向验证SSL证书
1.配置curl https请求需要提供 CA证书.客户端证书和客户端秘钥,这三个文件的pem格式. 分别对应 curl_easy_setopt() 函数的下面三个参数: CURLOPT_CAINF ...
添加网络打印机的步骤（xp和win2008+win7）
1.如题,设置好打印机的 ip地址和子网掩码等信息. 2 .xp不像其他新的系统那么好用那么智能...只能慢慢来如果是xp,注意,请添加网络打印机的时候选 :添加本地打印机,,记得哦然后如图然 ...
VBA消息框
MsgBox函数显示一个消息框,并等待用户点击一个按钮,然后根据用户点击该按钮的动作执行. 语法 MsgBox(prompt[,buttons][,title][,helpfile,context]) ...
Delphi xe8 FMX StringGrid根据内容自适应列宽。
Delphi xe8 FMX StringGrid根据内容自适应列宽. 网上的资料比较复杂,而且不是根据字体字号等设置列宽.故自己写了个function来用. function GetColMaxDa ...
dos脚本
关于dos命令行脚本编写 dos常用命令另查开始之前先简单说明下cmd文件和bat文件的区别:在本质上两者没有区别,都是简单的文本编码方式,都可以用记事本创建.编辑和查看.两者所用的命令行代码也 ...
Oracle 导出的表不全，以及数据库版本不同导入报错
公司有两个环境下的数据库,版本不同,一个是11g r2,另一个是10g r2 首先在11g r2下用exp导出数据库备份文件,发现部分表缺失. 原来这部分表是空的,11G中新特性,当表无数据时,不分配 ...
下载安装ngnix
在这个网站上进行下载,http://nginx.org/en/download.html,由于我的是windows系统我下载解压后,打开文件夹里面看到ngix.exe,我去双击它,发现它就是一闪,后 ...
【转】spring boot mybatis 读取配置文件
spring boot mybatis 配置整理一.加载mybatis的配置 1.手写配置,写死在代码里 import java.io.IOException; import java.util.P ...
php 图片缩放然后合成并保存
/** * 功能说明 * 将files/model_24/images/下的所有图片文件进行等比例缩放到$image40w 尺寸然后放到files/model_24/model.png图片的指定位 ...

爬取WX小程序的数据

爬取WX小程序的数据的更多相关文章

随机推荐

热门专题