[翔哥高手无敌之路]0-002.如何提取apk中的信息?
面对一款apk软件,我们如何去获取它的信息,如何获取它的版本号,包名,或者ID,用户权限,这些信息都隐藏在apk包中的AndroidManifest.xml文件中,解开它我们就能获取任何想要的信息。但是当解压apk之后却发现AndroidManifest.xml是一堆看不懂的数字,那该怎么才能获得信息呢?我们不妨做一个款工具来轻松达到目的。
所需条件
- 安装java环境
- 拥有AXMLPrinter2.jar文件
获取原理
将apk解压之后,打开cmd,输入java -jar 然后将AXMLPrinter2.jar文件拖入,再将AndroidManifest.xml文件拖入,回车就能解析AndroidManifest.xml文件,得到里面的信息,这是利用jar包解析xml文件。然而这种解压出来的信息比较混乱,我们需要准确的定位信息,只出现需要的信息,这就要将信息过滤,这就需要开发工具来实现。
开发步骤
- 解压apk文件
- 获取AndroidManifest.xml文件
- 解析AndroidManifest.xml文件
- 过滤无用内容得到所需信息
代码资源
解压apk
def isapk(self,into):
# 将文件名显示在text_apk上
separate = os.path.split(str(into)) #解压apk
myzip = zipfile.ZipFile((into))
myfilelist=myzip.namelist()
获取AndroidManifest.xml文件
for name in myfilelist:
#找到'AndroidManifest.xml'文件
if name == 'AndroidManifest.xml':
fd = open(separate[0]+ r'/AndroidManifest.xml'.decode('utf-8'), "wb")
fd.write(myzip.read(name))
fd.close()
break
解析AndroidManifest.xml文件
separat = separate[0].decode('utf-8')
roots = os.popen('java -jar C:/dev/PythonProjects/APKTool/src/res/AXMLPrinter2.jar '+ separat+ r'/AndroidManifest.xml')
text = roots.read()
roots.close()
#将反编译的内容存入‘AndroidManifest.xml'
def save(filename, contents):
fh = open(filename, 'w')
fh.write(contents)
fh.close()
save(separat+ r'/AndroidManifest.xml', text)
return separat+ r'/AndroidManifest.xml'
过滤无用内容得到所需信息
获取版本名、版本号、包名
def version(self, root):
bodys = root.getiterator("manifest")
#提取versionName
versionName = bodys[0].attrib['{http://schemas.android.com/apk/res/android}versionName']
self.text_version.setText(versionName)
#提取versionCode
versionCode = bodys[0].attrib['{http://schemas.android.com/apk/res/android}versionCode']
self.text_codeversion.setText(versionCode)
#提取package
package = bodys[0].attrib['package']
self.text_package.setText(package)
获取用户权限
def permission(self, root):
permission = root.findall("uses-permission") #在输出前清空
permissions = []
for i in range(len(permission)):
#输出permission内容
name = permission[i].attrib['{http://schemas.android.com/apk/res/android}name']
permissions.append(name) self.text_permissions.setText('\n'.join(permissions))
获取ID与插件
def mata(self, root):
meta = root.getiterator("meta-data")
plugins = []
ids = []
for i in range(len(meta)):
#输出meta-data"
if meta[i].attrib['{http://schemas.android.com/apk/res/android}name'] == 'plugin_'+str(i):
value = meta[i].attrib['{http://schemas.android.com/apk/res/android}value']
plugins.append(value) else:
name = meta[i].attrib['{http://schemas.android.com/apk/res/android}name']
value = meta[i].attrib['{http://schemas.android.com/apk/res/android}value']
complete = '[ %s ] = [ %s ]'%(name, value)
ids.append(str(complete)) self.text_plugins.setText('\n'.join(plugins))
self.text_ids.setText('\n'.join(ids))

本站文章为宝宝巴士 SD.Team原创,转载务必在明显处注明:(作者官方网站:宝宝巴士)
转载自【宝宝巴士SuperDo团队】 原文链接: http://www.cnblogs.com/superdo/p/4495665.html
[翔哥高手无敌之路]0-002.如何提取apk中的信息?的更多相关文章
- python学习笔记——爬虫中提取网页中的信息
1 数据类型 网页中的数据类型可分为结构化数据.半结构化数据.非结构化数据三种 1.1 结构化数据 常见的是MySQL,表现为二维形式的数据 1.2 半结构化数据 是结构化数据的一种形式,并不符合关系 ...
- c++------------提取文件中的信息
对于文件比较复杂的时候,为了获取文件中的信息,需要一些比较特殊的函数,比如,getline().replace().atoi,atof等 例子一,读取以下文件中的数据,并保存进一个类里面. 首先,类的 ...
- python学习笔记——提取网页中的信息正则表达式re
被用来检索\替换那些符合某个模式(规则)的文本,对于文本过滤或规则匹配,最强大的就是正则表达式,是python爬虫里必不可少的神兵利器. 1 正则表达式re基本规则 [0-9] 任意一个数字,等价\d ...
- MYSQL 提取时间中的信息的 4 方法
方法 1. year(),month(),day() 方法 2. dayofweek(),dayofmonth(),dayofyear(); 方法 3. hour(),minute(),second( ...
- 使用 python 提取照片中的手机信息
使用 python 提取照片中的手机信息 最近在做一个项目,有一个很重要的点是需要获取使用用户的手机信息,这里我选择从照片中获取信息.有人会问为什么不从手机里面直接获取设备信息.由于现在android ...
- [工具-004]如何从apk中提取AndroidManifest.xml并提取相应信息
跟上一篇类似,我们也需要对APK的一些诸如umengkey,ADkey,TalkingData进行验证,那么我们同样需要解压apk文件,然后提取其中的AndroidManifest.xml.然后解析x ...
- Windows PE3.0制作方法(从Win7中提取制作)
Windows PE3.0制作方法(从Win7中提取制作 在d:新建文件夹winpe,在winpe中新建sources.pe3和new文件夹,把附件中提供的工具imagex连文件夹一起放到winpe目 ...
- C++ 提取字符串中的数字
C++ 提取字符串中的数字 #include <iostream> using namespace std; int main() { ] = "1ab2cd3ef45g&quo ...
- python笔记之提取网页中的超链接
python笔记之提取网页中的超链接 对于提取网页中的超链接,先把网页内容读取出来,然后用beautifulsoup来解析是比较方便的.但是我发现一个问题,如果直接提取a标签的href,就会包含jav ...
随机推荐
- 51NOD 1006 最长公共子序列 Lcs 动态规划 DP 模板题 板子
给出两个字符串A B,求A与B的最长公共子序列(子序列不要求是连续的). 比如两个串为: abcicba abdkscab ab是两个串的子序列,abc也是,abca也是,其中abca是这两个字符串最 ...
- 「从零单排HBase 09」Hbase的那些数据结构和算法
在之前学习MySQL的时候,我们知道存储引擎常用的索引结构有B+树索引和哈希索引. 而对HBase的学习,也离不开索引结构的学习,它使用了一种LSM树((Log-Structured Merge-Tr ...
- libevent(五)event
libevent使用struct event来表示一个事件. #define evutil_socket_t int #define ev_uint8_t unsigned char #define ...
- libevent(十三)evhttp事件处理流程
在libevent(六)http server中,作为一个单线程http server,不仅要监听每个连接的到来,还要监听每个连接上的I/O事件. 查看源码可知,在evhttp_bind_socket ...
- C# 多线程猜想
公司分配给我一个活,让我给Kong网关做一个获取设置的站点.Kong网关号称几万的QPS的神器,我有点慌,如果因为我的站点拖累了Kong我就是千古罪人. 配合Kong的站点必须要经过性能测试,在性能测 ...
- 设计模式之GOF23适配器模式
结构型模式 核心作用:是从程序的结构上实现松耦合,从而可以扩大整体的 类结构,用来解决更大的问题 适配器模式adapter 实际生活中的例子:转换器 适配器的两种方式: 1,类适配器(继承) /**需 ...
- [csu/coj 1079]树上路径查询 LCA
题意:询问树上从u到v的路径是否经过k 思路:把树dfs转化为有根树后,对于u,v的路径而言,设p为u,v的最近公共祖先,u到v的路径必定是可以看成两条路径的组合,u->p,v->p,这样 ...
- 整理了最全的Python3数据类型转换方法,可以收藏当手册用
本文基于python3.8版本,总结了各种数据类型直接的转换规则和方法.算是比较全了,可以收藏当手册来查. 概述 数据类型转换,指的是通过某种方法,将一个数据由原来的类型转换为另外一个类型.比如,我们 ...
- Spring MVC教程——检视阅读
Spring MVC教程--检视阅读 参考 Spring MVC教程--一点--蓝本 Spring MVC教程--c语言中午网--3.0版本太老了 Spring MVC教程--易百--4.0版本不是通 ...
- 向大家介绍我的新书:《基于股票大数据分析的Python入门实战》
我在公司里做了一段时间Python数据分析和机器学习的工作后,就尝试着写一本Python数据分析方面的书.正好去年有段时间股票题材比较火,就在清华出版社夏老师指导下构思了这本书.在这段特殊时期内,夏老 ...