面对一款apk软件,我们如何去获取它的信息,如何获取它的版本号,包名,或者ID,用户权限,这些信息都隐藏在apk包中的AndroidManifest.xml文件中,解开它我们就能获取任何想要的信息。但是当解压apk之后却发现AndroidManifest.xml是一堆看不懂的数字,那该怎么才能获得信息呢?我们不妨做一个款工具来轻松达到目的。

所需条件

  • 安装java环境
  • 拥有AXMLPrinter2.jar文件

获取原理

将apk解压之后,打开cmd,输入java -jar 然后将AXMLPrinter2.jar文件拖入,再将AndroidManifest.xml文件拖入,回车就能解析AndroidManifest.xml文件,得到里面的信息,这是利用jar包解析xml文件。然而这种解压出来的信息比较混乱,我们需要准确的定位信息,只出现需要的信息,这就要将信息过滤,这就需要开发工具来实现。

开发步骤

  1. 解压apk文件
  2. 获取AndroidManifest.xml文件
  3. 解析AndroidManifest.xml文件
  4. 过滤无用内容得到所需信息

代码资源

解压apk

    def isapk(self,into):
# 将文件名显示在text_apk上
separate = os.path.split(str(into)) #解压apk
myzip = zipfile.ZipFile((into))
myfilelist=myzip.namelist()

获取AndroidManifest.xml文件

        for name in myfilelist:
#找到'AndroidManifest.xml'文件
if name == 'AndroidManifest.xml':
fd = open(separate[0]+ r'/AndroidManifest.xml'.decode('utf-8'), "wb")
fd.write(myzip.read(name))
fd.close()
break

解析AndroidManifest.xml文件

        separat = separate[0].decode('utf-8')
roots = os.popen('java -jar C:/dev/PythonProjects/APKTool/src/res/AXMLPrinter2.jar '+ separat+ r'/AndroidManifest.xml')
text = roots.read()
roots.close() #将反编译的内容存入‘AndroidManifest.xml'
def save(filename, contents):
fh = open(filename, 'w')
fh.write(contents)
fh.close() save(separat+ r'/AndroidManifest.xml', text)
return separat+ r'/AndroidManifest.xml'

过滤无用内容得到所需信息

获取版本名、版本号、包名

    def version(self, root):
bodys = root.getiterator("manifest")
#提取versionName
versionName = bodys[0].attrib['{http://schemas.android.com/apk/res/android}versionName']
self.text_version.setText(versionName)
#提取versionCode
versionCode = bodys[0].attrib['{http://schemas.android.com/apk/res/android}versionCode']
self.text_codeversion.setText(versionCode)
#提取package
package = bodys[0].attrib['package']
self.text_package.setText(package)

获取用户权限

    def permission(self, root):
permission = root.findall("uses-permission") #在输出前清空
permissions = []
for i in range(len(permission)):
#输出permission内容
name = permission[i].attrib['{http://schemas.android.com/apk/res/android}name']
permissions.append(name) self.text_permissions.setText('\n'.join(permissions))

获取ID与插件

    def mata(self, root):
meta = root.getiterator("meta-data")
plugins = []
ids = []
for i in range(len(meta)):
#输出meta-data"
if meta[i].attrib['{http://schemas.android.com/apk/res/android}name'] == 'plugin_'+str(i):
value = meta[i].attrib['{http://schemas.android.com/apk/res/android}value']
plugins.append(value) else:
name = meta[i].attrib['{http://schemas.android.com/apk/res/android}name']
value = meta[i].attrib['{http://schemas.android.com/apk/res/android}value']
complete = '[ %s ] = [ %s ]'%(name, value)
ids.append(str(complete)) self.text_plugins.setText('\n'.join(plugins))
self.text_ids.setText('\n'.join(ids))

本站文章为宝宝巴士 SD.Team原创,转载务必在明显处注明:(作者官方网站:宝宝巴士)

转载自【宝宝巴士SuperDo团队】 原文链接: http://www.cnblogs.com/superdo/p/4495665.html

[翔哥高手无敌之路]0-002.如何提取apk中的信息?的更多相关文章

  1. python学习笔记——爬虫中提取网页中的信息

    1 数据类型 网页中的数据类型可分为结构化数据.半结构化数据.非结构化数据三种 1.1 结构化数据 常见的是MySQL,表现为二维形式的数据 1.2 半结构化数据 是结构化数据的一种形式,并不符合关系 ...

  2. c++------------提取文件中的信息

    对于文件比较复杂的时候,为了获取文件中的信息,需要一些比较特殊的函数,比如,getline().replace().atoi,atof等 例子一,读取以下文件中的数据,并保存进一个类里面. 首先,类的 ...

  3. python学习笔记——提取网页中的信息正则表达式re

    被用来检索\替换那些符合某个模式(规则)的文本,对于文本过滤或规则匹配,最强大的就是正则表达式,是python爬虫里必不可少的神兵利器. 1 正则表达式re基本规则 [0-9] 任意一个数字,等价\d ...

  4. MYSQL 提取时间中的信息的 4 方法

    方法 1. year(),month(),day() 方法 2. dayofweek(),dayofmonth(),dayofyear(); 方法 3. hour(),minute(),second( ...

  5. 使用 python 提取照片中的手机信息

    使用 python 提取照片中的手机信息 最近在做一个项目,有一个很重要的点是需要获取使用用户的手机信息,这里我选择从照片中获取信息.有人会问为什么不从手机里面直接获取设备信息.由于现在android ...

  6. [工具-004]如何从apk中提取AndroidManifest.xml并提取相应信息

    跟上一篇类似,我们也需要对APK的一些诸如umengkey,ADkey,TalkingData进行验证,那么我们同样需要解压apk文件,然后提取其中的AndroidManifest.xml.然后解析x ...

  7. Windows PE3.0制作方法(从Win7中提取制作)

    Windows PE3.0制作方法(从Win7中提取制作 在d:新建文件夹winpe,在winpe中新建sources.pe3和new文件夹,把附件中提供的工具imagex连文件夹一起放到winpe目 ...

  8. C++ 提取字符串中的数字

    C++ 提取字符串中的数字 #include <iostream> using namespace std; int main() { ] = "1ab2cd3ef45g&quo ...

  9. python笔记之提取网页中的超链接

    python笔记之提取网页中的超链接 对于提取网页中的超链接,先把网页内容读取出来,然后用beautifulsoup来解析是比较方便的.但是我发现一个问题,如果直接提取a标签的href,就会包含jav ...

随机推荐

  1. Codeforce 1155D Beautiful Array(DP)

    D. Beautiful Array You are given an array aa consisting of nn integers. Beauty of array is the maxim ...

  2. 从垃圾回收机制解析为什么局部内部类只能访问final修饰的局部变量以及为什么加final能解决问题

    我们先稍微看一下代码: 从这里的提示可以看到,必须要将a的修饰符变为final才行. 现在笔者就这一结果做出自己的分析: 首先来说,我们知道,方法被调用时会执行,当执行的时候,方法中的局部变量会加载到 ...

  3. Java for 嵌套循环

    嵌套循环 可以是for循环 while循环也可以是do-while循环  这三着进行组合嵌套 循环思路:先执行外层循环,内层循环作为外层循环的循环体,直到内层循环执行完毕,再次计算外层循环,根据条件决 ...

  4. 【FPGA篇章三】FPGA常用语句:Verilog基本语法要素

    欢迎大家关注我的微信公众账号,支持程序媛写出更多优秀的文章 Verilog中总共有十九种数据类型,我们先介绍四个最基本的数据类型,他们是: reg型.wire型.integer型.parameter型 ...

  5. 【Kafka】实时看板案例

    目录 项目需求 项目模型 实现步骤 项目需求 快速计算双十一当天的订单量和销售金额 项目模型 实现步骤 一.创建topic bin/kafka-topics.sh --create --topic i ...

  6. Python哈希表和解析式

    目录 1. 封装和解构 1.1 封装 1.2 解构 2. 集合Set 2.1 初始化 2.2 增加 2.3 删除 2.4 遍历 2.5 并集&交集&差集&对称差集 3.字典 3 ...

  7. Mysql 常用函数(8)- concat 函数

    Mysql常用函数的汇总,可看下面系列文章 https://www.cnblogs.com/poloyy/category/1765164.html concat 的作用 连接多个字符串 concat ...

  8. css段落样式

    字间距 letter-spacing 首行缩进 text-indent

  9. 【Socket编程】【第一节】【Socket基本原理和套接字】

    参考http://c.biancheng.net/view/2351.html 一.scoket套接字(告诉你使用哪种数据传输方式) 这个世界上有很多种套接字(socket),比如 DARPA Int ...

  10. python 调用ldap同步密码

    windows + python2.7 安装 python-ldap https://www.lfd.uci.edu/~gohlke/pythonlibs/#python-ldap 2.python ...