面对一款apk软件,我们如何去获取它的信息,如何获取它的版本号,包名,或者ID,用户权限,这些信息都隐藏在apk包中的AndroidManifest.xml文件中,解开它我们就能获取任何想要的信息。但是当解压apk之后却发现AndroidManifest.xml是一堆看不懂的数字,那该怎么才能获得信息呢?我们不妨做一个款工具来轻松达到目的。

所需条件

  • 安装java环境
  • 拥有AXMLPrinter2.jar文件

获取原理

将apk解压之后,打开cmd,输入java -jar 然后将AXMLPrinter2.jar文件拖入,再将AndroidManifest.xml文件拖入,回车就能解析AndroidManifest.xml文件,得到里面的信息,这是利用jar包解析xml文件。然而这种解压出来的信息比较混乱,我们需要准确的定位信息,只出现需要的信息,这就要将信息过滤,这就需要开发工具来实现。

开发步骤

  1. 解压apk文件
  2. 获取AndroidManifest.xml文件
  3. 解析AndroidManifest.xml文件
  4. 过滤无用内容得到所需信息

代码资源

解压apk

    def isapk(self,into):
# 将文件名显示在text_apk上
separate = os.path.split(str(into)) #解压apk
myzip = zipfile.ZipFile((into))
myfilelist=myzip.namelist()

获取AndroidManifest.xml文件

        for name in myfilelist:
#找到'AndroidManifest.xml'文件
if name == 'AndroidManifest.xml':
fd = open(separate[0]+ r'/AndroidManifest.xml'.decode('utf-8'), "wb")
fd.write(myzip.read(name))
fd.close()
break

解析AndroidManifest.xml文件

        separat = separate[0].decode('utf-8')
roots = os.popen('java -jar C:/dev/PythonProjects/APKTool/src/res/AXMLPrinter2.jar '+ separat+ r'/AndroidManifest.xml')
text = roots.read()
roots.close() #将反编译的内容存入‘AndroidManifest.xml'
def save(filename, contents):
fh = open(filename, 'w')
fh.write(contents)
fh.close() save(separat+ r'/AndroidManifest.xml', text)
return separat+ r'/AndroidManifest.xml'

过滤无用内容得到所需信息

获取版本名、版本号、包名

    def version(self, root):
bodys = root.getiterator("manifest")
#提取versionName
versionName = bodys[0].attrib['{http://schemas.android.com/apk/res/android}versionName']
self.text_version.setText(versionName)
#提取versionCode
versionCode = bodys[0].attrib['{http://schemas.android.com/apk/res/android}versionCode']
self.text_codeversion.setText(versionCode)
#提取package
package = bodys[0].attrib['package']
self.text_package.setText(package)

获取用户权限

    def permission(self, root):
permission = root.findall("uses-permission") #在输出前清空
permissions = []
for i in range(len(permission)):
#输出permission内容
name = permission[i].attrib['{http://schemas.android.com/apk/res/android}name']
permissions.append(name) self.text_permissions.setText('\n'.join(permissions))

获取ID与插件

    def mata(self, root):
meta = root.getiterator("meta-data")
plugins = []
ids = []
for i in range(len(meta)):
#输出meta-data"
if meta[i].attrib['{http://schemas.android.com/apk/res/android}name'] == 'plugin_'+str(i):
value = meta[i].attrib['{http://schemas.android.com/apk/res/android}value']
plugins.append(value) else:
name = meta[i].attrib['{http://schemas.android.com/apk/res/android}name']
value = meta[i].attrib['{http://schemas.android.com/apk/res/android}value']
complete = '[ %s ] = [ %s ]'%(name, value)
ids.append(str(complete)) self.text_plugins.setText('\n'.join(plugins))
self.text_ids.setText('\n'.join(ids))

本站文章为宝宝巴士 SD.Team原创,转载务必在明显处注明:(作者官方网站:宝宝巴士)

转载自【宝宝巴士SuperDo团队】 原文链接: http://www.cnblogs.com/superdo/p/4495665.html

[翔哥高手无敌之路]0-002.如何提取apk中的信息?的更多相关文章

  1. python学习笔记——爬虫中提取网页中的信息

    1 数据类型 网页中的数据类型可分为结构化数据.半结构化数据.非结构化数据三种 1.1 结构化数据 常见的是MySQL,表现为二维形式的数据 1.2 半结构化数据 是结构化数据的一种形式,并不符合关系 ...

  2. c++------------提取文件中的信息

    对于文件比较复杂的时候,为了获取文件中的信息,需要一些比较特殊的函数,比如,getline().replace().atoi,atof等 例子一,读取以下文件中的数据,并保存进一个类里面. 首先,类的 ...

  3. python学习笔记——提取网页中的信息正则表达式re

    被用来检索\替换那些符合某个模式(规则)的文本,对于文本过滤或规则匹配,最强大的就是正则表达式,是python爬虫里必不可少的神兵利器. 1 正则表达式re基本规则 [0-9] 任意一个数字,等价\d ...

  4. MYSQL 提取时间中的信息的 4 方法

    方法 1. year(),month(),day() 方法 2. dayofweek(),dayofmonth(),dayofyear(); 方法 3. hour(),minute(),second( ...

  5. 使用 python 提取照片中的手机信息

    使用 python 提取照片中的手机信息 最近在做一个项目,有一个很重要的点是需要获取使用用户的手机信息,这里我选择从照片中获取信息.有人会问为什么不从手机里面直接获取设备信息.由于现在android ...

  6. [工具-004]如何从apk中提取AndroidManifest.xml并提取相应信息

    跟上一篇类似,我们也需要对APK的一些诸如umengkey,ADkey,TalkingData进行验证,那么我们同样需要解压apk文件,然后提取其中的AndroidManifest.xml.然后解析x ...

  7. Windows PE3.0制作方法(从Win7中提取制作)

    Windows PE3.0制作方法(从Win7中提取制作 在d:新建文件夹winpe,在winpe中新建sources.pe3和new文件夹,把附件中提供的工具imagex连文件夹一起放到winpe目 ...

  8. C++ 提取字符串中的数字

    C++ 提取字符串中的数字 #include <iostream> using namespace std; int main() { ] = "1ab2cd3ef45g&quo ...

  9. python笔记之提取网页中的超链接

    python笔记之提取网页中的超链接 对于提取网页中的超链接,先把网页内容读取出来,然后用beautifulsoup来解析是比较方便的.但是我发现一个问题,如果直接提取a标签的href,就会包含jav ...

随机推荐

  1. nnIPXougCC

    13:58:31           2020-03-14 发现一本书叫做<活法> 学习ing 2020-03-14 15:22:36 太快 ,练习了一会sql语句和打字 想看一会 憨豆特 ...

  2. Flutter 打包Android APK 笔记与事项

    获取一个KEY 首先要获取 你的 打包应用的一个 key ,这一步其实和 在AndroidStudio 上打包 APK 一样,都是要注册一个本地的 key,key 其实也就是 jks文件啦. 如果已经 ...

  3. 【Hexo】使用Hexo+github pages+travis ci 实现自动化部署

    目录 一.说明 二.成品展示 三.前期准备 本地安装 node.js 本地安装 git github 账号 创建仓库 travis ci 账号 四.安装 Hexo 五.使用 hexo 搭建博客 六.部 ...

  4. G - Pictures with Kittens (easy version) dp

    https://codeforces.com/problemset/problem/1077/F1 这个其实是一个比较简单的dp了 题目大意: 给你n个数,让你从n个数里选出x个数,并且每隔k个至少选 ...

  5. Python 记录日志文件

    1.打印到控制台 # -*- coding: UTF-8 -*- import logging def logFileTest(): logging.debug('This is debug') lo ...

  6. Python拆分一列为多列

    有的员工,没有公司开户行的银行卡,发放现金工资.有时人多,需要计算币数.现金工资表中,其中一列为实发工资,import pandas as pd,转化为pd.DataFrame. 面值[100,50, ...

  7. python 基础知识5-集合

    1.集合set概念: 集合是无序的,不重复的数据集合,它里面的元素是可哈希的(不可变类型),但是集合本身是不可哈希(所以集合做不了字典的键)的.以下是集合最重要的两点: 1.去重,把一个列表变成集合, ...

  8. 深度学习中的序列模型演变及学习笔记(含RNN/LSTM/GRU/Seq2Seq/Attention机制)

    [说在前面]本人博客新手一枚,象牙塔的老白,职业场的小白.以下内容仅为个人见解,欢迎批评指正,不喜勿喷![认真看图][认真看图] [补充说明]深度学习中的序列模型已经广泛应用于自然语言处理(例如机器翻 ...

  9. 暴力破解-HTTP Basic认证

    0x01 HTTP Basic认证介绍 基本认证 basic authentication ← HTTP1.0提出的认证方法 基本认证步骤: 1. 客户端访问一个受http基本认证保护的资源. 2. ...

  10. 热修复框架Tinker快速集成

    由于腾讯官方的demo对于刚接触的我来说,太过复杂,找不到核心配置,因此将tinker集成中最核心的东西抽取出来,整合到一个demo中. demo工程已经提交到github上,点击跳转 更多使用方法, ...