[翔哥高手无敌之路]0-002.如何提取apk中的信息？

面对一款apk软件，我们如何去获取它的信息，如何获取它的版本号，包名，或者ID，用户权限，这些信息都隐藏在apk包中的AndroidManifest.xml文件中，解开它我们就能获取任何想要的信息。但是当解压apk之后却发现AndroidManifest.xml是一堆看不懂的数字，那该怎么才能获得信息呢？我们不妨做一个款工具来轻松达到目的。

所需条件

安装java环境
拥有AXMLPrinter2.jar文件

获取原理

将apk解压之后，打开cmd，输入java -jar 然后将AXMLPrinter2.jar文件拖入，再将AndroidManifest.xml文件拖入，回车就能解析AndroidManifest.xml文件，得到里面的信息，这是利用jar包解析xml文件。然而这种解压出来的信息比较混乱，我们需要准确的定位信息，只出现需要的信息，这就要将信息过滤，这就需要开发工具来实现。

开发步骤

解压apk文件
获取AndroidManifest.xml文件
解析AndroidManifest.xml文件
过滤无用内容得到所需信息

代码资源

解压apk

    def isapk(self,into):

        # 将文件名显示在text_apk上

        separate = os.path.split(str(into))

        #解压apk

        myzip = zipfile.ZipFile((into))

        myfilelist=myzip.namelist()

获取AndroidManifest.xml文件

        for name in myfilelist:

            #找到'AndroidManifest.xml'文件

            if name == 'AndroidManifest.xml':

                fd = open(separate[0]+ r'/AndroidManifest.xml'.decode('utf-8'), "wb")

                fd.write(myzip.read(name))

                fd.close()

                break

解析AndroidManifest.xml文件

        separat = separate[0].decode('utf-8')

        roots = os.popen('java -jar C:/dev/PythonProjects/APKTool/src/res/AXMLPrinter2.jar '+ separat+ r'/AndroidManifest.xml')

        text = roots.read()

        roots.close()

        #将反编译的内容存入‘AndroidManifest.xml'

        def save(filename, contents):

            fh = open(filename, 'w')

            fh.write(contents)

            fh.close()  

        save(separat+ r'/AndroidManifest.xml', text)

        return separat+ r'/AndroidManifest.xml'

过滤无用内容得到所需信息

获取版本名、版本号、包名

    def version(self, root):

        bodys = root.getiterator("manifest")

        #提取versionName

        versionName = bodys[0].attrib['{http://schemas.android.com/apk/res/android}versionName']

        self.text_version.setText(versionName)

        #提取versionCode

        versionCode = bodys[0].attrib['{http://schemas.android.com/apk/res/android}versionCode']

        self.text_codeversion.setText(versionCode)

        #提取package

        package = bodys[0].attrib['package']

        self.text_package.setText(package)

获取用户权限

    def permission(self, root):

        permission = root.findall("uses-permission")

        #在输出前清空

        permissions = []

        for i in range(len(permission)):

            #输出permission内容

            name = permission[i].attrib['{http://schemas.android.com/apk/res/android}name']

            permissions.append(name)

        self.text_permissions.setText('\n'.join(permissions))

获取ID与插件

    def mata(self, root):

        meta = root.getiterator("meta-data")

        plugins = []

        ids = []

        for i in range(len(meta)):

            #输出meta-data"

            if meta[i].attrib['{http://schemas.android.com/apk/res/android}name'] == 'plugin_'+str(i):

                value = meta[i].attrib['{http://schemas.android.com/apk/res/android}value']

                plugins.append(value)

            else:

                name = meta[i].attrib['{http://schemas.android.com/apk/res/android}name']

                value = meta[i].attrib['{http://schemas.android.com/apk/res/android}value']

                complete = '[ %s ] = [ %s ]'%(name, value)

                ids.append(str(complete))

        self.text_plugins.setText('\n'.join(plugins))

        self.text_ids.setText('\n'.join(ids))

本站文章为宝宝巴士 SD.Team原创，转载务必在明显处注明：（作者官方网站：宝宝巴士)

转载自【宝宝巴士SuperDo团队】 原文链接: http://www.cnblogs.com/superdo/p/4495665.html

[翔哥高手无敌之路]0-002.如何提取apk中的信息？的更多相关文章

python学习笔记——爬虫中提取网页中的信息
1 数据类型网页中的数据类型可分为结构化数据.半结构化数据.非结构化数据三种 1.1 结构化数据常见的是MySQL,表现为二维形式的数据 1.2 半结构化数据是结构化数据的一种形式,并不符合关系 ...
c++------------提取文件中的信息
对于文件比较复杂的时候,为了获取文件中的信息,需要一些比较特殊的函数,比如,getline().replace().atoi,atof等例子一,读取以下文件中的数据,并保存进一个类里面. 首先,类的 ...
python学习笔记——提取网页中的信息正则表达式re
被用来检索\替换那些符合某个模式(规则)的文本,对于文本过滤或规则匹配,最强大的就是正则表达式,是python爬虫里必不可少的神兵利器. 1 正则表达式re基本规则 [0-9] 任意一个数字,等价\d ...
MYSQL 提取时间中的信息的 4 方法
方法 1. year(),month(),day() 方法 2. dayofweek(),dayofmonth(),dayofyear(); 方法 3. hour(),minute(),second( ...
使用 python 提取照片中的手机信息
使用 python 提取照片中的手机信息最近在做一个项目,有一个很重要的点是需要获取使用用户的手机信息,这里我选择从照片中获取信息.有人会问为什么不从手机里面直接获取设备信息.由于现在android ...
[工具-004]如何从apk中提取AndroidManifest.xml并提取相应信息
跟上一篇类似,我们也需要对APK的一些诸如umengkey,ADkey,TalkingData进行验证,那么我们同样需要解压apk文件,然后提取其中的AndroidManifest.xml.然后解析x ...
Windows PE3.0制作方法(从Win7中提取制作）
Windows PE3.0制作方法(从Win7中提取制作在d:新建文件夹winpe,在winpe中新建sources.pe3和new文件夹,把附件中提供的工具imagex连文件夹一起放到winpe目 ...
C++ 提取字符串中的数字
C++ 提取字符串中的数字 #include <iostream> using namespace std; int main() { ] = "1ab2cd3ef45g&quo ...
python笔记之提取网页中的超链接
python笔记之提取网页中的超链接对于提取网页中的超链接,先把网页内容读取出来,然后用beautifulsoup来解析是比较方便的.但是我发现一个问题,如果直接提取a标签的href,就会包含jav ...

随机推荐

一只简单的网络爬虫（基于linux C/C++）————Url处理以及使用libevent进行DNS解析
Url处理爬虫里使用了两个数据结构来管理Url 下面的这个数据结构用来维护原始的Url,同时有一个原始Url的队列 //维护url原始字符串 typedef struct Surl { char * ...
2）接口规范原生django接口、单查群查 postman工具 CBV源码解析
内容了解 """ .接口:什么是接口.restful接口规范 .CBV生命周期源码 - 基于restful规范下的CBV接口 .请求组件.解析组件.响应组件 .序列化组件 ...
asyncio异步编程【含视频教程】
不知道你是否发现,身边聊异步的人越来越多了,比如:FastAPI.Tornado.Sanic.Django 3.aiohttp等. 听说异步如何如何牛逼?性能如何吊炸天....但他到底是咋回事呢? 本 ...
C. Four Segments 前缀后缀
C. Four Segments 这种分成了三个节点一般都可以处理一下前缀处理一下后缀,或者处理一下前面的这个点,处理一下后面的这个点,然后再枚举中间这个点. 如果和中间这个点有关的,那么就可以换一下 ...
LTE基站开局流程
1.全局参数配置 MOD ENODEB :修改基站 ADD CNOPERATOR: 添加运营商 ADD CNOPERATORTA:添加跟踪区(TA) 2.设备参数配置(机柜.机框.RRU.光纤链 ...
自动化测试po模式是什么?自动化测试po分层如何实现?-附详细源码
一.什么是PO模式全称:page object model 简称:POM/PO PO模式最核心的思想是分层,实现松耦合!实现脚本重复使用,实现脚本易维护性! 主要分三层: 1.基础层BaseP ...
[hdu5411 CRB and Puzzle]DP，矩阵快速幂
题意:给一个有向图,从任意点开始,最多走m步,求形成的图案总数. 思路:令dp[i][j]表示走j步最后到达i的方法数,则dp[i][j]=∑dp[k][j-1],其中k表示可以直接到达i的点,答案= ...
在ef core中使用postgres数据库的全文检索功能实战之中文支持
前言有关通用的postgres数据库全文检索在ef core中的使用方法,参见我的上一篇文章. 本文实践了zhparser中文插件进行全文检索. 准备工作安装插件,最方便的方法是直接使用安装好插件 ...
CSS理论：margin-left在float中的运用
源码如下: margin-left 指的是左边的外边距,为正数时,左边间距增大,div向右偏移,为负数时,左边间距减少,相反往左偏移双飞翼 .wrap { width: 100%; margin: ...
python--正则表达式|re模块学习
学习来源:https://www.liaoxuefeng.com/wiki/1016959663602400/1017639890281664 正则表达式是一种用来匹配字符串的一种强大的武器,用一种描 ...

[翔哥高手无敌之路]0-002.如何提取apk中的信息？

[翔哥高手无敌之路]0-002.如何提取apk中的信息？的更多相关文章

随机推荐

热门专题