一文了解如何使用移动应用安全组件Soot和Flowdroid
摘要:移动应用安全检测,soot、flowdroid分别作为静态分析、污点分析主要工具,能我们能够快速高效的进行检测分析、本文主要介绍两个工具的基本操作及相应的使用场景
本文分享自华为云社区《移动应用安全常用组件Soot、Flowdroid简介&基本使用》,作者:舞阳河畔程序猿 。
概述
Android作为一个开放的移动应用平台,无论是系统还是APK应用面临严峻的安全问题,针对应用安全面临的威胁,检测技术也在不断演进,但是基于静态分析的方式始终绕不过Soot跟FlowDroid,前者是一个java语言分析工具,同时也支持APK文件的分析,后者则是污点分析工具,通过生成Graph追踪污点传输路径。下面针对这两个进行介绍介绍,帮助读者能快速入门。
Soot
简介
soot是java优化框架,提供4种中间代码来分析和转换字节码。
- Baf:精简的字节码表示,操作简单
- Jimple:适用于优化的3-address中间表示
- Shimple:Jimple的SSA变体
- Grimple:适用于反编译和代码检查的Jimple汇总版本。
soot提供的输入格式有:java、android、class等
输出格式有:Java字节码、android字节码、Jimple、Jasmin、shimple、baf等,这些实际业务中常使用的,当然还有其它的格式,这里不再一一列举。
借助soot对android的分析能力,我们可以进一步分析安卓应用的安全漏洞,比如组件暴露、加密算法等存在的安全问题。
基本使用
可以GIT下载最新的soot jar包,我下载的是4.1.0版本中的sootclasses-trunk-jar-with-dependencies.jar 包,这个包应该自带了soot所需要的所有依赖。下载完成后使用powershell进入jar文件所在的文件夹,可以输入以下命令:
java -cp sootclasses-trunk-jar-with-dependencies.jar soot.Main查看soot相关的信息

首先我们来看soot怎么分析java代码(这里以class文件分析为例):
第一步,配置soot环境信息
StringBuffer cp = new StringBuffer();
cp.append(".");
cp.append(File.pathSeparator + apiPath);
cp.append(File.pathSeparator + "C:\\Program Files\\Java\\jre1.8.0_171\\lib\\rt.jar" + File.pathSeparator
+ "C:\\Program Files\\Java\\jre1.8.0_171\\lib\\jce.jar");
System.setProperty("soot.class.path", cp.toString());
第二步,设置soot的配置属性(各属性说明可以参考GIT上官方文档信息)
soot.options.Options.v().set_keep_line_number(true);
soot.options.Options.v().set_whole_program(true);
soot.options.Options.v().setPhaseOption("jb", "use-original-names:true");
soot.options.Options.v().setPhaseOption("cg", "verbose:false");
soot.options.Options.v().setPhaseOption("cg", "trim-clinit:true");
soot.options.Options.v().set_src_prec(Options.src_prec_class);
soot.options.Options.v().set_prepend_classpath(true);
soot.options.Options.v().setPhaseOption("wjop", "enabled:false");
第三步,拿到代码信息
for (String clzName : SourceLocator.v().getClassesUnder("class文件所在路径")) {
System.out.printf("api class: %s\n", clzName);
// 加载要处理的类设置为应用类,并加载到soot环境Scene中
Scene.v().loadClass(clzName, SootClass.BODIES).setApplicationClass();
}
for (SootClass clz : Scene.v().getApplicationClasses()) {
//遍历获取类、方法等需要的信息
}
现在,我们在看看soot怎么分析android apk
Options.v().set_src_prec(Options.src_prec_apk);
Options.v().set_output_format(Options.output_format_jimple);
Options.v().set_process_dir("待处理文件所在路径");
// 安卓JDK所在目录,只需要指定官方SDK包platforms-new目录下jar所在路径即可
Options.v().set_android_jars("jdk path");
Options.v().set_keep_line_number(true);
Options.v().set_allow_phantom_refs(true);
Options.v().set_process_multiple_dex(true);
Options.v().set_whole_program(true);
Scene.v().loadNecessaryClasses();
new CallGraphBuilder().build();
同样,我们可以得到apk的代码信息,包括class、method、attribute等,基于这些进行进一步分析并应用到实际检测业务中。
使用场景
使用Soot对Android应用进行静态分析,目前包括主要的检测场景:
- 检测应用中敏感字符串url和email、IP等
- 检测应用中风险代码片段
- 检测应用可能存在的漏洞,如组件暴露、过度申请权限、不安全加密算法等
FlowDroid
简介
FlowDroid是目前对Android app进行污点分析效果最好的工具之一。 污点分析的目的其实很简单,就是为了检查是否应用中是否存在从污点源到泄漏点的数据流。 但是它的优点在于它构建的数据流精度很高,可以对上下文,流,对象和字段敏感,从而使得分析结果非常精确。

它实现精准分析的原因有几点:
- 1. 它对Android声明周期进行了比较完整的构建,例如Activity中的OnCreate,OnResume等。通过抽象一个dummyMain作为分析的入口来支持Android应用的分析;
- 2. 它实现了精准的数据流分析,其中包含前向污点分析和后向别名分析。他们的实现其实都是基于heros的数据流分析框架来实现的。这里面的算法比较复杂,我的理解是这两种分析都是满足上下文敏感和流敏感的,后向分析的算法提供了对象敏感和字段敏感的支持;
- 3. 它支持简单的native code的污点分析
当然,它也存在一些不足之处,包括:
- 1. 不能对组件间(Intent)的污点传播进行分析
- 2. 隐式流问题
- 3. native code不能完美支持
尽管存在一些不足之处,在各大会议上也已经提出了数十种新的静态污点分析算法,相比FlowDroid在一些数据集或是DroidBench上有着更快的运行速度以及更优的精准度。但FlowDroid仍然是公共资源中可获取的静态污点分析工具的唯一选择,因为很多paper提供的源代码几乎没有注释与文档,导致使用极其困难;另外科研人员往往仅在有限的测试集上进行了运行,所以去使用这样的程序不可避免的会遇到Bug。相比之下,FlowDroid作为被持续维护的一款框架,其稳定性上具备了一定的保证,同时其底层的Soot框架强大的功能与较为完善的文档,使得FlowDroid上手难度相对较低。
基本使用
环境配置
FlowDroid的配置方法有两种,可以直接下载相关jar包,也可以使用maven配置依赖。jar包可以去FlowDroid的GitHub上进行下载,仅需soot-infoflow-android-classes.jar和soot-infoflow-classes.jar两个文件即可,另外去Soot的仓库 下载包含了heros与jasmin的sootclasses-trunk-jar-with-dependencies.jar,将上述三个包加入项目依赖便完成了FlowDroid的配置
运行
整个FlowDroid最顶层的类便是soot.jimple.infoflow.android.SetupApplication,大部分的设置与运行都可以通过操作这个类的实例进行。SetupApplication既可以在调用runInfoflow()时传入配置参数,也可以在初始化SetupApplication时或初始化后传入配置参数。SetupApplication的初始化函数以及runInfoflow函数有多种不同参数类型的实现,可以查阅源码后根据情况选择,这里仅提供我自己使用的一种方式:

关于Source、Sink
污点分析中的source点表示污点分析的起始点,而sink点表示污点分析的结束点。换言之,FlowDroid在“扫描”这个apk后,会从source点开始分析数据流,当数据流“流到”sink点时将其标注。FlowDroid中的source与sink均为类方法,在soot-infoflow-android下有提供一份SourcesAndSinks.txt的文件,是FlowDroid当时使用的一些可能涉及到访问隐私数据的api,从里面很容易看出声明文件的格式:

每一行作为独立的声明,%开头的表示注释,可以根据应用需求自行添加删减Source与Sink的声明。
使用场景
Flowdroid本身输出结果只是数据流信息,需要结合我们定制source、sink信息产生业务价值,一般有以下使用场景:
- 隐私数据泄露检测
- 污点传播类问题检测
- Android组件间数据传递风险检测
文末福利:华为云漏洞扫描服务VSS 基础版限时免费体验>>>
一文了解如何使用移动应用安全组件Soot和Flowdroid的更多相关文章
- 一文讲明白K8S各核心架构组件
目录 一.写在前面 二.K8S为我们提供了怎样的能力 三.架构 3.1.MasterNode 3.2.WorkerNode 四.核心组件 4.1.ApiServer 4.1.1.概述 4.1.2.是集 ...
- React文档(十七)非受控组件
大多数情况下,我们建议使用受控组件(也就是用React的state来控制表单元素的value值)来实现表单.在一个受控组件里,表单数据被React组件处理.另一种方案就是非控制组件,这样的话表单数据就 ...
- Prism 4 文档 ---第9章 松耦合组件之间通信
当构建一个大而负责的应用程序时,通用的做法时将功能拆分到离散的模块程序集中.将模块之间的静态引用最小化.这使得模块可以被独立的开发,测试,部署和升级,以及它迫使松散耦合的沟通. 当在模块之间通信时,你 ...
- 一文带你了解 Flink 的基本组件栈
作为实时计算领域的佼佼者,Flink 的基本组件同样值得我们仔细研究. Flink 同样遵循着分层的架构设计理念,在降低系统耦合的同时,也为上层用户构建 Flink 应用提供了丰富且友好的接口. Fl ...
- 基于MVC4+EasyUI的Web开发框架经验总结(8)--实现Office文档的预览
在博客园很多文章里面,曾经有一些介绍Office文档预览查看操作的,有些通过转为PDF进行查看,有些通过把它转换为Flash进行查看,但是过程都是曲线救国,真正能够简洁方便的实现Office文档的预览 ...
- [转载]基于MVC4+EasyUI的Web开发框架经验总结(8)--实现Office文档的预览
在博客园很多文章里面,曾经有一些介绍Office文档预览查看操作的,有些通过转为PDF进行查看,有些通过把它转换为Flash进行查看,但是过程都是曲线救国,真正能够简洁方便的实现Office文档的预览 ...
- php 如何写入、读取word,excel文档
如何在php写入.读取word文档 <? //如何在php写入.读取word文档 // 建立一个指向新COM组件的索引 $word = new COM("word.applicatio ...
- 使用Spire PDF for .NET将HTML转换成PDF文档
目录 开发环境说明 Spire PDF for .NET (free edition)体验 资源下载 开发环境说明 Microsoft Visual Studio 2013 Ultimate Edit ...
- C#, VB.NET如何加密PDF文档
在日常工作中,人们通常通过加密PDF文档的方式来保护PDF文档.不管是公司还是个人,使用PDF加密术来设置一些权限是必不可少的.为了使PDF文档既可读又不能被未授权的用户所更改,一份PDF文档往往需要 ...
- JRoll 2 使用文档(史上最强大的下拉刷新,滚动,无限加载插件)
概述 说明 JRoll,一款能滚起上万条数据,具有滑动加速.回弹.缩放.滚动条.滑动事件等功能,兼容CommonJS/AMD/CMD模块规范,开源,免费的轻量级html5滚动插件. JRoll第二版是 ...
随机推荐
- 如何将Python程序打包并保护源代码
导言: 在某些情况下,我们可能希望将Python程序打包成可执行文件,以便用户无法查看程序的源代码.这种需求通常出现在商业软件.数据分析工具或其他需要保护知识产权的场景中.本文将介绍如何使用PyIns ...
- Go 如何实现多态
在 Go 语言中,虽然没有经典的面向对象编程中的继承和多态的概念,但你可以通过接口(interface)来实现多态性.Go 语言鼓励组合和接口多态,这使得代码更加灵活和模块化.下面将详细介绍 Go 语 ...
- Kafka 在分布式系统中的 7 大应用场景
Kafka 介绍 Kafka 是一个开源的分布式流式平台,它可以处理大量的实时数据,并提供高吞吐量,低延迟,高可靠性和高可扩展性.Kafka 的核心组件包括生产者(Producer),消费者(Cons ...
- QLabel自己总结(常用接口)
继承关系:QLabel->QFrame->QWidget void setText(const QString &) [slots] 设置标签显示的内容,也可以使用构造函数设置. ...
- jenkins实践篇(2)—— 自动打tag的可回滚发布模式
大家好,我是蓝胖子,在上一篇我简单介绍了如何基于特定分支做自动编译和发布,在生产环境中,为了更加安全和快速回滚,我采取的是通过对代码打tag的方式来进行部署,下面我将详细介绍整个发布过程的逻辑. 发布 ...
- 关于区间DP的一点点心得(虽然还是很菜)
自己今天对于区间 DP 的一个总结 区间 DP 的数组一般是二维,其状态一般表示区间 \((l,r)\). 区间 DP 在思考的时候是有一定套路的,思考时可以按照如下方式进行思考: 这段区间要维护的信 ...
- 27. 干货系列从零用Rust编写正反向代理,Rust中日志库的应用基础准备
wmproxy wmproxy已用Rust实现http/https代理, socks5代理, 反向代理, 静态文件服务器,四层TCP/UDP转发,内网穿透,后续将实现websocket代理等,会将实现 ...
- 【uniapp】学习笔记day03 | 页面制作【外包杯】
一.开发层级结构介绍 page.json 对uniapp进行全局配置,决定页面文件的路径.窗口样式.原生的导航栏.底部的原生tabbbar manifest.json 应用的配置文件,指定应用的名称. ...
- 如何自学 PS、PR 等软件?
学习Photoshop(PS)和Premiere Pro(PR)等软件需要一定的时间和耐心,以下是非常详细的自学指南. 第一部分:规划学习路线 1. 确定学习目标 在自学PS和PR之前,首先要明确自己 ...
- [ABC282Ex] Min + Sum
Problem Statement You are given two sequences of integers of length $N$: $A = (A_1, A_2, \ldots, A_N ...