很多时候,写代码是一件很爽的事情,但最后需要对APP进行瘦身、性能分析却是一件很棘手的事情。当需要对APP的性能进行分析时,Simpleperf是一个简单快捷的选择。

正文开始前,先奉上官方的资料:

什么是Simpleperf

Simpleperf是NDK软件包中提供的一种多功能命令行工具,方便为Android应用流程执行CPU分析。该工具可帮助找到使用Java、C/C++和Kotlin编写的应用的热点(所谓热点,也就是占用应用大部分执行时间的部分原生代码)。

也就是说,Simpleperf是NDK自带的工具,官方认证的CPU分析工具。

Simpleperf是Android平台的一个本地层性能分析工具。它的命令行界面支持与linux-tools perf大致相同的选项,但是它还支持许多Android特有的改进。

Simpleperf的获取路径:Google Git Simpleperf

在页面内,可以直接压缩包下载,既可以选择NDK相对应的版本(R13~N21),也可以选择master。建议直接选择NDK对应的版本即可。当然,也可以git直接拉取仓库。

git clone https://android.googlesource.com/platform/prebuilts/simpleperf

查看下载的simpleperf目录,可以看出:它的工具集包涵client端和host端;client端运行在Android系统上,负责收集性能数据;host端则运行在开发机上,负责对数据进行分析和可视化(这些可执行文件在下载后的bin文件夹的android和win/linux下)。

除了bin文件夹之外,最上层还有很多.py的脚本文件和.config的配置文件。这些脚本和配置文件主要是官方写的一些傻瓜式的使用脚本,只需要对配置文件进行配置,就可以在直接在开发机上直接运行脚本,一键生成最终的结果。

主要的脚本是:app_profiler.pyreport.py两个。

脚本的主要内容,就是读取配置文件,然后执行adb shell ...的命令,其实本质上和命令行的输入没什么区别。但是,如果直接运行,不仅仅需要查看配置文件各个配置项的含义,还可能会出现许多意想不到的BUG,不太建议直接使用脚本,不得精髓啊。

Simpleperf的工作原理

现代的CPU具有一个硬件组件,称为性能监控单元(PMU)。PMU具有一些硬件计数器,计数一些诸如经历了多少次CPU周期,执行了多少条指令,或发生了多少次缓存未命中等的事件。Linux内核将这些硬件计数器包装到硬件perf事件(hardware perf events)中。此外,Linux内核还提供了独立于硬件的软件事件和跟踪点事件。Linux内核通过perf_event_open系统调用将这些都暴露给了用户空间。

Simpleperf具有三个主要的功能:stat、record和report

Stat命令给出了在一个时间段内被分析的进程中发生了多少事件的摘要。以下是它的工作原理:

  • 给定用户选项,simpleperf通过对linux内核进行系统调用来启用分析;
  • Linux 内核在调度到被分析进程时启用计数器;
  • 分析之后,simpleperf从内核读取计数器,并报告计数器摘要。

Record命令在一段时间内记录剖析进程的样本。它的工作原理如下:

  • 给定用户选项,simpleperf通过对linux内核进行系统调用来启用分析;
  • Simpleperf在simpleperf和linux内核之间创建映射缓冲区;
  • Linux内核在调度到被分析进程时启用计数器;
  • 每次给定数量的事件发生时,linux内核将样本转储到映射缓冲区;
  • Simpleperf从映射缓冲区读取样本并生成perf.data

Report命令读取perf.data文件及所有被剖析进程用到的共享库,并输出一份报告,展示时间消耗在了哪里

Simpleperf的使用

尽管不推荐使用一键脚本,但得益于Simpleperf的命令不多,使用起来也很简单快捷。

文件准备

将simpleperf可执行文件传输到Android设备上:

adb push 文件源地址 文件目的地址

可执行文件都存储在bin/android/目录下,可自行获取。

性能分析

在性能分析前,首先启动需要分析的APP,获取APP的进程号:

adb shell am start -n 包名/启动程序
adb shell pidof 包名

接下来,就可以使用命令三连击了:

adb shell
cd simpleperf所在目录
./simpleperf stat [options] [command [command-args]]
./simpleperf record [options] [command [command-args]]
./simpleperf report [options]

stat命令获取一段时间内已分析进程中发生的事件数摘要。 最常使用的选项为:

./simpleperf stat -p 进程号 --duration 检测进程的持续时间(秒)

record命令记录一段时间内已分析进程的样本,这是simpleperf的主命令。最常使用的选项为:

./simpleperf record -p 进程号 -o 输出文件(默认perf.data) --duration 监测进程的持续时间(秒)

需要注意的是,如果出现Access to kernel symbol addresses is restricted的警告,需要使用一下命令来取消:

echo 0>/proc/sys/kernel/kptr_restrict

report命令读取perf.data文件(由simpleperf record创建),并显示报告,表明花费时间的地方。最常使用的选项为:

./simpleperf report --dsos 选定动态共享对象(so库)  -f 记录文件(默认perf.data) --sort 用于排序和打印报告的键 -n

注意点:如果使用report命令进行查找的时候,发现so现实的Symbol都是地址,而不是函数内容。这多数是因为在安卓编译的时候,设备上使用的so库已经被strip过,也就是说,已经抛离了.symbol段的内容。

那么,我们需要将带有Symbol信息的so下载到设备上。同时需要将so放置到perf.data中记录的相同的路径(否则,simpleperf无法找到它)。

如果找不到路径,可以在perf.data文件中直接搜索需要选定的so库的名称,即可查看到路径。

示例流程

  1. 启动应用并进行分析

    adb shell simpleperf app_profiler -p com.example.myapp --duration 30 -o /sdcard/perf.data

    adb shell simpleperf record -p 21226 -g --duration 10 -o perf.data

  2. 提取分析数据

    adb pull /sdcard/perf.data .

  3. 生成报告

    simpleperf report -i perf.data

  4. 生成图形化报告(可选):

    simpleperf report-html -i perf.data -o perf_report.html

通过以上步骤和命令,你可以使用 Simpleperf 有效地分析 Android 应用的 CPU 性能,并找到潜在的性能瓶颈。

python ./simpleperf/report_sample.py > out.perf
./FlameGraph/stackcollapse-perf.pl out.perf > out.folded
./FlameGraph/flamegraph.pl out.folded > out.svg
  1. 生成火焰图

    谷歌官网下载Android NDK: https://developer.android.google.cn/ndk/downloads/

    进入到android-ndk-r25b-linux/android-ndk-r25b/simpleperf

    将上述生产的perf.data文件拉取出来放到这个同级目录下

    adb pull /sdcard/perf.data

    直接运行

    python report_html.py -i ./perf.data -o ./perf.html

    python ./simpleperf/report_sample.py > out.perf

    ./FlameGraph/stackcollapse-perf.pl out.perf > out.folded

    ./FlameGraph/flamegraph.pl out.folded > out.svg

【Simpleperf】Android的CPU分析,性能优化利器的更多相关文章

  1. Android比较实用的性能优化

    Android设备作为一种移动设备,无论是内存还是CPU的性能都受到了很大的限制,这导致Android程序的性能问题异常突出,随着产品的不断更新迭代,对于性能优化提出了更高的要求.本篇文章从稳定性.流 ...

  2. 在 Android开发中,性能优化策略十分重要

    在 Android开发中,性能优化策略十分重要本文主要讲解性能优化中的布局优化,希望你们会喜欢.目录 示意图 1. 影响的性能 布局性能的好坏 主要影响 :Android应用中的页面显示速度 2. 如 ...

  3. Android开发系列之性能优化

    一直想整理一篇关于Android性能优化的博客,正好今天借鉴一些书籍资料,总结一下自己对于这块的一些认识.相信大家都听说过16ms的原则,即每两个画面之间的绘制时间间隔不能超过16ms,否则人眼能够感 ...

  4. 【转】PHP中被忽略的性能优化利器:生成器.md

      PHP  如果是做Python或者其他语言的小伙伴,对于生成器应该不陌生.但很多PHP开发者或许都不知道生成器这个功能,可能是因为生成器是PHP 5.5.0才引入的功能,也可以是生成器作用不是很明 ...

  5. 【mysql】MySQL知识整理-死锁分析-性能优化等

    [[TOC]] 常用操作指令 show databases:显示所有的数据库: use dbName: 使用指定数据库 show tables: 显示所有的数据表: desc tableName: 查 ...

  6. 开源|性能优化利器:数据库审核平台Themis的选型与实践

    作者:韩锋 出处:DBAplus社群分享:来源:宜信技术学院 Themis开源地址:https://github.com/CreditEaseDBA 一.面临的挑战 1.运维规模及种类 我相信,这也是 ...

  7. js 性能优化利器:prepack

    1. js 性能优化 js 本身是没有像 python 一样的预编译功能,更没有像 java 一样的编译功能,所以,这里所说的 js 代码预编译 只是通过工具实现的类似功能而已. 这就要提到 prep ...

  8. Android学习笔记之性能优化SparseArray

    PS:终于考完试了.来一发.微机原理充满了危机.不过好在数据库89分,还是非常欣慰的. 学习内容: 1.Android中SparseArray的使用..   昨天研究完横向二级菜单,发现其中使用了Sp ...

  9. PHP系列 | [转] PHP中被忽略的性能优化利器:生成器

    官方:https://www.php.net/manual/zh/language.generators.overview.php 原文:https://segmentfault.com/a/1190 ...

  10. PHP中被忽略的性能优化利器:生成器

    如果是做Python或者其他语言的小伙伴,对于生成器应该不陌生.但很多PHP开发者或许都不知道生成器这个功能,可能是因为生成器是PHP 5.5.0才引入的功能,也可以是生成器作用不是很明显.但是,生成 ...

随机推荐

  1. Maven入门(idea)

    1.Maven是什么? Maven是一个跨平台的项目管理工具(对jar包进行统一管理). 1.1. Maven主要内容如下: 项目对象模型 项目生命周期 依赖管理系统 1.2. 使用Maven的好处: ...

  2. 【Git】上传代码到码云

    教程来自于这个上面: https://www.jianshu.com/p/3e0b213ab03d 第一步:创建码云仓库 具体怎么点选这里不再演示了 第二步:创建本地文件夹 [这个目录用来做本地仓库, ...

  3. Google的TPU的向量化内存的读取规格——单次读取/写入的数据量

    异构加速设备: GPU.TPU.NPU 这几种设备,除了GPU公开了部分硬件设计原理和软件编程范式以外,所有的TPU和NPU的资料都是不公开的,都是被其所属公司保留的,然后这些公司会自己在这些硬件之上 ...

  4. 深度学习需要float64精度吗 —— 为什么各大深度学习框架均不支持float64的深度学习运算呢 —— 商用NVIDIA显卡的float64性能是否多余呢

    首先要知道这么几个事实,也是交代一下本文要讨论的问题的背景: 各大深度学习框架均支持float64类型的简单运算,但是均不支持float64的深度学习的运算操作: 作为深度学习运行的加速设备,各种GP ...

  5. 强化学习入门书籍《DeepReinforcementLearningHands-On-SecondEdition》

    前段时间在网上买了本强化学习入门的书籍,即<Deep-Reinforcement-Learning-Hands-On>,虽然是影印版的,但是感觉还是可以看看的,说的也蛮易懂的,感觉比现在市 ...

  6. 解密prompt系列35. 标准化Prompt进行时! DSPy论文串烧和代码示例

    一晃24年已经过了一半,我们来重新看下大模型应用中最脆弱的一环Prompt Engineering有了哪些新的解决方案.这一章我们先看看大火的DSPy框架,会先梳理DSPy相关的几篇核心论文了解下框架 ...

  7. 3.2.0 终极预告!云原生支持新增 Spark on k8S 支持

    视频贡献者 | 王维饶 视频制作者 | 聂同学 编辑整理 | Debra Chen Apache DolphinScheduler 3.2.0 版本将发布,为了让大家提前了解到此版本更新的主要内容,我 ...

  8. 简化数据流:Apache SeaTunnel实现多表同步的高效指南

    Apache SeaTunnel除了单表之间的数据同步之外,也支持单表同步到多表,多表同步到单表,以及多表同步到多表,下面简单举例说明如何实现这些功能. 单表 to 单表 一个source,一个sin ...

  9. 三台服务器上离线安装redis哨兵集群,一主二从三哨兵

    三台服务器上离线安装redis哨兵集群,一主二从三哨兵 系统安装好gcc环境,(不然编译redis会报错).依旧不知道怎么离线安装gcc环境的可查看CentOS下离线安装gcc环境,图文详细 下载 点 ...

  10. 10. 从0学ARM-基于Exynos4412的pwm详解

    一.什么是PWM PWM,英文名Pulse Width Modulation,是脉冲宽度调制缩写,它是通过对一系列脉冲的宽度进行调制,等效出所需要的波形(包含形状以及幅值),对模拟信号电平进行数字编码 ...