QNX 性能分析工具
QNX 性能分析工具
小结
- hogs:列出最占用 CPU/RAM 的进程,可以统计内存占用详细情况【可单个进程】
- pidin:显示进程信息、系统信息、库信息...【可单个进程】
- ps:显示进程信息【可单个进程】
- top:多核平均占用,不能针对单个进程?
- ttop:和 top 类似,显示更多线程,单核占用率
- tracelogger:记录内核事件,保存到 kev 文件,可以用 QNX Momentics 分析各个线程的活动情况
- Momentics Profiler/Valgrind
hogs
列出占用 CPU 的进程
参数
-m [e][t][p][s] 统计 ELF/STACK/SHARED/PRIVATE(默认) 内存映射,例如可以用 `-msp` 参数统计 shared 和 private 映射之和
-S [c|m|p] 按照 CPU(默认)、内存、PID 排序
-% <num> [c|m] 只显示 CPU(默认)或内存占用超过 num% 的进程
---TLDR---
-i <iter> 打印 iter 次
-s <sec> 刷新间隔,默认 3
例子
# 显示进程 39379114 及各个核的占用情况,每 1s 刷新一次
hogs -s 1 39379114
# 统计 shared 和 private 内存映射,并按内存占用排序
hogs -msp -Sm
# 显示 CPU 占用超过 10% 的进程
hogs -% 10c
输出列
MSEC: 自上次结果以来,该进程运行的 ms 数
PIDS: 本次迭代中,进程运行时间的占所有其他进程运行时间的百分比
SYS: 本次迭代中,进程运行时间的占迭代时间的百分比
MEMORY: 进程内存用量,取决于 -m 参数
PID NAME MSEC PIDS SYS MEMORY
39379107 MyProcess1 554 1% 18% 17288k 0%
39358626 MyProcess2 779 2% 25% 7808k 0%
39379114 MyProcess3 788 2% 26% 15960k 0%
0 [idle] 2409 6% 80% 0k 0%
1 [idle] 2976 8% 99% 0k 0%
2 [idle] 2942 8% 98% 0k 0%
3 [idle] 3003 8% 100% 0k 0%
4 [idle] 2993 8% 99% 0k 0%
5 [idle] 3007 8% 100% 0k 0%
6 [idle] 3021 8% 100% 0k 0%
7 [idle] 3013 8% 100% 0k 0%
8 [idle] 1795 4% 59% 0k 0%
9 [idle] 974 2% 32% 0k 0%
10 [idle] 1043 2% 34% 0k 0%
11 [idle] 3023 8% 100% 0k 0%
pidin
显示进程信息,功能非常强大
参数
-F "%a %b %N %p %J %B"
-fabNpJB 和 -F 类似,简化版
-p prio 以 prio 优先级运行
-P <pid> pid 可以是进程名或 PID
例子
# 显示 MyProcess 进程的 pid、tid、线程名及完整路径
pidin -fabhn -P MyProcess
# 显示系统信息(CPU、内存、进程、线程)
pidin info
# 显示 MyProcess 进程库信息
pidin -P MyProcess libs
ps
无参数:默认列:PID TTY TIME CMD
-a 打印和当前终端关联的进程信息
-A or -e 打印所有进程信息
-f 完整列,增加 UID PPID C STIME
-l 更详细的列
UID PID PPID C STIME TTY TIME CMD
用户 ID 进程 ID 父进程 ID 启动时间 ??累积 CPU 时间 完整命令
ps 不显示僵尸进程,如果要查看僵尸进程,可以用 pidin
top
参数
-t 显示线程名
-z <num> 显示资源消耗最高的 num 个线程
--- TLDR ---
-b batch mode,用于后台,不响应“交互”按键,但是可以响应 Ctrl+C
-d 不刷新屏幕,而是持续输出?
-i <number> 刷新 number 次后自动结束
-n <node> 在远程 node 上运行 top
-p <priority> 以指定优先级运行
例子
# 显示线程名、显示资源消耗最高的 40 个线程
top -tz 40 | grep MyProcess
交互
可以进入 top 界面之后,按键交互。如果 top 带了 -b 参数则无法响应以下按键
? 或 h 显示帮助
d 屏幕刷新间隔,默认 5s
l 立即刷新
k 杀进程
n 显示的线程数,5~40,默认 10
q 退出 top
ttop
Thread Monitor
参数
-p 采样周期,单位 us,默认 1s(1000000)
-r 刷新时间,单位 s,默认 3s
-d 运行总时长,单位 s,默认 10s
-l 在实时输出中,显示多少个线程,默认 20
例子
尽可能多地显示进程 36434092 的所有线程信息
./ttop -l 200 | grep 36434092
注:ttop 显示的 CPU 占用率是相对一个核的,而 top 显示的 CPU 占用是平摊到所有核的
tracelogger
从 instrumented 内核接收事件,保存到文件(默认 /dev/shmem/tracebuffer.kev,kev:kernel events)。然后可以在 Momentics 中分析。
在 Momentics 的 QNX System Profile 的 Perspective,Timeline 面板可以看到各个线程活动情况(nanosleep/running/condvar/receive...)
注:必须以 root 运行,必须是 instrumented 版本的 procnto(如 procnto*-instr),QNX Neutrino 7.0 之后只提供 instrumented
Reference
https://www.qnx.com/developers/docs/7.1/#com.qnx.doc.ide.userguide/topic/analyze_performance.html
https://www.qnx.com/developers/docs/7.1/#com.qnx.doc.ide.userguide/topic/appprofiler_purpose.html
https://www.qnx.com/developers/docs/7.1/#com.qnx.doc.ide.userguide/topic/appprofiler_tool.html
https://www.qnx.com/developers/docs/7.0.0/index.html#com.qnx.doc.neutrino.user_guide/topic/fine_tuning.html
Momentics + Application Profiler/Valgrind-cachegrind
可以
- 监控性能
- Profile 程序:可以分析函数调用情况及各个函数花费时间
- 调查性能瓶颈:测量应用的缓存不命中、堆内存使用、如何和其他进程交互
可以导出性能分析数据。
profile 应用
需要从 IDE 启动,也可以 attach。
采样、函数调用计数
相比测量函数 runtimes 开销更小,但不准确:两次采样间隔中间函数可能执行了很多次。也不能用于 timer-synchronized programs。
- 必须统计足够长的时间才能更准确
- 必须在编译和链接时,加上 -p 参数
从 IDE 启动
会自动以固定周期报告执行位置
从命令行离线 Profile
增加编译选项,拷到板子,设置 PROFDIR 环境变量,运行 binary。
注意:app 必须正常退出才能得到 gmon.out 文件。可以在收到信号时,调 exit()
限制:
- 看不到各个线程!
- 动态库结果没有!
- 必需以 root 运行,否则没有 sampling info
测量函数运行时间
进入、退出函数时,报告时间戳。相比采样执行位置,开销更大。用于多线程可能会改变时序、行为。
- 编译选项:
-finstrument-functions - 链接选项:
-lprofilingS
有些情况只能离线 profile,导出文件、导入 IDE
- host 和 target 不在一个网络
- target 上没有 qconn 服务
性能瓶颈分析
之前的profile结果告诉你那个函数时间长,接下来需要进一步分析为什么函数慢
常见的导致性能问题的原因:
- 大量的堆使用。分配、释放堆空间,可以看 heap usage
- 受其他进程影响:可以查看内核 event trace,看是否有饥饿、优先级反转等问题
- 缓存不命中:Valgrind Cachegrind
Momentics + Valgrind
可以分析
- Memcheck:内存泄漏
- Massif:堆内存使用
- Helgrind:线程同步问题
- Cachegrind:缓存使用
Reference
https://www.qnx.com/developers/docs/7.1/#com.qnx.doc.ide.userguide/topic/analyze_performance.html
QNX 性能分析工具的更多相关文章
- Java 性能分析工具 , 第 3 部分: Java Mission Control
引言 本文为 Java 性能分析工具系列文章第三篇,这里将介绍如何使用 Java 任务控制器 Java Mission Control 深入分析 Java 应用程序的性能,为程序开发人员在使用 Jav ...
- Java 性能分析工具 , 第 2 部分:Java 内置监控工具
引言 本文为 Java 性能分析工具系列文章第二篇,第一篇:操作系统工具.在本文中将介绍如何使用 Java 内置监控工具更加深入的了解 Java 应用程序和 JVM 本身.在 JDK 中有许多内置的工 ...
- Java 性能分析工具 , 第 1 部分: 操作系统工具
引言 性能分析的前提是将应用程序内部的运行状况以及应用运行环境的状况以一种可视化的方式更加直接的展现出来,如何来达到这种可视化的展示呢?我们需要配合使用操作系统中集成的程序监控工具和 Java 中内置 ...
- 系统级性能分析工具perf的介绍与使用
测试环境:Ubuntu16.04(在VMWare虚拟机使用perf top存在无法显示问题) Kernel:3.13.0-32 系统级性能优化通常包括两个阶段:性能剖析(performance pro ...
- 性能分析工具-PerfView
Roslyn的PM(程序经理) Bill Chiles,Roslyn使用纯托管代码开发,但性能超过之前使用C++编写的原生实现,这有什么秘诀呢?他最近写了一篇文章叫做<Essential Per ...
- 11个Visual Studio代码性能分析工具
软件开发中的性能优化对程序员来说是一个非常重要的问题.一个小问题可能成为一个大的系统的瓶颈.但是对于程序员来说,通过自身去优化代码是十分困难的.幸运的是,有一些非常棒的工具可以帮助程序员进行代码分析和 ...
- Linux性能分析工具的安装和使用
转自:http://blog.chinaunix.net/uid-26488891-id-3118279.html Normal 0 7.8 磅 0 2 false false false EN-US ...
- php性能分析工具 - xhprof的安装使用
一.前言 有用的东西还是记录下来吧,也方便以后的查询:这次记录一下xhprof的安装使用: xhprof是facebook开源出来的一个php轻量级的性能分析工具,跟Xdebug类似,但性能开销更低, ...
- OProfile 性能分析工具
OProfile 性能分析工具 官方网站:http://oprofile.sourceforge.net/news/ oprofile.ko模块本文主要介绍Oprofile工具,适用系统的CPU性能分 ...
- linux命令(4):top 命令(性能分析工具)
linux 的top命令详解 简介 top命令是Linux下常用的性能分析工具,能够实时显示系统中各个进程的资源占用状况,类似于Windows的任务管理器. top显示系统当前的进程和其他状况,是一个 ...
随机推荐
- interface 接口相关【GO 基础】
〇.接口简介 接口(interface)定义了一个对象的行为规范,只定义规范不实现,由具体的对象来实现规范的细节.也就是说,接口可以将一种或多种特征归纳到一起,其他不同的对象通过实现此接口,来表示可以 ...
- Dotnet工具箱:开源、免费的纯前端工具网站,带你探索10大工具分类和73个实时在线小工具
1. 前言 大家好,我是沙漠尽头的狼. Dotnet工具箱是一个纯前端的.开源和免费的工具网站,周末我参考了开源项目it-tools,对网站界面文字进行了汉化,并重新部署了网站.该网站共有10大工具分 ...
- UVA10702 Travelling Salesman 题解
UVA10702 Travelling Salesman 题解 题面: 有个旅行的商人,他每到一个的新城市,便卖掉所有东西再购买新东西,从而获得利润.从某城市 A 到某城市 B 有固定利润(B 到 ...
- 14.10 Socket 套接字选择通信
对于网络通信中的服务端来说,显然不可能是一对一的,我们所希望的是服务端启用一份则可以选择性的与特定一个客户端通信,而当不需要与客户端通信时,则只需要将该套接字挂到链表中存储并等待后续操作,套接字服务端 ...
- UVA1104 Chips Challenge(费用流)
神仙费用流题,理解了一下午,故写此篇题解以作纪念. 题意 有一个 \(N\times N\) 的棋盘,有些格子不能放棋子,有些格子必须放棋子,剩下的格子随意.要求放好棋子之后满足: 第 \(i\) 行 ...
- 【问题复盘】在Ubuntu 20.04下安装OFED驱动
复盘:在Ubuntu 20.04下安装OFED驱动 起因 最近收到两台服务器,都搭载了ConnectX-5 EX网卡.由于供应商预装了Ubuntu 20.04操作系统,而我们的后端代码也是基于Ubun ...
- c#桥接模式详解
基础介绍: 将抽象部分与它的实现部分分离,使它们都可以独立地变化.适用于不希望在抽象和实现部分之间有固定的绑定关系的情况,或者类的抽象以及它的实现都应该可以通过生成子类的方法加以扩充的情况. ...
- UML学习入门就这一篇文章(转)
1.1 UML基础知识扫盲 UML这三个字母的全称是Unified Modeling Language,直接翻译就是统一建模语言,简单地说就是一种有特殊用途的语言. 你可能会问:这明明是一种图形,为什 ...
- atest
#include<iostream> using namespace std; int main() { reutrn 0; }
- SyntaxError: Non-ASCII character 与 Cannot decode using encoding "ascii" 错误解决
转载请注明出处: python调试时遇到的两个相同的编码错误进行总结: 1.错误:Cannot decode using encoding "ascii", unexpected ...