gprof

函数级耗时剖析。gprof不会说谎，仔细考虑下函数的实现细节。

准备工作

对单文件simulator.cpp编译
- 编译：g++ -g -pg simulator.cpp -o simulator.o
- 链接：g++ -pg simulator.o -o simulator

对于使用CMakeLists.txt的工程

add_definitions(-g -pg)

set_target_properties(simulator PROPERTIES LINK_FLAGS "-pg") # 必须用""把-pg引起来

#只对执行文件有效，对库文件使用无效

#如果想对自己的库文件做相应的剖析，把所有源文件都放在add_executable中

我们可以使用-O2对编译文件优化,但是一定要加-g -pg。在我的测试中，效果很好。大家务必试试。

生成剖析文件

执行程序，会在当前文件目录下生成gmon.out剖析文件

./simulator #除非程序处理了中断，保证收到中断能正常退出时，才会生成gmon.out文件
导出可读的性能文件

gprof simulator gmon.out > perf.log

解读剖析文件

主要关注两部分：Flat profile与Call graph

Flat profile

simulator flag profile

Each sample counts as 0.01 seconds.

% cumulative self self total

time seconds seconds calls s/call s/call name

25.37      3.81     3.81 71089134     0.00     0.00  shared_buffer::BufferInterface::WriteBuffer(BufferDescriptor const&)

8.92      5.15     1.34 71089350     0.00     0.00  shared_buffer::BufferInterface::CopyBuffer(BufferDescriptor const&, SharedBuffer*)

7.99 6.35 1.20 71089350 0.00 0.00 shared_buffer::SharedBuffer::AllocCell(int)

5.16 7.13 0.78 71089062 0.00 0.00 GenerateTime(timeval&)

拿第5行来说

% time：该函数占总运行时间的8.92%
cumulative seconds：累积前面的函数调用，总时间为5.15秒
self seconds：自身使用1.34秒
calls：该函数被调用71089350次
self ms/call：(单位可能是s/ms/ns依据调用情况来决定)未知，可能是平均调用时间，求解
total ms/call：(单位可能是s/ms/ns依据调用情况来决定)未知，求解
name：那么的直观

当我们拿到这样的结果时，我们首先应该关注下排名靠前的函数（为什么这么耗时），其次关注调用次数最多的函数（为什么会调用这么多次），还有就是关注你目前想了解的函数是否符合预期（调用次数与时间）

Call graph

simulator's call graph

index % time self children called name

<spontaneous>

[1] 98.9 0.00 14.86 main [1]

0.26 14.47 1/1 RunLoader(shared_buffer::BufferInterface&) [2]

0.00    0.11       1/1           shared_buffer::BufferInterface::BufferInterface(std::string const&) [24]

0.00 0.02 1/1 shared_buffer::BufferInterface::~BufferInterface() [31]

-----------------------------------------------

0.26 14.47 1/1 main [1]

[2] 98.0 0.26 14.47 1 RunLoader(BufferInterface&) [2]

0.57 12.92 71089062/71089062 SendBuffer2(BufferInterface&, DataType, unsigned int, OMTime const&) [3]

0.78 0.00 71089062/71089062 GenerateTime(timeval&) [10]

0.17 0.00 71089134/71089134 omatrix::OMTime::OMTime(timeval const&) [22]

0.03 0.00 71089134/71089145 omatrix::OMTime::~OMTime() [28]

0.01    0.00      72/72          SendBuffer(BufferInterface&, DataType, unsigned int, OMTime const&) [36]

0.00 0.00 4/4 rdtsc() [137]

-----------------------------------------------

0.57 12.92 71089062/71089062 RunLoader(shared_buffer::BufferInterface&) [2]

[3]     89.8    0.57   12.92 71089062         SendBuffer2(BufferInterface&, DataType, unsigned int, OMTime const&) [3]

3.81 9.11 71089062/71089134 shared_buffer::BufferInterface::WriteBuffer(BufferDescriptor const&) [4]

-----------------------------------------------

拿index为2的来说

index：目前关注的重点函数编号，我们可以每行的未端看到同样形式的编号
time：该函数及其子函数的总耗时百分比为98.0%
self：该函数自身耗时0.26秒，该值等于前面的Flat profile部分的self seconds。同时该值也等于此部分中调用该函数的self的和。
children：该函数调用的子函数耗时14.47，同时大家可以算算，其子函数的self+children总和等于该值。同时该值也等于此部分中调用该函数的children的和。
called：如果是当前函数，该值没有/分割，表明它被调用的次数；如果是父/子函数，前半部分表示涉及该调用栈的次数，后半部分表示该函数总的被调用次数
name：还是那么的直观

通过该部分我们可以非常直观的观察调用关系，看是否有函数的调用是自己未预期的。

gprof的更多相关文章

C和指针第十八章性能评测工具gprof
linux平台下的gprof评测工具可以对程序进行分析,需要在编译时加上-pg选项,如上一章的二叉树代码: gcc -pg main.c ArrayBinaryTree.h ArrayBinaryTr ...
linux 代码分析工具 gprof - 以wpa_supplicant为例
当我们遇到一个新的程序的时候,经常会无从下手,需要debug一个功能的时候,我们不知道函数的运行流程是怎么样的,这就需要借助工具来帮助我们加快流程了.这里以分析wpa_supplicant为例 ...
gprof参数说明及常见错误
参数说明 l -b 不再输出统计图表中每个字段的详细描述. l -p 只输出函数的调用图(Call graph的那部分信息). l -q 只输出函数的时间消耗列表. l -e Name 不再输出函数N ...
高级工具gprof、gprof2dot.py、dot
可以研究程序性能.函数调用堆栈等,而且能用图标查看. linux环境下 C++性能测试工具 gprof + kprof + gprof2dot - 阁子 - 博客园 gprof.gprof2dot.p ...
gprof使用介绍
gprof 1.1 简介 gprof实际上只是一个用于读取profile结果文件的工具.gprof采用混合方法来收集程序的统计信息,他使用检测方法,在编译过程中在函数入口处插入计数器用于收集 ...
gprof + kprof + gprof2dot (性能与函数调用图）-
http://www.cnblogs.com/rocketfan/archive/2009/11/15/1603465.html http://blog.csdn.net/stanjiang2010/ ...
Linux下的经常使用性能查询命令top、vmstat、gprof、pidstat之对照
(1)查看各个CPU核的使用情况 sudo top -d 1 进入之后,按1,会出现以下的CPU使用情况,当中us列反映了各个CPU核的使用情况,百分比大说明该核在进行紧张的任务. (2)查看哪个进程 ...
服务器性能分析工具gprof的使用及没有生成gmon.out文件的原因
早上从网上查看资料时无意中看到了gprof这个工具,随便把他用在项目里试了一下.结果发现调用次数的数据比较全,但调用时间基本上都是0.网上查了一下发现gprof只记录执行时间超过0.0 ...
Linux C++程序进行性能分析工具gprof使用入门
性能分析工具软件的性能是软件质量的重要考察点,不论是在线服务程序还是离线程序,甚至是终端应用,性能都是用户体验的关键.这里说的性能重大的范畴来讲包括了性能和稳定性两个方面,我们在做软件测试的时候也是 ...

随机推荐

python代码查询港澳通行证办理进度
查询港澳通行证办理进度查询的python 3.3代码.利用socket请求相关网站,获得结果后利用正则找出办理进度.其实用urllib代码会更简洁,不过当时在下还不熟悉urllib~ 直接上代码: i ...
Linux下校验下载文件的完整性(MD5,SHA1,PGP)
查看: Linux下校验下载文件的完整性(MD5,SHA1,PGP) http://blog.useasp.net/archive/2014/03/29/use-md5-sha1-or-pgp-to- ...
JavaScript随机数
function random(start,end){ var total=start+end; return Manth.floor(Manth.random()+total-start); }
WPF 之 WPF应用程序事件
当新建一个wpf应用程序,会自动生成一个App.xaml和MainWindow.xaml文件. 其中 App.xam 用来设置Application,应用程序的起始文件和资源及应用程序的一些属性和事件 ...
UML 之各种视图简介
统一建模语言(Unified Modeling Language,UML)中各种视图并没有明显的概念区别. 在最上一层,视图被划分为三个视图域:结构,动态行为,模型管理. 结构主要描述了系统中的结构成 ...
【源码】基于SQLite实现CMS论坛(BBS)----附件SQLite可视化界面客户端
使用说明:管理员账号:admin 密码:523523523 一. 账号管理(登陆注册审核) 1.账号注册 url:/BBS/Account/pregister.aspx 2 ...
Android 高级UI设计笔记22：Android 指示引导页（带圆点）
1. 引导页: 我们在安装某个软件首次运行时,大部分都会有一个引导页的提示,介绍软件新功能的加入或者使用说明等,支持滑动且下面会有几个圆点,显示共有多少页和当前图片的位置,类似如下效果: 2. 引导页 ...
阿里云ECS（linux）磁盘满触发的mysql的表异常修复案例
阿里云ECS(linux)磁盘满触发的mysql的表异常修复案例阿里云技术支持:完颜镇江问题现象: 磁盘空间满了,第一想到的就是删除无用的服务日志或者升级数据盘. 通常是使用du –sh去分析目录 ...
【Linux/Ubuntu学习1】Linux /etc 目录详解
/etc目录包含很多文件.许多网络配置文件也在/etc 中. /etc/rc or/etc/rc.d or/etc/rc*.d 启动.或改变运行级时运行的scripts或scripts的 ...
【python调用windows CLI】调用adb统计Android app的流量消耗
主要记录python如何调用windows CLI 手机连接PC,adb devices可以看到手机sn 通过adb 获取指定app的processID UID 读取Android /proc/ne ...

gprof

准备工作

生成剖析文件

解读剖析文件

Flat profile

Call graph

gprof的更多相关文章

随机推荐

热门专题