Callgrind 使用 2
Callgrind是一款和gprof类似的性能分析工具,与gprof不同的是它不需要在编译源码时附加特殊选项,但推荐加上调试选项。Callgrind使用cachegrind的统计信息Ir(I cache reads,即一条指令执行的次数)来统计程序中函数的调用情况,建立函数调用关系图,还可以有选择地进行cache模拟。在运行结束时,它会把分析数据写入一个文件,callgrind_annotate可以把这个文件的内容转化成可读的形式。
一、基本语法
Callgrind语法格式如下:
valgrind --tool=callgrind [callgrind options] your-program [program options]
可以如下来使用valgrind启动后台服务进程:
#valgrind --tool=callgrind --separate-threads=yes ./haproxy -f haproxy.cfg
其中,--tool=callgrind表示使用valgrind提供的性能分析功能,--separate-threads=yes表示要查看多线程相关数据。
在程序运行过程中可以用callgrind_control将性能数据dump到指定目录下(可以使用callgrind_control -h查看帮助信息),比如:
#callgrind_control -d -w /usr/local/haproxy
上面命令会将所有线程的性能数据dump到目录/usr/local/haproxy下生成的callgrind.out.pid文件中。
我们可以使用callgrind_annotate [options] callgrind.out.pid查看性能数据,其中,options选项参数详细信息如下:
(1)--inclusive=yes:不但分别统计每个语句的执行次数,还把调用关系计算进入,比如函数foo调用了bar,那么foo的代价中会加入bar的代价。
(2)--tree=both:显示调用关系。
(3)--auto=yes:会自动将统计信息和源码关联。
单纯查看性能数据,可以如下:
#callgrind_annotate --inclusive=yes callgrind.out.pid
既要查看性能数据,又要查看调用关系,可以如下:
#callgrind_annotate --inclusive=yes --tree=both callgrind.out.pid
二、使用实例
下面将提供一段简单的代码来演示如何使用callgrind来分析性能,具体代码如下:
编译代码并使用callgrind进行性能统计:
此时,在当前目录下能看到生成了callgrind.out.23588的性能数据文件。当然如果在编译代码时想生成汇编代码,那么可以如下:
#g++ -S -g -o test test.cpp
不错如此一来,则就会在当前目录下生成一大批callgrind.out.xxxxx的性能数据文件,在此不表汇编的事情。
接下来分别用前文提到三种方式来查看统计信息:
(1)--auto=yes
#callgrind_annotate --auto=yes callgrind.out.23588 > log
#vi log
由于这种模拟统计需要消耗大量的资源,所以callgrind只统计次数而不统计时间,上面只是截取了统计分析结果的一部分,左侧数字表示该条代码执行所用的指令数。
(2)--tree=both
#callgrind_annotate --tree=both callgrind.out.23588 > log
#vi log

上图中左侧数字表示调用带来的代价。
(3)--inclusive=yes
#callgrind_annotate --inclusive=yes callgrind.out.23588 > log
#vi log

像上图这般分析比较常见。
Callgrind 使用 2的更多相关文章
- kcachegrind gui for callgrind
DocumentationScreenshotsDownload/SourcesLinksRoadmapBugs & Wishes This is the homepage of the pr ...
- Valgrind.Callgrind使用
Callgrind介绍 用来对统计程序的函数调用之间的关系, 并统计每个函数的耗时 Callgrind之所以能够发现函数调用的关系, 依赖于平台的明确返回和调用指令. 在x86和amd64平台上wor ...
- valgrind的memchk和callgrind
一.安装valgrind 安装valgrind,正常的三部曲configure/make/make install就行. 二.memchk使用 1.执行命令 [root@10g-host4 tools ...
- valgrind的callgrind工具进行多线程性能分析
1.http://valgrind.org/downloads/old.html 2.yum install valgrind Valgrind的主要作者Julian Seward刚获得了今年的Goo ...
- 使用valgrind检查内存
Valgrind是运行在Linux上一套基于仿真技术的程序调试和分析工具,是公认的最接近Purify的产品,它包含一个内核——一个软件合成的CPU,和一系列的小工具,每个工具都可以完成一项任务——调试 ...
- 【转】 如何使用Valgrind memcheck工具进行C/C++的内存泄漏检测
系统编程中一个重要的方面就是有效地处理与内存相关的问题.你的工作越接近系统,你就需要面对越多的内存问题.有时这些问题非常琐碎,而更多时候它会演变成一个调试内存问题的恶梦.所以,在实践中会用到很多工具来 ...
- linux下内存泄露检测工具Valgrind介绍
目前在linux开发一个分析实时路况的应用程序,在联合测试中发现程序存在内存泄露的情况. 这下着急了,马上就要上线了,还好发现了一款Valgrind工具,完美的解决了内存泄露的问题. 推荐大家可以使用 ...
- mysql 5.7.17发布
Mysql 5.7.17发布了,主要修复: Changes in MySQL 5.7.17 (2016-12-12, General Availability) Compilation Notes M ...
- Linux下的应用程序性能分析 总结
Linux下的应用程序性能分析,根据内核程序和应用程序的不同,下文分两类进行描述. 我们侧重的是应用级别的程序,推荐google perf tool/kcachegrind组合 一.和内核有关的工具 ...
随机推荐
- javaweb学习总结(四十三)——Filter高级开发
在filter中可以得到代表用户请求和响应的request.response对象,因此在编程中可以使用Decorator(装饰器)模式对request.response对象进行包装,再把包装对象传给目 ...
- lib-flexible 结合 WKWebView 的样式错乱解决方法
技术栈 lib-flexible 是淘宝的可伸缩方案 WKWebView 是ios8以上支持的网页控件 问题场景 最新公司一个项目使用 lib-flexible 来做移动端的伸缩解决方案,页面在saf ...
- ruby使用IO类读写文件
path="test.txt" port=open(path) begin port.each_line{|line| p line.to_s } ensure port.clos ...
- OpenCV学习笔记:矩阵的掩码操作
矩阵的掩码操作很简单.其思想是:根据掩码矩阵(也称作核)重新计算图像中每个像素的值.掩码矩阵中的值表示近邻像素值(包括该像素自身的值)对新像素值有多大影响.从数学观点看,我们用自己设置的权值,对像素邻 ...
- linux编译安装git
我的博客:www.while0.com 用的centos6.4中自带的git,版本为1.7.1,配置好github的sshkey后,clone下来的项目无法提交,提示: fatal: Unable t ...
- WordPress Pretty Photo插件‘hashrel’参数跨站脚本漏洞
漏洞名称: WordPress Pretty Photo插件‘hashrel’参数跨站脚本漏洞 CNNVD编号: CNNVD-201311-405 发布时间: 2013-11-28 更新时间: 201 ...
- HDU5647 DZY Loves Connecting 树形DP
(先奉上jcvb大神的官方题解)BC 76 div 1 1002 对于每个结点i,统计出f[i]表示包含i的连通集有多少个,那么容易看出答案就是所有f[i]的和. 要计算f[i]是经典的树形DP问题. ...
- HDU 1518
思路:从第一个数开始搜索,将其和与边长比对,相等则计数+1,计数达到3的时候说明可以组成,因为剩下那条必与边长相等,搜索过程注意剪枝,若某个数已被加入边长则不能重复计算,应将其标记,另外应在每一层递归 ...
- HDU-5391 Zball in Tina Town
(n-1)!/n 就是如果n为素数,就等于n-1else为0. 求素数表: Zball in Tina Town Time Limit: 3000/1500 MS (Java/Others) Memo ...
- asp.net的运行内幕
每当浏览器向IIS发送一个页面请求的时候,相应的网页就会被编译成DLL文件,然后由JIT来运行这个DLL文件,最后将运行结果发送给客户端.一旦网页发送了变化,下次再请求页面的话,网页又会被重新被编译成 ...