Callgrind是一款和gprof类似的性能分析工具,与gprof不同的是它不需要在编译源码时附加特殊选项,但推荐加上调试选项。Callgrind使用cachegrind的统计信息Ir(I cache reads,即一条指令执行的次数)来统计程序中函数的调用情况,建立函数调用关系图,还可以有选择地进行cache模拟。在运行结束时,它会把分析数据写入一个文件,callgrind_annotate可以把这个文件的内容转化成可读的形式。
一、基本语法
        Callgrind语法格式如下:
        valgrind --tool=callgrind [callgrind options] your-program [program options]
        可以如下来使用valgrind启动后台服务进程:
        #valgrind --tool=callgrind --separate-threads=yes ./haproxy -f haproxy.cfg
        其中,--tool=callgrind表示使用valgrind提供的性能分析功能,--separate-threads=yes表示要查看多线程相关数据。
        在程序运行过程中可以用callgrind_control将性能数据dump到指定目录下(可以使用callgrind_control -h查看帮助信息),比如:
        #callgrind_control -d -w /usr/local/haproxy
        上面命令会将所有线程的性能数据dump到目录/usr/local/haproxy下生成的callgrind.out.pid文件中。
        我们可以使用callgrind_annotate [options] callgrind.out.pid查看性能数据,其中,options选项参数详细信息如下:
        (1)--inclusive=yes:不但分别统计每个语句的执行次数,还把调用关系计算进入,比如函数foo调用了bar,那么foo的代价中会加入bar的代价。
        (2)--tree=both:显示调用关系。
        (3)--auto=yes:会自动将统计信息和源码关联。
        单纯查看性能数据,可以如下:
        #callgrind_annotate --inclusive=yes callgrind.out.pid
        既要查看性能数据,又要查看调用关系,可以如下:
        #callgrind_annotate --inclusive=yes --tree=both callgrind.out.pid

二、使用实例
        下面将提供一段简单的代码来演示如何使用callgrind来分析性能,具体代码如下:
            
        编译代码并使用callgrind进行性能统计:
            
        此时,在当前目录下能看到生成了callgrind.out.23588的性能数据文件。当然如果在编译代码时想生成汇编代码,那么可以如下:
        #g++ -S -g -o test test.cpp
        不错如此一来,则就会在当前目录下生成一大批callgrind.out.xxxxx的性能数据文件,在此不表汇编的事情。
        接下来分别用前文提到三种方式来查看统计信息:
        (1)--auto=yes
        #callgrind_annotate --auto=yes callgrind.out.23588 > log
        #vi log
             
        由于这种模拟统计需要消耗大量的资源,所以callgrind只统计次数而不统计时间,上面只是截取了统计分析结果的一部分,左侧数字表示该条代码执行所用的指令数。   
        (2)--tree=both
        #callgrind_annotate --tree=both callgrind.out.23588 > log
        #vi log
        
        上图中左侧数字表示调用带来的代价。
        (3)--inclusive=yes
        #callgrind_annotate --inclusive=yes callgrind.out.23588 > log
        #vi log
        
        像上图这般分析比较常见。

Callgrind 使用 2的更多相关文章

  1. kcachegrind gui for callgrind

    DocumentationScreenshotsDownload/SourcesLinksRoadmapBugs & Wishes This is the homepage of the pr ...

  2. Valgrind.Callgrind使用

    Callgrind介绍 用来对统计程序的函数调用之间的关系, 并统计每个函数的耗时 Callgrind之所以能够发现函数调用的关系, 依赖于平台的明确返回和调用指令. 在x86和amd64平台上wor ...

  3. valgrind的memchk和callgrind

    一.安装valgrind 安装valgrind,正常的三部曲configure/make/make install就行. 二.memchk使用 1.执行命令 [root@10g-host4 tools ...

  4. valgrind的callgrind工具进行多线程性能分析

    1.http://valgrind.org/downloads/old.html 2.yum install valgrind Valgrind的主要作者Julian Seward刚获得了今年的Goo ...

  5. 使用valgrind检查内存

    Valgrind是运行在Linux上一套基于仿真技术的程序调试和分析工具,是公认的最接近Purify的产品,它包含一个内核——一个软件合成的CPU,和一系列的小工具,每个工具都可以完成一项任务——调试 ...

  6. 【转】 如何使用Valgrind memcheck工具进行C/C++的内存泄漏检测

    系统编程中一个重要的方面就是有效地处理与内存相关的问题.你的工作越接近系统,你就需要面对越多的内存问题.有时这些问题非常琐碎,而更多时候它会演变成一个调试内存问题的恶梦.所以,在实践中会用到很多工具来 ...

  7. linux下内存泄露检测工具Valgrind介绍

    目前在linux开发一个分析实时路况的应用程序,在联合测试中发现程序存在内存泄露的情况. 这下着急了,马上就要上线了,还好发现了一款Valgrind工具,完美的解决了内存泄露的问题. 推荐大家可以使用 ...

  8. mysql 5.7.17发布

    Mysql 5.7.17发布了,主要修复: Changes in MySQL 5.7.17 (2016-12-12, General Availability) Compilation Notes M ...

  9. Linux下的应用程序性能分析 总结

    Linux下的应用程序性能分析,根据内核程序和应用程序的不同,下文分两类进行描述. 我们侧重的是应用级别的程序,推荐google perf tool/kcachegrind组合 一.和内核有关的工具 ...

随机推荐

  1. javaweb学习总结(四十三)——Filter高级开发

    在filter中可以得到代表用户请求和响应的request.response对象,因此在编程中可以使用Decorator(装饰器)模式对request.response对象进行包装,再把包装对象传给目 ...

  2. lib-flexible 结合 WKWebView 的样式错乱解决方法

    技术栈 lib-flexible 是淘宝的可伸缩方案 WKWebView 是ios8以上支持的网页控件 问题场景 最新公司一个项目使用 lib-flexible 来做移动端的伸缩解决方案,页面在saf ...

  3. ruby使用IO类读写文件

    path="test.txt" port=open(path) begin port.each_line{|line| p line.to_s } ensure port.clos ...

  4. OpenCV学习笔记:矩阵的掩码操作

    矩阵的掩码操作很简单.其思想是:根据掩码矩阵(也称作核)重新计算图像中每个像素的值.掩码矩阵中的值表示近邻像素值(包括该像素自身的值)对新像素值有多大影响.从数学观点看,我们用自己设置的权值,对像素邻 ...

  5. linux编译安装git

    我的博客:www.while0.com 用的centos6.4中自带的git,版本为1.7.1,配置好github的sshkey后,clone下来的项目无法提交,提示: fatal: Unable t ...

  6. WordPress Pretty Photo插件‘hashrel’参数跨站脚本漏洞

    漏洞名称: WordPress Pretty Photo插件‘hashrel’参数跨站脚本漏洞 CNNVD编号: CNNVD-201311-405 发布时间: 2013-11-28 更新时间: 201 ...

  7. HDU5647 DZY Loves Connecting 树形DP

    (先奉上jcvb大神的官方题解)BC 76 div 1 1002 对于每个结点i,统计出f[i]表示包含i的连通集有多少个,那么容易看出答案就是所有f[i]的和. 要计算f[i]是经典的树形DP问题. ...

  8. HDU 1518

    思路:从第一个数开始搜索,将其和与边长比对,相等则计数+1,计数达到3的时候说明可以组成,因为剩下那条必与边长相等,搜索过程注意剪枝,若某个数已被加入边长则不能重复计算,应将其标记,另外应在每一层递归 ...

  9. HDU-5391 Zball in Tina Town

    (n-1)!/n 就是如果n为素数,就等于n-1else为0. 求素数表: Zball in Tina Town Time Limit: 3000/1500 MS (Java/Others) Memo ...

  10. asp.net的运行内幕

    每当浏览器向IIS发送一个页面请求的时候,相应的网页就会被编译成DLL文件,然后由JIT来运行这个DLL文件,最后将运行结果发送给客户端.一旦网页发送了变化,下次再请求页面的话,网页又会被重新被编译成 ...