VTune

《VTune 开发者手册》

1. 安装

1.1 软件安装

# 1.解压
tar -zxvf filename.tar.gz
# 2.安装
cd dirname/
./install.sh

1.2 配置环境

csh/tcsh用户:source <install_dir>/amplxe-vars.csh
bash 用户: source <install_dir>/amplxe-vars.sh 默认情况下<install_dir>是:
root用户:/opt/intel/vtune_amplifier_xe_2018
非root用户: $HOME/intel/vtune_amplifier_xe_2018

2. 使用

2.1 图形界面

amplxe-gui

图形界面具体使用参考:《VTune 开发者手册》

2.2 命令行

2.2.1 使用方法:

amplxe-cl <-action> [-action-option] [-global-option] [[--] target [target options]]

常用action包括(具体使用方法请点击后阅读手册):

2.2.2 应用实例

  • 查看帮助
amplxe-cl -help [action-option]
  • 列出分析类型
# 1. 列出所支持的分析类型
amplxe-cl –collect-list
# 2. 列出可支持的报告类型
amplxe-cl –report-list
  • 热点收集
amplxe-cl -collect hotspots -result-dir r0001hs -- ./gsexample2a datafile.txt
amplxe-cl -collect concurrency -r r0002cc -search-dir all:rp=/home/ompPrimes -- ./ompPrime1.icc
amplxe-cl -collect locksandwaits -user-data-dir /tmp -r r0003lw -- ./ompPrime1.icc
amplxe-cl -collect lightweight-hotspots -r r0004lh -- ./primes.gcc
amplxe-cl -collect nehalem_memory-access -duration 10
amplxe-cl -collect lightweight-hotspots -target-process gnome-power-manager -duration 10
amplxe-cl -collect concurrency -duration n -target-process program
amplxe-cl -collect concurrency -duration n -target-pid pid
# 1. 查看事件类型
amplxe-cl -collect-with runsa -knob event-config=?
# 2. 收集指定事件
amplxe-cl -collect-with runsa -knob event-config=MEM_LOAD_RETIRED.LLC_MISS,MEM_LOAD_RETIRED.LLC_UNSHARED_HIT -target-pid=$pid
  • 输入、分析VTune性能分析结果
# 1. 导入结果
amplxe-cl -import tbsf141.tb5 -r r001
# 2. 分析结果
amplxe-cl -report pmu-events -r r001 -group-by function
  • 热点分析
# 1. 仅列出模块gsexample2a相关的热点函数
amplxe-cl -report hotspots -result-dir r001hs -group-by function -filter module=gsexample2a
# 2. 列出所有的热点函数,包含链接库的
amplxe-cl -report hotspots -result-dir r001hs -call-stack-mode=all -group-by function
# 3. 列出占处理器时间80%的函数(模块)信息
amplxe-cl -report perf-detail -r r000hs -cumulative-threshold-percent 80
# 4. 结果中加入分隔符
amplxe-cl -report perf -csv-delimiter="," -r r000hs

3. 参考:

Intel VTune Amplifier XE 使用的更多相关文章

  1. 【性能分析】使用Intel VTune Amplifier

    本文转自 https://software.intel.com/zh-cn/blogs/2010/11/10/amplxe-cl/版权归原作者所有,如原作者有任何不允许转载之理由,本文将自行删除. I ...

  2. intel vtune 介绍、安装和使用

    intel vtune 介绍 https://software.intel.com/en-us/vtune intel vtune 安装包下载地址 https://software.intel.com ...

  3. Intel.parallel.studio.xe.2015.Update.2.ISO-TBE 下载

    磁力链下载点我 还有linux版本 Intel.parallel.studio.xe.2015.Update.1.LINUX.ISO-TBE 收集自网络,要跨请跨原作者,谢谢.

  4. Unreal Engine* 4/英特尔® VTune™ Amplifier 使用指南

    借助英特尔 VTune Amplifier,可以通过单一易用的分析界面获得先进的分析功能.UE4 和英特尔 VTune Amplifier 相互配合,支持调查代码并进行分析,从而在多个内核上顺畅运行. ...

  5. 如何使用Intel vtune profilier?

    如何使用Intel vtune profilier?

  6. Intel VTune性能分析器基础

    https://wenku.baidu.com/view/b0fe162ebd64783e09122b66.html

  7. <转> Intel VTune分析结果中的名词释译

    原文转自http://blog.chinaunix.net/uid-26000296-id-3369740.html Elapsed Time(执行耗时): the total time your t ...

  8. Enhancing the Scalability of Memcached

    原文地址: https://software.intel.com/en-us/articles/enhancing-the-scalability-of-memcached-0 1 Introduct ...

  9. Parrot源代码分析之海贼王

    我们的目的是找到speedup-example在使用Parrot加速的原因,假设仅仅说它源于Context Switch的降低,有点简单了,它究竟为什么降低了?除了Context Switch外是否还 ...

随机推荐

  1. js对cookie增删改查的封装

    /** * 获取cookie * @param name * @returns {*} */ function getCookie(name) { var cookieArr = document.c ...

  2. wx 小程序开发---开发者工具使用

    1:右侧详情界面 合法域名 都要在需要在小程序平台 配置合法域名 这样你的小程序请求的网址 才能通. 1.2如果自己的域名没有配置https 可以勾选为 不校验合法域名即可 (小程序官方规定 网址必须 ...

  3. 启动模拟器的qq

    #coding = utf-8from appium import webdriver '''1.手机类型2.版本3.手机的唯一标识 deviceName4.app 包名appPackage5.app ...

  4. 一次由于 MTU 设置不当导致的网络访问超时

    转自:http://weibo.com/ttarticle/p/show?id=2309404140904511340923 API 服务正常,但是调用总是超时.api端日志显示,响应速度很快. ​​ ...

  5. 把 Python 脚本打包成可以直接双击运行的 .exe 文件 【转】

    因为最近要用到 Python 脚本,所以自己学习了一下,顺便学习如何把它打包成 .exe 可执行文件,达到双击运行的效果,网上找了资料,保存下来学习用,原文出处:https://baijiahao.b ...

  6. BZOJ 1500 Luogu P2042 [NOI2005] 维护数列 (Splay)

    手动博客搬家: 本文发表于20180825 00:34:49, 原地址https://blog.csdn.net/suncongbo/article/details/82027387 题目链接: (l ...

  7. Mysql查询缓存研究

    转载声明:本文为DBA+社群原创文章,转载必须连同本订阅号二维码全文转载,并注明作者名字及来源:DBA+社群(dbaplus). http://mp.weixin.qq.com/s?__biz=MzI ...

  8. session_start() [function.session-start]:

    我在学习PHP的,当我尝试做在session_start() - 获取有关错误信息不能发送会话cookie. 我看到在这个问题上前面的问题,可是,仍然不能确定我的错误. 假设是错误家伙? <? ...

  9. caffe中ConvolutionLayer的前向和反向传播解析及源码阅读

    一.前向传播 在caffe中,卷积层做卷积的过程被转化成了由卷积核的参数组成的权重矩阵weights(简记为W)和feature map中的元素组成的输入矩阵(简记为Cin)的矩阵乘积W * Cin. ...

  10. chcp - 设置或者显示活动代码页编号

    chcp - 设置或者显示活动代码页编号 学习了:https://baike.baidu.com/item/CHCP/9061635?fr=aladdin