Intel VTune Amplifier XE 使用
VTune
1. 安装
1.1 软件安装
- 下载:
(安装包下载地址) - 安装:
# 1.解压
tar -zxvf filename.tar.gz
# 2.安装
cd dirname/
./install.sh
1.2 配置环境
csh/tcsh用户:source <install_dir>/amplxe-vars.csh
bash 用户: source <install_dir>/amplxe-vars.sh
默认情况下<install_dir>是:
root用户:/opt/intel/vtune_amplifier_xe_2018
非root用户: $HOME/intel/vtune_amplifier_xe_2018
2. 使用
2.1 图形界面
amplxe-gui
图形界面具体使用参考:《VTune 开发者手册》
2.2 命令行
2.2.1 使用方法:
amplxe-cl <-action> [-action-option] [-global-option] [[--] target [target options]]
常用action包括(具体使用方法请点击后阅读手册):
2.2.2 应用实例
- 查看帮助
amplxe-cl -help [action-option]
- 列出分析类型
# 1. 列出所支持的分析类型
amplxe-cl –collect-list
# 2. 列出可支持的报告类型
amplxe-cl –report-list
- 热点收集
amplxe-cl -collect hotspots -result-dir r0001hs -- ./gsexample2a datafile.txt
amplxe-cl -collect concurrency -r r0002cc -search-dir all:rp=/home/ompPrimes -- ./ompPrime1.icc
amplxe-cl -collect locksandwaits -user-data-dir /tmp -r r0003lw -- ./ompPrime1.icc
amplxe-cl -collect lightweight-hotspots -r r0004lh -- ./primes.gcc
amplxe-cl -collect nehalem_memory-access -duration 10
amplxe-cl -collect lightweight-hotspots -target-process gnome-power-manager -duration 10
amplxe-cl -collect concurrency -duration n -target-process program
amplxe-cl -collect concurrency -duration n -target-pid pid
- 指定事件收集
《事件表》
# 1. 查看事件类型
amplxe-cl -collect-with runsa -knob event-config=?
# 2. 收集指定事件
amplxe-cl -collect-with runsa -knob event-config=MEM_LOAD_RETIRED.LLC_MISS,MEM_LOAD_RETIRED.LLC_UNSHARED_HIT -target-pid=$pid
- 输入、分析VTune性能分析结果
# 1. 导入结果
amplxe-cl -import tbsf141.tb5 -r r001
# 2. 分析结果
amplxe-cl -report pmu-events -r r001 -group-by function
- 热点分析
# 1. 仅列出模块gsexample2a相关的热点函数
amplxe-cl -report hotspots -result-dir r001hs -group-by function -filter module=gsexample2a
# 2. 列出所有的热点函数,包含链接库的
amplxe-cl -report hotspots -result-dir r001hs -call-stack-mode=all -group-by function
# 3. 列出占处理器时间80%的函数(模块)信息
amplxe-cl -report perf-detail -r r000hs -cumulative-threshold-percent 80
# 4. 结果中加入分隔符
amplxe-cl -report perf -csv-delimiter="," -r r000hs
3. 参考:
- 《VTUNE 性能分析器之简介》
- 《使用amplxe-cl 命令行进行性能数据收集和分析》
- 《Cache Miss Rates in Intel® VTune™ Amplifier XE》
- 《使用VTune™ Amplifier XE针对你的项目进行性能调优》
- 《VTune 开发者手册》
Intel VTune Amplifier XE 使用的更多相关文章
- 【性能分析】使用Intel VTune Amplifier
本文转自 https://software.intel.com/zh-cn/blogs/2010/11/10/amplxe-cl/版权归原作者所有,如原作者有任何不允许转载之理由,本文将自行删除. I ...
- intel vtune 介绍、安装和使用
intel vtune 介绍 https://software.intel.com/en-us/vtune intel vtune 安装包下载地址 https://software.intel.com ...
- Intel.parallel.studio.xe.2015.Update.2.ISO-TBE 下载
磁力链下载点我 还有linux版本 Intel.parallel.studio.xe.2015.Update.1.LINUX.ISO-TBE 收集自网络,要跨请跨原作者,谢谢.
- Unreal Engine* 4/英特尔® VTune™ Amplifier 使用指南
借助英特尔 VTune Amplifier,可以通过单一易用的分析界面获得先进的分析功能.UE4 和英特尔 VTune Amplifier 相互配合,支持调查代码并进行分析,从而在多个内核上顺畅运行. ...
- 如何使用Intel vtune profilier?
如何使用Intel vtune profilier?
- Intel VTune性能分析器基础
https://wenku.baidu.com/view/b0fe162ebd64783e09122b66.html
- <转> Intel VTune分析结果中的名词释译
原文转自http://blog.chinaunix.net/uid-26000296-id-3369740.html Elapsed Time(执行耗时): the total time your t ...
- Enhancing the Scalability of Memcached
原文地址: https://software.intel.com/en-us/articles/enhancing-the-scalability-of-memcached-0 1 Introduct ...
- Parrot源代码分析之海贼王
我们的目的是找到speedup-example在使用Parrot加速的原因,假设仅仅说它源于Context Switch的降低,有点简单了,它究竟为什么降低了?除了Context Switch外是否还 ...
随机推荐
- token的问题汇总
token的作用:认证.授权: 生成:随机码.时间戳.用户 设备 合成: 验证:是否存在.合成验证: 管理:有效期(服务器存储时间or cookie存储过期时间).展期. token生成:或者和用户信 ...
- Java实验环境搭建
1.JDK的下载一.JDK的下载及安装 (1).网站网址搜索http://www.oracle.com/technetwork/java,进入浏览页(2)找到Trials and Download 点 ...
- 布尔类型、操作符别名、C++函数、动态内存分配(new\delete)、引用(day02)
六 C++的布尔类型 bool类型是C++中基本类型,专门表示逻辑值:true/false bool在内存上占一个字节:1表示true,0表示false bool类型可以接收任意类型和表达式的结果,其 ...
- [bzoj1050 HAOI2006] 旅行comf (kruskal)
传送门 Description 给你一个无向图,N(N<=500)个顶点, M(M<=5000)条边,每条边有一个权值Vi(Vi<30000).给你两个顶点S和T,求 一条路径,使得 ...
- JavaSE 学习笔记之接 口(六)
接 口: 1:是用关键字interface定义的. 2:接口中包含的成员,最常见的有全局常量.抽象方法. 注意:接口中的成员都有固定的修饰符. 成员变量:public static final ...
- RMAN主要命令 show,list,crosscheck,delete详解
Oracle RMAN 的 show,list,crosscheck,delete命令整理 Oracle RMAN 的 show,list,crosscheck,delete命令整理 1.SHOW命 ...
- Hibernate单表操作(一)——单一主键
assigned由java应用程序负责生成.(手工赋值) native由底层数据库自己主动生成标识符,假设是MySQL就是increment,假设是oracle就是sequence.等等.
- UVa 10297 - Beavergnaw
题目:假设一个底边与高为D的圆柱切去一部分使得.剩下的中心是底边与高为d的圆柱. 和以他们底面为上下地面的圆锥台,已知切去的体积,求d. 分析:二分,计算几何.圆锥台体积公式:π*(r^2+r*R+R ...
- 具体解释Hibernate中的事务
1.前言 上一篇博客解说了Hibernate中的一级缓存,属于Session级别的.这篇博客解说一下Hibernate中的事务机制. 有关事务的概念.请參照通俗易懂数据库中的事务. 2.怎样处理Hi ...
- android制作闪动的红心
先上一张效果图吧: 说说这个东西的来源吧.今天突然想到笛卡尔心形图,想去看看能不能画个心出来,可是看到一篇不错的文章,那篇文章罗列了非常多关于心形的函数方程,这可把我高兴坏了,于是我选取了一个比較好看 ...