NSight Compute 用户手册(中)
NSight Compute 用户手册(中)
NVIDIA Nsight Compute支持密码和私钥身份验证方法。在此对话框中,选择身份验证方法并输入以下信息:
密码
IP/主机名:目标设备的IP地址或主机名。
用户名:用于SSH连接的用户名。
Password:用于SSH连接的用户密码。
端口:用于SSH连接的端口。(默认值为22。)
部署目录:目标设备上用于部署支持文件的目录。指定的用户必须对此位置具有写入权限。
私钥
IP/主机名:目标设备的IP地址或主机名。
用户名:用于SSH连接的用户名。
SSH私钥:用于向SSH服务器进行身份验证的私钥。
SSH-Key-Passphrase:您的私钥的密码短语。
部署目录:目标设备上用于部署支持文件的目录。指定的用户必须对此位置具有写入权限。
输入所有信息后,单击“添加”按钮以使用此新连接。
当在连接对话框中选择远程连接时,应用程序可执行文件浏览器将使用配置的SSH连接浏览远程文件系统,允许用户选择远程设备上的目标应用程序。
在远程设备上启动“活动”时,将执行以下步骤:
命令行探查器和支持文件将复制到远程设备上的部署目录中。(仅复制不存在或过期的文件。)
应用程序可执行文件在远程设备上执行。
对于交互式概要文件活动,将建立到远程应用程序的连接,并开始分析会话。
对于非交互式概要文件活动,远程应用程序在命令行探查器下执行,并生成指定的报告文件。
对于非交互式分析活动,生成的报告文件将复制回主机并打开。
每个步骤的进度都显示在进度日志中。
进度日志
请注意,一旦远程启动了任一活动类型,就可以在远程设备上的部署目录中找到进一步分析会话所需的工具。
交互式配置文件活动
交互式概要文件活动允许您启动控制目标应用程序执行的会话,类似于调试器。您可以单步执行API调用和工作负载(CUDA内核),暂停和恢复,并以交互方式选择感兴趣的内核和要收集的度量。
此活动当前不支持分析或附加到子进程。
支持NVTX
收集应用程序或其库提供的NVTX信息。需要支持单步执行到特定的NVTX上下文。
禁用分析启动/停止
忽略应用程序对cu(da)ProfilerStart或cu(da)ProfilerStop的调用。
从一开始启用分析
从应用程序启动时启用分析。如果应用程序在第一次调用此API之前调用cu(da)ProfilerStart和内核,则禁用此选项非常有用。请注意,禁用此选项不会阻止您手动分析内核。
缓存控制
控制分析期间GPU缓存的行为。允许的值:对于Flush All,在评测期间的每个内核重播迭代之前,都会刷新所有GPU缓存。虽然应用程序的执行环境中的度量值可能稍有不同而不会使缓存失效,但此模式在重播过程中以及在目标应用程序的多个运行中提供了最可复制的度量结果。
对于Flush None,在分析期间不刷新GPU缓存。如果度量收集只需要一个内核重播过程,这可以提高性能并更好地复制应用程序行为。然而,一些度量结果将根据先前的GPU工作以及在重放迭代之间变化。这可能导致度量值不一致和越界。
时钟控制
控制分析期间GPU时钟的行为。允许值:对于基频,GPC和内存时钟在配置期间被锁定到各自的基频。这对热节流没有影响。对于None,在分析期间不会更改GPC或内存频率。
配置文件活动
Profile活动提供了一个传统的、可预先配置的profiler。在配置了要评测的内核、要收集的度量等之后,应用程序将在分析器下运行,而无需交互控制。一旦应用程序终止,活动即完成。对于通常不会自行终止的应用程序,例如交互式用户界面,您可以在分析完所有预期的内核之后取消该活动。
此活动不支持附加到以前通过NVIDIA Nsight Compute启动的进程。这些进程将在“附加”选项卡中显示为灰色。
输出文件
应存储收集的配置文件的报表文件的路径。如果不存在,则自动添加报表扩展名.ncu rep。文件名组件支持占位符%i。它被一个按顺序递增的数字替换,以创建一个唯一的文件名。这将映射到--export命令行选项。
强制覆盖
如果设置,则覆盖现有报告文件。这将映射到--force overwrite命令行选项。
目标流程
选择要分析的进程。仅在应用程序模式下,只分析根应用程序进程。在模式all中,将分析根应用程序进程及其所有子进程。这将映射到--target processes命令行选项。
重播模式
选择多次重放内核启动的方法。在模式内核中,单个内核的启动在目标应用程序的单个执行期间被透明地回放。在模式应用程序中,整个目标应用程序将被多次重新启动。在每次迭代中,为目标内核启动收集额外的数据。应用程序回放要求程序的执行是确定性的。这将映射到--replay模式命令行选项。有关重播模式的更多详细信息,请参阅内核评测指南。
其他选项
所有剩余的选项都映射到它们的等效命令行探查器。有关详细信息,请参阅NVIDIA Nsight Compute CLI文档中的“命令行选项”部分。
重置
“连接”对话框中的条目将保存为当前项目的一部分。在自定义项目中工作时,只需关闭项目即可重置对话框。
不在自定义项目中工作时,条目将作为默认项目的一部分存储。通过关闭NVIDIA Nsight Compute,然后从磁盘中删除项目文件,可以从默认项目中删除所有信息。
NSight Compute 用户手册(中)的更多相关文章
- NSight Compute 用户手册(上)
NSight Compute 用户手册(上) 非交互式配置文件活动 从NVIDIA Nsight Compute启动目标应用程序 启动NVIDIA Nsight Compute时,将出现欢迎页面.单击 ...
- NSight Compute 用户手册(下)
主菜单 文件 新建项目使用"新建项目"对话框创建新的分析项目 4. Main Menu and Toolbar Information on the main menu and t ...
- Nsight Compute Profilier 分析
profiler报告包含每次内核启动分析期间收集的所有信息.在用户界面中,它包含一个包含常规信息的标题,以及用于在报告页面或单个收集的启动之间切换的控件.默认情况下,报告以选定的详细信息页面开始. 页 ...
- activiti 用户手册中 10分钟 小例子 简单代码搭建 及 其中的 各种坑
看mossle的 5.16 用户手册中的 快速起步:10分钟教程 想自己跑一下,虽然官方文档已经写的非常详细了,但是实际操作中还是遇到各种坑,这里记录下来. 首先官网下载最新的 5版本 full G ...
- 如何使用Nsight Compute?
如何使用Nsight Compute? 下图command Line Argunments是指训练或测试命令,Linux下直接用测试或训练命令
- ARM-Linux S5PV210 UART驱动(1)----用户手册中的硬件知识
一.概述 The Universal Asynchronous Receiver and Transmitter (UART) in S5PV210 provide four independent ...
- 【原创翻译】初识Unity中的Compute Shader
一直以来都想试着自己翻译一些东西,现在发现翻译真的很不容易,如果你直接把作者的原文按照英文的思维翻译过来,你会发现中国人读起来很是别扭,但是如果你想完全利用中国人的语言方式来翻译,又怕自己理解的不到位 ...
- SQL compute by 的使用
SQL compute by 的使用 摘自:http://www.cnblogs.com/Gavinzhao/archive/2010/07/12/1776107.html GROUP BY子句有个缺 ...
- Spark中shuffle的触发和调度
Spark中的shuffle是在干嘛? Shuffle在Spark中即是把父RDD中的KV对按照Key重新分区,从而得到一个新的RDD.也就是说原本同属于父RDD同一个分区的数据需要进入到子RDD的不 ...
随机推荐
- 获取全局描述符表GDT的内容
/stdfx.h文件 //Ring0环的程序 //测试环境VS2005 #ifndef _WIN32_WINNT // Allow use of features specific to Window ...
- POJ1201基础差分约束
题意: 有一条直线,直线上做多有50000个点,然后给你组关系 a b c表明a-b之间最少有c个点,问直线上最少多少个点. 思路: a-b最少有c个点可以想象a到b+1的距 ...
- 【JavaScript】Leetcode每日一题-青蛙过河
[JavaScript]Leetcode每日一题-青蛙过河 [题目描述] 一只青蛙想要过河. 假定河流被等分为若干个单元格,并且在每一个单元格内都有可能放有一块石子(也有可能没有). 青蛙可以跳上石子 ...
- SE_WorkX_提问回顾与个人总结
项目 内容 课程:北航-2020-春-软件工程 博客园班级博客 要求:正所谓"实践是认识的来源.目的.动力以及检验认识真理性的唯一标准",在经历了一个学期的学习和实践后,请大家写一 ...
- [c++] 细节
\r退格:printf("asdflkj\r111")输出111flkj(https://blog.csdn.net/tyshtang/article/details/436770 ...
- [DB] 大数据概述
什么是大数据 电商推荐系统 大量订单如何存储(十年) 大量的订单如何计算(不关心算法) 天气预报 大量的天气数据如何存储 大量天气数据如何计算 核心问题 数据的存储:分布式文件系统(HDFS) 数据的 ...
- Zabbix5.0服务端部署
Zabbix5.0服务端部署 基础环境配置 [root@localhost ~]# systemctl disable --now firewalld Removed symlink /etc/sys ...
- Flume 常用配置项
注:以下配置项均为常见配置项,查询详细配置项可以访问 flume 官网 Source 常见配置项 Avro Source 配置项名称 默认值 描述 Channel – type – 组件类型名称,必须 ...
- component: resolve => require(['../pages/home.vue'], resolve)-装载
import Vue from 'vue'import VueRouter from 'vue-router'// "@"相当于".."import Detai ...
- Linux内存带宽的一些测试笔记
Linux内存带宽的一些测试笔记 首页 所有文章 2014年10月 GNU/Linux系统 2014-10-21 13:20 GNU/LINUX系统 内存带宽 1k 字 669 次 最近要测一下 ...