NSight Compute 用户手册(中)
NSight Compute 用户手册(中)
NVIDIA Nsight Compute支持密码和私钥身份验证方法。在此对话框中,选择身份验证方法并输入以下信息:
密码
IP/主机名:目标设备的IP地址或主机名。
用户名:用于SSH连接的用户名。
Password:用于SSH连接的用户密码。
端口:用于SSH连接的端口。(默认值为22。)
部署目录:目标设备上用于部署支持文件的目录。指定的用户必须对此位置具有写入权限。
私钥

IP/主机名:目标设备的IP地址或主机名。
用户名:用于SSH连接的用户名。
SSH私钥:用于向SSH服务器进行身份验证的私钥。
SSH-Key-Passphrase:您的私钥的密码短语。
部署目录:目标设备上用于部署支持文件的目录。指定的用户必须对此位置具有写入权限。
输入所有信息后,单击“添加”按钮以使用此新连接。
当在连接对话框中选择远程连接时,应用程序可执行文件浏览器将使用配置的SSH连接浏览远程文件系统,允许用户选择远程设备上的目标应用程序。
在远程设备上启动“活动”时,将执行以下步骤:
命令行探查器和支持文件将复制到远程设备上的部署目录中。(仅复制不存在或过期的文件。)
应用程序可执行文件在远程设备上执行。
对于交互式概要文件活动,将建立到远程应用程序的连接,并开始分析会话。
对于非交互式概要文件活动,远程应用程序在命令行探查器下执行,并生成指定的报告文件。
对于非交互式分析活动,生成的报告文件将复制回主机并打开。
每个步骤的进度都显示在进度日志中。
进度日志
请注意,一旦远程启动了任一活动类型,就可以在远程设备上的部署目录中找到进一步分析会话所需的工具。
交互式配置文件活动
交互式概要文件活动允许您启动控制目标应用程序执行的会话,类似于调试器。您可以单步执行API调用和工作负载(CUDA内核),暂停和恢复,并以交互方式选择感兴趣的内核和要收集的度量。
此活动当前不支持分析或附加到子进程。
支持NVTX
收集应用程序或其库提供的NVTX信息。需要支持单步执行到特定的NVTX上下文。
禁用分析启动/停止
忽略应用程序对cu(da)ProfilerStart或cu(da)ProfilerStop的调用。
从一开始启用分析
从应用程序启动时启用分析。如果应用程序在第一次调用此API之前调用cu(da)ProfilerStart和内核,则禁用此选项非常有用。请注意,禁用此选项不会阻止您手动分析内核。
缓存控制
控制分析期间GPU缓存的行为。允许的值:对于Flush All,在评测期间的每个内核重播迭代之前,都会刷新所有GPU缓存。虽然应用程序的执行环境中的度量值可能稍有不同而不会使缓存失效,但此模式在重播过程中以及在目标应用程序的多个运行中提供了最可复制的度量结果。
对于Flush None,在分析期间不刷新GPU缓存。如果度量收集只需要一个内核重播过程,这可以提高性能并更好地复制应用程序行为。然而,一些度量结果将根据先前的GPU工作以及在重放迭代之间变化。这可能导致度量值不一致和越界。
时钟控制
控制分析期间GPU时钟的行为。允许值:对于基频,GPC和内存时钟在配置期间被锁定到各自的基频。这对热节流没有影响。对于None,在分析期间不会更改GPC或内存频率。
配置文件活动
Profile活动提供了一个传统的、可预先配置的profiler。在配置了要评测的内核、要收集的度量等之后,应用程序将在分析器下运行,而无需交互控制。一旦应用程序终止,活动即完成。对于通常不会自行终止的应用程序,例如交互式用户界面,您可以在分析完所有预期的内核之后取消该活动。
此活动不支持附加到以前通过NVIDIA Nsight Compute启动的进程。这些进程将在“附加”选项卡中显示为灰色。
输出文件
应存储收集的配置文件的报表文件的路径。如果不存在,则自动添加报表扩展名.ncu rep。文件名组件支持占位符%i。它被一个按顺序递增的数字替换,以创建一个唯一的文件名。这将映射到--export命令行选项。
强制覆盖
如果设置,则覆盖现有报告文件。这将映射到--force overwrite命令行选项。
目标流程
选择要分析的进程。仅在应用程序模式下,只分析根应用程序进程。在模式all中,将分析根应用程序进程及其所有子进程。这将映射到--target processes命令行选项。
重播模式
选择多次重放内核启动的方法。在模式内核中,单个内核的启动在目标应用程序的单个执行期间被透明地回放。在模式应用程序中,整个目标应用程序将被多次重新启动。在每次迭代中,为目标内核启动收集额外的数据。应用程序回放要求程序的执行是确定性的。这将映射到--replay模式命令行选项。有关重播模式的更多详细信息,请参阅内核评测指南。
其他选项
所有剩余的选项都映射到它们的等效命令行探查器。有关详细信息,请参阅NVIDIA Nsight Compute CLI文档中的“命令行选项”部分。
重置
“连接”对话框中的条目将保存为当前项目的一部分。在自定义项目中工作时,只需关闭项目即可重置对话框。
不在自定义项目中工作时,条目将作为默认项目的一部分存储。通过关闭NVIDIA Nsight Compute,然后从磁盘中删除项目文件,可以从默认项目中删除所有信息。
NSight Compute 用户手册(中)的更多相关文章
- NSight Compute 用户手册(上)
NSight Compute 用户手册(上) 非交互式配置文件活动 从NVIDIA Nsight Compute启动目标应用程序 启动NVIDIA Nsight Compute时,将出现欢迎页面.单击 ...
- NSight Compute 用户手册(下)
主菜单 文件 新建项目使用"新建项目"对话框创建新的分析项目 4. Main Menu and Toolbar Information on the main menu and t ...
- Nsight Compute Profilier 分析
profiler报告包含每次内核启动分析期间收集的所有信息.在用户界面中,它包含一个包含常规信息的标题,以及用于在报告页面或单个收集的启动之间切换的控件.默认情况下,报告以选定的详细信息页面开始. 页 ...
- activiti 用户手册中 10分钟 小例子 简单代码搭建 及 其中的 各种坑
看mossle的 5.16 用户手册中的 快速起步:10分钟教程 想自己跑一下,虽然官方文档已经写的非常详细了,但是实际操作中还是遇到各种坑,这里记录下来. 首先官网下载最新的 5版本 full G ...
- 如何使用Nsight Compute?
如何使用Nsight Compute? 下图command Line Argunments是指训练或测试命令,Linux下直接用测试或训练命令
- ARM-Linux S5PV210 UART驱动(1)----用户手册中的硬件知识
一.概述 The Universal Asynchronous Receiver and Transmitter (UART) in S5PV210 provide four independent ...
- 【原创翻译】初识Unity中的Compute Shader
一直以来都想试着自己翻译一些东西,现在发现翻译真的很不容易,如果你直接把作者的原文按照英文的思维翻译过来,你会发现中国人读起来很是别扭,但是如果你想完全利用中国人的语言方式来翻译,又怕自己理解的不到位 ...
- SQL compute by 的使用
SQL compute by 的使用 摘自:http://www.cnblogs.com/Gavinzhao/archive/2010/07/12/1776107.html GROUP BY子句有个缺 ...
- Spark中shuffle的触发和调度
Spark中的shuffle是在干嘛? Shuffle在Spark中即是把父RDD中的KV对按照Key重新分区,从而得到一个新的RDD.也就是说原本同属于父RDD同一个分区的数据需要进入到子RDD的不 ...
随机推荐
- Windows之磁盘管理
0x01 磁盘管理概述 磁盘管理是一项计算机使用时的常规任务,它是以一组磁盘管理应用程序的形式提供给用户的,他们位于计算机管理控制台中,它包括查错程序和磁盘碎片整理程序以及磁盘整理程序.(来源百度 ...
- hdu4126(MST + 树形dp
题意: 这个题目和hdu4756差不多,是给你一个图,然后是q次改变边的权值,权值只增不减,最后问你每次改变之后的最小树的平均值是多少. 思路:(prim+树形dp) 先跑一边 ...
- PAT 乙级 -- 1009 -- 说反话
题目简述 给定一句英语,要求你编写程序,将句中所有单词的顺序颠倒输出. 输入格式:测试输入包含一个测试用例,在一行内给出总长度不超过80的字符串.字符串由若干单词和若干空格组成,其中单词是 ...
- hdu4302 set或者线段树
题意: 一条蛇生活在一个管子里,然后管子上面的某些位置会一次出现食物,每次蛇都会吃最近的食物,吃完之后就原地不动,等待下一次吃食物,如果有两个食物距离蛇一样远并且都是最近的,那么蛇不会掉头 ...
- Swift系列三 - 函数
函数在任何语言中都是存在的,Swift中函数更加灵活. 一.函数的定义 1.1. 有返回值(形参默认是let,也只能是let) func pi() -> Double { return 3.14 ...
- 【python】Leetcode每日一题-前缀树(Trie)
[python]Leetcode每日一题-前缀树(Trie) [题目描述] Trie(发音类似 "try")或者说 前缀树 是一种树形数据结构,用于高效地存储和检索字符串数据集中的 ...
- SpringBoot面向切面编程(AOP)
Aspect (与SpringBoot整合) 总结 作用位置 try{ try{ @Around 前置环绕通知 @Before 前置通知 method.invoke(..); }catch(){ @A ...
- php单列模式和工厂模式
一.单例模式又称为职责模式,它用来在程序中创建一个单一功能的访问点,通俗地说就是实例化出来的对象是唯一的.所有的单例模式至少拥有以下三种公共元素: 1. 它们必须拥有一个构造函数,并且必须被标记为pr ...
- 基于RestAssured实现接口自动化
RestAssured是一款强大的接口自动化框架, 旨在使用方便的DSL,简化的接口自动化. 下面是基于RestAssured扩展的一个简单框架示例, 先看看用例的风格: package testca ...
- Linux常见错误解决办法
1. 程序运行的一些基础知识 1. 编译程序时去哪找头文件? 系统目录:就是交叉编译工具链里的某个 include 目录:也可以自己指定:编译时用 " -I dir "选项指定. ...