NSight Compute 用户手册(中)
NSight Compute 用户手册(中)
NVIDIA Nsight Compute支持密码和私钥身份验证方法。在此对话框中,选择身份验证方法并输入以下信息:
密码
IP/主机名:目标设备的IP地址或主机名。
用户名:用于SSH连接的用户名。
Password:用于SSH连接的用户密码。
端口:用于SSH连接的端口。(默认值为22。)
部署目录:目标设备上用于部署支持文件的目录。指定的用户必须对此位置具有写入权限。
私钥
IP/主机名:目标设备的IP地址或主机名。
用户名:用于SSH连接的用户名。
SSH私钥:用于向SSH服务器进行身份验证的私钥。
SSH-Key-Passphrase:您的私钥的密码短语。
部署目录:目标设备上用于部署支持文件的目录。指定的用户必须对此位置具有写入权限。
输入所有信息后,单击“添加”按钮以使用此新连接。
当在连接对话框中选择远程连接时,应用程序可执行文件浏览器将使用配置的SSH连接浏览远程文件系统,允许用户选择远程设备上的目标应用程序。
在远程设备上启动“活动”时,将执行以下步骤:
命令行探查器和支持文件将复制到远程设备上的部署目录中。(仅复制不存在或过期的文件。)
应用程序可执行文件在远程设备上执行。
对于交互式概要文件活动,将建立到远程应用程序的连接,并开始分析会话。
对于非交互式概要文件活动,远程应用程序在命令行探查器下执行,并生成指定的报告文件。
对于非交互式分析活动,生成的报告文件将复制回主机并打开。
每个步骤的进度都显示在进度日志中。
进度日志
请注意,一旦远程启动了任一活动类型,就可以在远程设备上的部署目录中找到进一步分析会话所需的工具。
交互式配置文件活动
交互式概要文件活动允许您启动控制目标应用程序执行的会话,类似于调试器。您可以单步执行API调用和工作负载(CUDA内核),暂停和恢复,并以交互方式选择感兴趣的内核和要收集的度量。
此活动当前不支持分析或附加到子进程。
支持NVTX
收集应用程序或其库提供的NVTX信息。需要支持单步执行到特定的NVTX上下文。
禁用分析启动/停止
忽略应用程序对cu(da)ProfilerStart或cu(da)ProfilerStop的调用。
从一开始启用分析
从应用程序启动时启用分析。如果应用程序在第一次调用此API之前调用cu(da)ProfilerStart和内核,则禁用此选项非常有用。请注意,禁用此选项不会阻止您手动分析内核。
缓存控制
控制分析期间GPU缓存的行为。允许的值:对于Flush All,在评测期间的每个内核重播迭代之前,都会刷新所有GPU缓存。虽然应用程序的执行环境中的度量值可能稍有不同而不会使缓存失效,但此模式在重播过程中以及在目标应用程序的多个运行中提供了最可复制的度量结果。
对于Flush None,在分析期间不刷新GPU缓存。如果度量收集只需要一个内核重播过程,这可以提高性能并更好地复制应用程序行为。然而,一些度量结果将根据先前的GPU工作以及在重放迭代之间变化。这可能导致度量值不一致和越界。
时钟控制
控制分析期间GPU时钟的行为。允许值:对于基频,GPC和内存时钟在配置期间被锁定到各自的基频。这对热节流没有影响。对于None,在分析期间不会更改GPC或内存频率。
配置文件活动
Profile活动提供了一个传统的、可预先配置的profiler。在配置了要评测的内核、要收集的度量等之后,应用程序将在分析器下运行,而无需交互控制。一旦应用程序终止,活动即完成。对于通常不会自行终止的应用程序,例如交互式用户界面,您可以在分析完所有预期的内核之后取消该活动。
此活动不支持附加到以前通过NVIDIA Nsight Compute启动的进程。这些进程将在“附加”选项卡中显示为灰色。
输出文件
应存储收集的配置文件的报表文件的路径。如果不存在,则自动添加报表扩展名.ncu rep。文件名组件支持占位符%i。它被一个按顺序递增的数字替换,以创建一个唯一的文件名。这将映射到--export命令行选项。
强制覆盖
如果设置,则覆盖现有报告文件。这将映射到--force overwrite命令行选项。
目标流程
选择要分析的进程。仅在应用程序模式下,只分析根应用程序进程。在模式all中,将分析根应用程序进程及其所有子进程。这将映射到--target processes命令行选项。
重播模式
选择多次重放内核启动的方法。在模式内核中,单个内核的启动在目标应用程序的单个执行期间被透明地回放。在模式应用程序中,整个目标应用程序将被多次重新启动。在每次迭代中,为目标内核启动收集额外的数据。应用程序回放要求程序的执行是确定性的。这将映射到--replay模式命令行选项。有关重播模式的更多详细信息,请参阅内核评测指南。
其他选项
所有剩余的选项都映射到它们的等效命令行探查器。有关详细信息,请参阅NVIDIA Nsight Compute CLI文档中的“命令行选项”部分。
重置
“连接”对话框中的条目将保存为当前项目的一部分。在自定义项目中工作时,只需关闭项目即可重置对话框。
不在自定义项目中工作时,条目将作为默认项目的一部分存储。通过关闭NVIDIA Nsight Compute,然后从磁盘中删除项目文件,可以从默认项目中删除所有信息。
NSight Compute 用户手册(中)的更多相关文章
- NSight Compute 用户手册(上)
NSight Compute 用户手册(上) 非交互式配置文件活动 从NVIDIA Nsight Compute启动目标应用程序 启动NVIDIA Nsight Compute时,将出现欢迎页面.单击 ...
- NSight Compute 用户手册(下)
主菜单 文件 新建项目使用"新建项目"对话框创建新的分析项目 4. Main Menu and Toolbar Information on the main menu and t ...
- Nsight Compute Profilier 分析
profiler报告包含每次内核启动分析期间收集的所有信息.在用户界面中,它包含一个包含常规信息的标题,以及用于在报告页面或单个收集的启动之间切换的控件.默认情况下,报告以选定的详细信息页面开始. 页 ...
- activiti 用户手册中 10分钟 小例子 简单代码搭建 及 其中的 各种坑
看mossle的 5.16 用户手册中的 快速起步:10分钟教程 想自己跑一下,虽然官方文档已经写的非常详细了,但是实际操作中还是遇到各种坑,这里记录下来. 首先官网下载最新的 5版本 full G ...
- 如何使用Nsight Compute?
如何使用Nsight Compute? 下图command Line Argunments是指训练或测试命令,Linux下直接用测试或训练命令
- ARM-Linux S5PV210 UART驱动(1)----用户手册中的硬件知识
一.概述 The Universal Asynchronous Receiver and Transmitter (UART) in S5PV210 provide four independent ...
- 【原创翻译】初识Unity中的Compute Shader
一直以来都想试着自己翻译一些东西,现在发现翻译真的很不容易,如果你直接把作者的原文按照英文的思维翻译过来,你会发现中国人读起来很是别扭,但是如果你想完全利用中国人的语言方式来翻译,又怕自己理解的不到位 ...
- SQL compute by 的使用
SQL compute by 的使用 摘自:http://www.cnblogs.com/Gavinzhao/archive/2010/07/12/1776107.html GROUP BY子句有个缺 ...
- Spark中shuffle的触发和调度
Spark中的shuffle是在干嘛? Shuffle在Spark中即是把父RDD中的KV对按照Key重新分区,从而得到一个新的RDD.也就是说原本同属于父RDD同一个分区的数据需要进入到子RDD的不 ...
随机推荐
- 技术面试问题汇总第001篇:猎豹移动反病毒工程师part1
我在2014年7月1日参加了猎豹移动(原金山网络)反病毒工程师的电话面试,但是很遗憾,由于我当时准备不足,加上自身水平不够,面试官向我提出的很多技术问题我都没能答出来(这里面既有基础类的问题,也有比较 ...
- 阿里早期Android加固代码的实现分析
本文博客地址:http://blog.csdn.net/qq1084283172/article/details/78320445 看雪上有作者(寒号鸟二代)将阿里移动早期的Android加固进行了逆 ...
- 编译android4.4刷到nexus 5
操作系统:ubuntu14.4tls android源码版本:4.4 手机:nexus5 1 获得手机的驱动程序(跟硬件平台有关):Binaries for Nexus Device 查到nexus ...
- 神经网络与机器学习 笔记—多层感知器(MLP)
多层感知器(MLP) Rosenblatt感知器和LMS算法,都是单层的并且是单个神经元构造的神经网络,他们的局限性是只能解决线性可分问题,例如Rosenblatt感知器一直没办法处理简单异或问题.然 ...
- 老师不讲的C语言知识
老师不讲的C语言知识 导语: 对于工科生,C语言是一门必修课.标准C(ANSI C)这个看似简单的语言在硬件底层编程.嵌入式开发领域还是稳坐头把交椅.在20年5月份,C语言就凭借其在医疗设备上的广泛应 ...
- algorithm库介绍之---- stable_sort()方法 与 sort()方法 .
文章转载自:http://www.cnblogs.com/ffhajbq/archive/2012/07/24/2607476.html 关于stable_sort()和sort()的区别: 你发现有 ...
- EventSource的自定义实现
前言: 前面两篇文章都介绍了.NET Core 性能诊断工具,其中诊断工具都用到了EventCounters来实时的收集服务器性能指标. 那么收集指标能否自己定义呢? 一.What's EventCo ...
- 完美解决MSSQL安装问题“Polybase要求安装Oracle JRE 7更新51(64位)”方案
阅文时长 | 0.72分钟 字数统计 | 1164.8字符 主要内容 | 1.问题起因及解决方案 2.安装jdk-8u241-windows-x64 3.取消PolyBase查询服务 4.四.声明与参 ...
- [算法] O(n^2)排序算法的效率比较
选择.插入排序 main.cpp 1 #include <iostream> 3 #include "SortTestHelper.h" 4 5 using names ...
- curl: (35) SSL connect error
curl: (35) SSL connect error weixin_34212762 2018-02-23 20:16:23 230 收藏 文章标签: 运维 版权 阿里云的机器,昨晚githu ...