CUDA查询设备信息

CUDA C中的cudaGetDeviceProperties函数可以很方便的获取到设备的信息,函数原型是:

cudaError_t CUDARTAPI cudaGetDeviceProperties(struct cudaDeviceProp *prop, int device);

第二个参数device是从0开始的设备的编号。

第一个参数prop指向的是一个cudaDeviceProp类型的结构。cudaDeviceProp结构中包含了设备的相关属性,下图是 其中的几个属性信息:

部分属性信息的相关说明如下:

(注:1MB=1024KB=1024*1024字节)

#include "cuda_runtime.h"
#include "device_launch_parameters.h"
#include <iostream> using namespace std; int main()
{
cudaDeviceProp deviceProp;
int deviceCount;
cudaError_t cudaError;
cudaError = cudaGetDeviceCount(&deviceCount);
for (int i = 0; i < deviceCount; i++)
{
cudaError = cudaGetDeviceProperties(&deviceProp, i); cout << "设备 " << i + 1 << " 的主要属性: " << endl;
cout << "设备显卡型号: " << deviceProp.name << endl;
cout << "设备全局内存总量(以MB为单位): " << deviceProp.totalGlobalMem / 1024 / 1024 << endl;
cout << "设备上一个线程块(Block)中可用的最大共享内存(以KB为单位): " << deviceProp.sharedMemPerBlock / 1024 << endl;
cout << "设备上一个线程块(Block)种可用的32位寄存器数量: " << deviceProp.regsPerBlock << endl;
cout << "设备上一个线程块(Block)可包含的最大线程数量: " << deviceProp.maxThreadsPerBlock << endl;
cout << "设备的计算功能集(Compute Capability)的版本号: " << deviceProp.major << "." << deviceProp.minor << endl;
cout << "设备上多处理器的数量: " << deviceProp.multiProcessorCount << endl;
}
getchar();
return 0;
}

运行输出的部分设备属性信息:

CUDA选取设备信息

系统中可能包含多个GPU,这种情况下,最好依据对GPU某些特定属性的需求,让程序自动选择执行速度最快的GUP。例如对于核函数与CUP之间需要进行密集交互的情况,要尽可能考虑在集成的GPU上运行。集成的GPU与CPU共享内存,数据交互效率更高。还有一些功能如双精度浮点运算只有在计算功能集的版本为1.3或者以上才具有,这种情况下就必须要选择版本号大于等于1.3的GPU。

CUDA提供了一个简便的方法来自动选择合适的GPU。以下以“要求设备的计算功能集的版本号为5.2”这个条件为例说明选择GPU的方法。

  • 1、设置需要的设备属性

定义一个cudaDeviceProp结构对象,设置需要的设备属性:

//定义需要的设备属性
cudaDeviceProp devicePropDefined;
memset(&devicePropDefined, 0, sizeof(cudaDeviceProp)); //设置devicepropDefined的值
devicePropDefined.major = 5;
devicePropDefined.minor = 2;
  • 2、调用cudaChooseDevice函数返回满足要求的设备ID

设置完所要求的的设备属性之后,把cudaDeviceProp结构的对象传递给cudaChooseDevice函数,cudaChooseDevice函数会查找机器上是否有满足所设置属性的设备,并返回设备编号:

cudaChooseDevice(&devicedChoosed, &devicePropDefined);  //查找符合要求的设备ID
cout << "满足指定属性要求的设备的编号: " << devicedChoosed << endl;

  • 3、调用cudaSetDevice函数设置下文使用的设备编号

cudaSetDevice函数的作用是使输入ID代表的设备生效,之后所进行的CUDA操作就会在该设备上执行:

cudaError = cudaSetDevice(devicedChoosed); //设置选中的设备为下文的运行设备

以下是依据设定的属性选取设备的流程示例:

#include "cuda_runtime.h"
#include "device_launch_parameters.h"
#include <iostream> using namespace std; int main()
{
//定义需要的设备属性
cudaDeviceProp devicePropDefined;
memset(&devicePropDefined, 0, sizeof(cudaDeviceProp)); //设置devicepropDefined的值
devicePropDefined.major = 5;
devicePropDefined.minor = 2; int devicedChoosed; //选中的设备ID
cudaError_t cudaError;
cudaGetDevice(&devicedChoosed); //获取当前设备ID
cout << "当前使用设备的编号: " << devicedChoosed << endl; cudaChooseDevice(&devicedChoosed, &devicePropDefined); //查找符合要求的设备ID
cout << "满足指定属性要求的设备的编号: " << devicedChoosed << endl; cudaError = cudaSetDevice(devicedChoosed); //设置选中的设备为下文的运行设备 if (cudaError == cudaSuccess)
cout << "设备选取成功!" << endl;
else
cout << "设备选取失败!" << endl;
getchar();
return 0;
}

CUDA查询和选取设备信息的更多相关文章

  1. 【CUDA 基础】2.4 设备信息

    title: [CUDA 基础]2.4 设备信息 categories: CUDA Freshman tags: CUDA Device Information toc: true date: 201 ...

  2. C#:基于WMI查询USB设备信息 及 Android设备厂商VID列表

    /* ---------------------------------------------------------- 文件名称:WMIUsbQuery.cs 作者:秦建辉 MSN:splashc ...

  3. MDNS的漏洞报告——mdns的最大问题是允许广域网的mdns单播查询,这会暴露设备信息,或者被利用用于dns放大攻击

    Vulnerability Note VU#550620 Multicast DNS (mDNS) implementations may respond to unicast queries ori ...

  4. C#使用Xamarin开发可移植移动应用终章(11.获取设备信息与常用组件,开源一个可开发模版.)

    前言 系列目录 C#使用Xamarin开发可移植移动应用目录 源码地址:https://github.com/l2999019/DemoApp 可以Star一下,随意 - - 说点什么.. 本系列,终 ...

  5. OpenCL 查询平台和设备

    ▶ 查询平台和设备的代码以结果,放在这里方便以后逐渐扩充和查询(没有营养) #include <stdio.h> #include <stdlib.h> #include &l ...

  6. Atitit.获取主板与bios序列号获取硬件设备信息  Wmi wmic 的作用

    Atitit.获取主板与bios序列号获取硬件设备信息  Wmi wmic 的作用 1 获取硬件核心基础核心基础Wmi1 2 其他资料2 3 Wmic WMI 命令行接口2 4 Atitit.获取主板 ...

  7. C# 获取USB设备信息

    C# 获取USB设备信息WMI方式 using System; using System.Management; using System.Text.RegularExpressions; using ...

  8. 802.1X 账号密码+设备信息双重认证

    名词解释 802.1X: IEEE802 LAN/WAN 委员会为解决无线局域网网络安全问题,提出了 802.1X 协议.后来,802.1X协议作为局域网端口的一个普通接入控制机制在以太网中被广泛应用 ...

  9. 整理UWP中网络和设备信息获取的帮助类,需要的拿走。

    网络(运营商信息,网络类型) public static class NetworkInfo { /// <summary> /// 网络是否可用 /// </summary> ...

随机推荐

  1. 【Codeforces Round #437 (Div. 2) A】Between the Offices

    [链接]h在这里写链接 [题意] 在这里写题意 [题解] 在这里写题解 [错的次数] 0 [反思] 在这了写反思 [代码] #include <bits/stdc++.h> using n ...

  2. C语言free函数的原理——————————【Badboy】

    今天在网上看到了这样一个问题,"假设malloc 了一块字符串的内存.然后,它改变了这个字符串的大小,问会不会有一部分内存没有被释放掉."这个问题,曾经的确没有细致想过. 当然.我 ...

  3. 0、驱动及应用小技巧、uboot指令及环境变量配置、linux常用命令

    (内核make menuconfig之后,通过insmod安装的驱动都应该重新make,可能会出现一些莫名的问题) (nor flash/SDRAM/DM9000都受内存控制器控制,需要配置内存控制器 ...

  4. Nginx+Tomcat搭建高性能负载均衡集群的实现方法

    一.    目标实现高性能负载均衡的Tomcat集群: 二.步骤 1.首先下载Nginx,要下载稳定版: 2.然后解压两个Tomcat,分别命名为apache-tomcat-6.0.33-1和apac ...

  5. 快速杀死占用8080端口进程的批处理(kill-8080.bat)

    @echo off setlocal enabledelayedexpansion for /f "delims= tokens=1" %%i in ('netstat -aon ...

  6. hdu3377之简单路径求最值

    Plan Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others) Total Submi ...

  7. Range锁(也即范围锁)

    浅析SQL Server在可序列化隔离级别下,防止幻读的范围锁的锁定问题 本文出处:http://www.cnblogs.com/wy123/p/7501261.html (保留出处并非什么原创作品权 ...

  8. windows go 安装

    go的安装很简单,下载go的msi文件 这里提供go1.9的msi下载链接 https://www.lanzous.com/i2gb54d 直接全部next就行,默认安装在了c盘的go 然后配置环境变 ...

  9. Arcengine 实现要素选取的方法(转载)

    转自原文Arcengine 实现要素选取的方法(转载) 选择一个要素或者一个要素集(FeatureSelection)的方法很多,如IMap::SelectByShape.ILayer::search ...

  10. 【u011】乘法难题

    Time Limit: 1 second Memory Limit: 128 MB [问题描述] 乘法难题是一种用一行的卡片来玩的单人游戏,每张卡片上有一个正整数.在游戏者从中拿出一卡片,并且得到一个 ...