参考:

https://blog.csdn.net/TracelessLe/article/details/107405544

====================================================

发现了一个python版本的可以查看和管理NVIDIA显卡的工具pynvml,安装方法:

pip install nvidia-ml-py

在这个库的基础上自己写了一个小程序,用来监控GPU的使用情况:

import psutil
import pynvml #导包 UNIT = 1024 * 1024 pynvml.nvmlInit() #初始化
gpuDeriveInfo = pynvml.nvmlSystemGetDriverVersion()
print("Drive版本: ", str(gpuDeriveInfo, encoding='utf-8')) #显示驱动信息 gpuDeviceCount = pynvml.nvmlDeviceGetCount()#获取Nvidia GPU块数
print("GPU个数:", gpuDeviceCount ) for i in range(gpuDeviceCount):
handle = pynvml.nvmlDeviceGetHandleByIndex(i)#获取GPU i的handle,后续通过handle来处理 memoryInfo = pynvml.nvmlDeviceGetMemoryInfo(handle)#通过handle获取GPU i的信息 gpuName = str(pynvml.nvmlDeviceGetName(handle), encoding='utf-8') gpuTemperature = pynvml.nvmlDeviceGetTemperature(handle, 0) gpuFanSpeed = pynvml.nvmlDeviceGetFanSpeed(handle) gpuPowerState = pynvml.nvmlDeviceGetPowerState(handle) gpuUtilRate = pynvml.nvmlDeviceGetUtilizationRates(handle).gpu
gpuMemoryRate = pynvml.nvmlDeviceGetUtilizationRates(handle).memory print("第 %d 张卡:"%i, "-"*30)
print("显卡名:", gpuName)
print("内存总容量:", memoryInfo.total/UNIT, "MB")
print("使用容量:", memoryInfo.used/UNIT, "MB")
print("剩余容量:", memoryInfo.free/UNIT, "MB")
print("显存空闲率:", memoryInfo.free/memoryInfo.total)
print("温度:", gpuTemperature, "摄氏度")
print("风扇速率:", gpuFanSpeed)
print("供电水平:", gpuPowerState)
print("gpu计算核心满速使用率:", gpuUtilRate)
print("gpu内存读写满速使用率:", gpuMemoryRate)
print("内存占用率:", memoryInfo.used/memoryInfo.total) """
# 设置显卡工作模式
# 设置完显卡驱动模式后,需要重启才能生效
# 0 为 WDDM模式,1为TCC 模式
gpuMode = 0 # WDDM
gpuMode = 1 # TCC
pynvml.nvmlDeviceSetDriverModel(handle, gpuMode)
# 很多显卡不支持设置模式,会报错
# pynvml.nvml.NVMLError_NotSupported: Not Supported
""" # 对pid的gpu消耗进行统计
pidAllInfo = pynvml.nvmlDeviceGetComputeRunningProcesses(handle)#获取所有GPU上正在运行的进程信息
for pidInfo in pidAllInfo:
pidUser = psutil.Process(pidInfo.pid).username()
print("进程pid:", pidInfo.pid, "用户名:", pidUser,
"显存占有:", pidInfo.usedGpuMemory/UNIT, "Mb") # 统计某pid使用的显存 pynvml.nvmlShutdown() #最后关闭管理工具

输出:

Drive版本:  470.63.01
GPU个数: 4
第 0 张卡: ------------------------------
显卡名: NVIDIA GeForce RTX 3090
内存总容量: 24268.3125 MB
使用容量: 14168.625 MB
剩余容量: 10099.6875 MB
显存空闲率: 0.41616768780276747
温度: 59 摄氏度
风扇速率: 51
供电水平: 2
gpu计算核心满速使用率: 46
gpu内存读写满速使用率: 46
内存占用率: 0.5838323121972325
进程pid: 68028 用户名: xxxxxx 显存占有: 14165.0 Mb
第 1 张卡: ------------------------------
显卡名: NVIDIA GeForce RTX 3090
内存总容量: 24268.3125 MB
使用容量: 3.625 MB
剩余容量: 24264.6875 MB
显存空闲率: 0.9998506282626779
温度: 32 摄氏度
风扇速率: 30
供电水平: 8
gpu计算核心满速使用率: 0
gpu内存读写满速使用率: 0
内存占用率: 0.0001493717373220738
第 2 张卡: ------------------------------
显卡名: NVIDIA GeForce RTX 3090
内存总容量: 24268.3125 MB
使用容量: 3.625 MB
剩余容量: 24264.6875 MB
显存空闲率: 0.9998506282626779
温度: 33 摄氏度
风扇速率: 30
供电水平: 8
gpu计算核心满速使用率: 0
gpu内存读写满速使用率: 0
内存占用率: 0.0001493717373220738
第 3 张卡: ------------------------------
显卡名: NVIDIA GeForce RTX 3090
内存总容量: 24268.3125 MB
使用容量: 3.625 MB
剩余容量: 24264.6875 MB
显存空闲率: 0.9998506282626779
温度: 33 摄氏度
风扇速率: 30
供电水平: 8
gpu计算核心满速使用率: 0
gpu内存读写满速使用率: 0
内存占用率: 0.0001493717373220738

注意的是上面代码需要安装第三方依赖库:psutil

相关资料:

[1] NVIDIA官方GPU管理和部署文档
[2] 【Python管理GPU】pynvml工具的安装与使用
[3] pypi下的nvidia-ml-py包

https://pythonhosted.org/nvidia-ml-py/

https://github.com/gpuopenanalytics/pynvml

==================================================

Python使用pynvml查看GPU信息的更多相关文章

  1. 【MonkeyRunner】[技术博客]用python编写脚本查看设备信息

    [MonkeyRunner]用python编写脚本查看设备信息 原以为是个简单的操作,在实践的时候发现了一些问题. python脚本 test.py: from com.android.monkeyr ...

  2. 【tensorflow基础】TensorFlow查看GPU信息

    re 1. TensorFlow查看GPU信息; end

  3. pytorch中查看gpu信息

    其他:windows使用nvidia-smi查看gpu信息 为什么将数据转移至GPU的方法叫做.cuda而不是.gpu,就像将数据转移至CPU调用的方法是.cpu?这是因为GPU的编程接口采用CUDA ...

  4. Linux查看GPU信息和使用情况

    Linux查看显卡信息: lspci | grep -i vga 使用nvidia GPU可以: lspci | grep -i nvidia [root@gpu-server-002 ~]# lsp ...

  5. 如何在linux下查看gpu信息

    ~$ lspci | grep -i vga01:00.0 VGA compatible controller: NVIDIA Corporation GF119 [GeForce GT 610] ( ...

  6. 怎么用 pytorch 查看 GPU 信息

    如果你用的 Keras 或者 TensorFlow, 请移步 怎么查看keras 或者 tensorflow 正在使用的GPU In [1]: import torch In [2]: torch.c ...

  7. linux 查看gpu信息

  8. 新手篇丨Python任意网段Web端口信息探测工具

    你学习Python的目的是什么?是想写爬虫爬取数据(数据.图片等内容),还是想自写自动化的小工具,又或是作为一个新手小白单纯的欣赏这门语言呢? 今天i春秋分享的是一篇关于多线程工具的文章,工具使用效率 ...

  9. ubuntu 查看进程信息

    查看进程信息 ps ps -aux 查看所有进程,每行一个程序 top 显示当前运行程序 kill 98 (98为PID号,) kill -9 98 (强制杀死98) ps -e Linux如何查看端 ...

  10. python爬虫之User-Agent用户信息

    python爬虫之User-Agent用户信息 爬虫是自动的爬取网站信息,实质上我们也只是一段代码,并不是真正的浏览器用户,加上User-Agent(用户代理,简称UA)信息,只是让我们伪装成一个浏览 ...

随机推荐

  1. 《Android开发卷——自定义日期选择器(二)》

    (小米手机) (中兴手机) 在上一篇中,我介绍了一般公司都会自定义时间日期选择器,并结合自己所做的项目给大家参考. 工作实录之<Android开发卷--自定义日期选择器(一)>链接:htt ...

  2. MapStruct - 注解汇总

    @Mapper @Mapper 将接口或抽象类标记为映射器,并自动生成映射实现类代码. public @interface Mapper { // 引入其他其他映射器 Class<?>[] ...

  3. Interceptor拦截器demo

    Interceptor拦截器demo ##接口测试类 @RestController public class TestController { @RequestMapping(value = &qu ...

  4. Nuxt 3 路由系统详解:配置与实践指南

    title: Nuxt 3 路由系统详解:配置与实践指南 date: 2024/6/21 updated: 2024/6/21 author: cmdragon excerpt: 摘要:本文是一份关于 ...

  5. HDU1010第一道DFS

    DFS就是深度搜索算法....感觉就像破案一样.... #include<iostream> #include<cstdio> #include<cstring> ...

  6. 通俗易懂的路径搜索之A-star算法

    A-star算法 搜索技术 搜索技术是一种通用的问题求解技术,可以将待解决的问题转化为可搜索的问题空间,然后在该空间中搜索求解.搜索技术在人工智能领域有着非常广泛的应用. 盲目搜索 盲目搜索是最简单的 ...

  7. Android 官方AB Update说明

    Android 官方AB Update说明 A/B 系统更新,也称为无缝更新,用于确保可运行的启动系统在无线 (OTA) 更新期间能够保留在磁盘上.这样可以降低更新之后设备无法启动的可能性,也就是说, ...

  8. 本地自建KMS服务器

    本地自建KMS服务器 本地自建KMS服务器 一.前期准备 下载安装以下软件.文件: VMware Github中的开源项目:vlmcsd 二.在VMware下部署KMS服务器 解压vlmcsd项目中r ...

  9. Nginx负载配置

    目录 Nginx 负载均衡笔记 1. 概述 1.1 Nginx 简介 1.2 负载均衡概述 2. 四层负载均衡(传输层) 2.1 工作原理 2.2 特点 2.3 优缺点 优点 缺点 2.4 示例场景 ...

  10. 树莓派4B-GPIO控制舵机转动

    树莓派4B-GPIO控制舵机转动 硬件需求: 树莓派 舵机 杜邦线 舵机 什么是舵机? 舵机(servomotor)是一种简化版本的伺服电机,是位置伺服的驱动器,能够通过输入PWM信号控制旋转角度,具 ...