1. 配置步骤

1.1. 检查当前PyTorch是否支持GPU

首先需要确认当前安装的PyTorch是否支持GPU。打开Python环境，运行以下代码：

import torch

print(f"PyTorch版本: {torch.__version__}")

print(f"CUDA是否可用: {torch.cuda.is_available()}")

print(f"当前设备: {torch.cuda.current_device() if torch.cuda.is_available() else 'CPU'}")

print(f"设备名称: {torch.cuda.get_device_name(0) if torch.cuda.is_available() else '无GPU设备'}")

如果输出显示CUDA是否可用: False，说明需要重新安装支持GPU的PyTorch版本。

我在默认安装 YOLO 之后，显示的就是False。

1.2. 卸载现有的torch库

如果当前PyTorch不支持GPU，需要先卸载相关库：

pip uninstall torch torchvision torchaudio

1.3. 查看本机GPU情况（Windows 11系统）

在Windows 11系统中，可以通过以下方式查看GPU信息：

按Win + X键，选择"任务管理器"
切换到"性能"选项卡
查看GPU信息，确认GPU型号和CUDA支持情况

或者使用命令行：

nvidia-smi

这将显示NVIDIA GPU的详细信息，包括CUDA版本。

我的电脑显示信息如下：

Sat Sep 27 17:35:25 2025

+-----------------------------------------------------------------------------------------+

| NVIDIA-SMI 556.12                 Driver Version: 556.12         CUDA Version: 12.5     |

|-----------------------------------------+------------------------+----------------------+

| GPU  Name                  Driver-Model | Bus-Id          Disp.A | Volatile Uncorr. ECC |

| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |

|                                         |                        |               MIG M. |

|=========================================+========================+======================|

|   0  NVIDIA GeForce RTX 2060      WDDM  |   00000000:01:00.0  On |                  N/A |

| N/A   35C    P8             14W /   80W |     937MiB /   6144MiB |     10%      Default |

|                                         |                        |                  N/A |

+-----------------------------------------+------------------------+----------------------+

1.4. 安装匹配的GPU版本PyTorch

从上面的命令显示结果来看，我的CUDA Version是 12.5。

所以应该使用如下命令安装：

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu125

但是，目前似乎没有提供cu125的版本，上面的命令会报错，于是安装了cu121版本。

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

至此，安装成功。

1.5. 验证GPU使用效果

安装成功后，运行验证代码：

import torch

from ultralytics import YOLO

# 检查GPU是否可用

print(f"CUDA是否可用: {torch.cuda.is_available()}")

print(f"设备名称: {torch.cuda.get_device_name(0) if torch.cuda.is_available() else '无GPU设备'}")

# 加载YOLO模型并指定使用GPU

model = YOLO('yolov11n.pt')  # 以YOLOv8n为例

results = model('path/to/your/test.mp4')

2. 性能对比

完成配置后，你会注意到：

训练速度：GPU训练通常比CPU快很多
推理速度：实时检测的帧率大幅提升
批量处理：GPU可以并行处理更多图像

在我的电脑上，换成GPU之后，那个test.mp4的处理速度从44秒多降到7秒多，大约快了6倍多。

我的显卡很一般，好的显卡效果更明显。

3. 常见问题解决

CUDA版本不匹配：确保安装的PyTorch版本与系统CUDA版本兼容
内存不足：如果遇到GPU内存不足，可以减小批量大小（batch size）
驱动问题：确保安装了最新的NVIDIA显卡驱动

4. 总结

通过将YOLO从CPU迁移到GPU，你可以显著提升模型训练和推理的效率。

这一简单的配置调整将为你的计算机视觉项目带来质的飞跃。

如果电脑有GPU，尽快替换吧！

让YOLO飞起来：从CPU到GPU的配置指南的更多相关文章

浅谈CPU和GPU的区别
导读: CPU和GPU之所以大不相同,是由于其设计目标的不同,它们分别针对了两种不同的应用场景.CPU需要很强的通用性来处理各种不同的数据类型,而GPU面对的则是类型高度统一的.相互无依赖的大规模数据 ...
CPU和GPU性能对比
计算20000次10000点的fft,分别使用CPU和GPU,得 the running time of cpu is : 2.3696s the running time of gpu is : 0 ...
CPU和GPU实现julia
CPU和GPU实现julia 主要目的是通过对比,学习研究如何编写CUDA程序.julia的算法还是有一定难度的,但不是重点.由于GPU实现了也是做图像识别程序,所以缺省的就是和O ...
图像重采样（CPU和GPU）
1 前言之前在写影像融合算法的时候,免不了要实现将多光谱影像重采样到全色大小.当时为了不影响融合算法整体开发进度,其中重采样功能用的是GDAL开源库中的Warp接口实现的. 后来发现GDAL War ...
CPU和GPU的区别
个人认为CPU和GPU各有自己的适应领域.CPU(Central Processing Unit)计算核心较少,通常是双核.四核.八核,但是拥有大量的共享缓存.预测.乱序执行等优化,可以做逻辑非常复杂 ...
CPU和GPU的差别
详见:http://blog.yemou.net/article/query/info/tytfjhfascvhzxcyt317 首先需要解释CPU和GPU这两个缩写分别代表什么.CPU即中央处理器, ...
Shader 入门笔记(二) CPU和GPU之间的通信
渲染流水线的起点是CPU,即应用阶段. 1)把数据加载到显存中 2)设置渲染状态,通俗说这些状态定义了场景中的网格是怎样被渲染的. 3)调用DrawCall,一个命令,CPU通知GPU.(这个命令仅仅 ...
Caffe源码理解2：SyncedMemory CPU和GPU间的数据同步
目录写在前面成员变量的含义及作用构造与析构内存同步管理参考博客:blog.shinelee.me | 博客园 | CSDN 写在前面在Caffe源码理解1中介绍了Blob类,其中的数据成 ...
（七） Keras 绘制网络结构和cpu，gpu切换
视频学习来源 https://www.bilibili.com/video/av40787141?from=search&seid=17003307842787199553 笔记首先安装py ...
Shader 入门笔记(二) CPU和GPU之间的通信,渲染流水线
渲染流水线 1)应用阶段(CPU处理) 首先,准备好场景数据(摄像机位置,视锥体,模型和光源等) 接着,做粗粒度剔除工作. 最后,设置好每个模型的渲染状态(使用的材质,纹理,shader等) 这一阶段 ...

随机推荐

腾讯云的devops自动化部署代替jenkins
起因 jenkins太耗内存了,经常导致服务器崩. 了解到devOps也是做类似的服务的,遂用之. serverless framework也可以做这个,但是截至目前,只能够打包node项目. dev ...
Rust修仙之道第十三章并行境 · 多线程、共享与消息灵道
第十三章:并行境 · 多线程.共享与消息灵道 "术者一身不可至万处,分灵影可并行化心." 顾行云于静室冥修,心观符阵延迟,渐悟:"纵术法再快,若不能并行,终受瓶颈所限.& ...
开发工具系列005-Hexo + gitub搭建个人博客教程
1.0 说明其实,搭建个人博客的技术方案有很多. 其实,你能找到的使用Hexo + Github搭建个人博客的教程也有很多. 所以,其实这是一篇没必要的文章,但因为种种原因我还是写了这篇简单的教程. ...
robots.txt 简单解析
简介 robots.txt 是一个规范,对于执行正常操作的爬虫理应遵守的规范. 例子博客园例子 https://www.cnblogs.com/robots.txt User-Agent: * Al ...
RestCloud iPaaS集成平台，企业系统快速集成
RestCloud iPaaS集成平台,为企业提供全面的业务系统集成解决方案.当今企业各业务系统间需要相互协助来完成业务,外部API依赖越来越多,同时系统运行在多个混合云环境及SaaS中,私有端大量业 ...
API服务平台，可视化编排流程
RestCloud API服务编排平台是指把微服务发布的API或业务系统的API服务接口(Restful.WebService.Dubbo)按照一定的业务逻辑和流程进行可视化编排的功能,编排后的API ...
SciTech-Mathmatics - Matrix Analysis(矩阵分析)-重要结论 + 特征值分解 + Matrix视为 Linear Space的变换与运算 + 任两个Vectors可通过Matrix变换互相转化 + 方阵(满秩)不改变向量维数
SciTech-Mathmatics - Matrix Analysis:矩阵分析 Matrix Analysis 重要结论 \(\large \text{ Matrix Transformation ...
Intuitive Vs Conceptive : Set/Number/Measure Theory + Real Analysis: Lebesgue Measure and Integration
Lebesgue's post-doctory thesis: Measure, length and area; Joseph Louis Bertrand's three different va ...
SciTech-BigDataAIML-Boltzmann constant波尔兹曼常数 + Boltzmann Machine波尔兹曼机模型
SciTech-BigDataAIML- Boltzmann constant
SciTech-Mathmatics-LinearAlgebra-特征分解/谱分解(Eigen decomposition)方阵分解出特征值和特征向量 + 矩阵函数视角: n维向量左乘n阶方阵化为数乘变换.
1 特征分解(Eigen decomposition) 注意:只有可对角化的矩阵才能进行特征分解特征分解(Eigen decomposition),又称谱分解(Spectral decomposit ...

让YOLO飞起来：从CPU到GPU的配置指南