LLM研究之-NVIDIA的CUDA
一、什么是NVIDIA的CUDA
CUDA(Compute Unified Device Architecture)是由NVIDIA公司开发的一个并行计算平台和应用程序编程接口(API),它允许软件开发者和软件工程师使用NVIDIA的图形处理单元(GPU)来进行通用计算。简而言之,CUDA让开发者能够利用NVIDIA的GPU进行高效能的计算工作,这通常被称为GPGPU(通用计算图形处理单元)。
CUDA提供了一种相对简便的方法来进行并行处理,因为它允许开发者使用类似于C、C++和Fortran这样的高级编程语言来编写代码。通过CUDA,开发者可以创建能够由GPU执行的算法,从而处理复杂数学和物理问题,这在只使用传统的中央处理单元(CPU)时可能是非常耗时的。
CUDA架构包括几个关键的组成部分:
CUDA核心 - 由多个能够并行处理任务的核心组成,它们可以同时执行成百上千的线程。
CUDA内存管理 - 提供了对GPU内存的高效管理方法,包括全局内存、共享内存和常量内存等。
CUDA并行计算线程 - 一个GPU可以创建和管理成千上万个并行线程,这些线程可以分组执行,提高数据处理的效率。
CUDA工具链 - 包括编译器、调试器和性能分析工具,帮助开发者优化其GPU代码。
CUDA被广泛应用于科学计算、工程、医学成像、视频和图像处理、机器学习等领域,因为这些领域通常需要大量的并行计算能力。例如,在深度学习中,CUDA使得神经网络的训练通过GPU加速变得可能,大幅缩短了所需的时间。
二、查看已经安装的CUDA
在Ubuntu系统中,你可以通过以下几种方式来检查已安装的CUDA版本:
使用
nvcc
命令:nvcc
是NVIDIA CUDA编译器工具。你可以通过命令行运行以下命令来查看其版本:nvcc --version
这将输出CUDA编译器的版本信息。
检查CUDA目录:
CUDA通常安装在/usr/local/cuda
目录下。你可以检查这个目录下的版本号:ls -l /usr/local/cuda
通常,这个目录是指向当前安装的CUDA版本的一个符号链接。
使用
dpkg
查询:
如果你是通过apt
或dpkg
安装的CUDA,可以用以下命令来查询安装的包:dpkg -l | grep cuda
这将列出所有包含“cuda”名称的包,你可以从中找到CUDA Toolkit的相关信息。
查看环境变量:
如果你设置了环境变量CUDA_HOME
或CUDA_PATH
,这些变量通常指向CUDA安装的位置。你可以打印它们的值:echo $CUDA_HOME
echo $CUDA_PATH
三、ubuntu下如何安装CUDA
在Ubuntu下安装CUDA Toolkit,你可以按照以下步骤进行:
检查NVIDIA GPU:
首先,确认你的系统中有NVIDIA GPU,并且它支持CUDA。你可以使用lspci | grep -i nvidia
命令查看GPU信息。移除旧版本的NVIDIA驱动:
如果你之前安装过NVIDIA驱动,你可能需要先卸载它们,以避免潜在的冲突。使用以下命令:sudo apt-get purge nvidia*
安装NVIDIA驱动:
你可以通过Ubuntu的额外驱动工具安装或者从NVIDIA官网下载合适的驱动。安装驱动的命令如下:sudo ubuntu-drivers autoinstall
下载CUDA Toolkit:
前往NVIDIA CUDA Toolkit下载页面(https://developer.nvidia.com/cuda-downloads)并选择适合你Ubuntu版本的安装包。你可以选择`.deb`文件。安装CUDA Toolkit:
假设你下载了适合你Ubuntu版本的.deb
文件,你可以使用以下命令安装CUDA Toolkit:sudo dpkg -i cuda-repo-<distro>_<version>_amd64.deb
sudo apt-key adv --fetch-keys http://developer.download.nvidia.com/compute/cuda/repos/<distro>/x86_64/7fa2af80.pub
sudo apt-get update
sudo apt-get install cuda
其中
<distro>
和<version>
需要替换成你下载的文件对应的发行版和版本号。设置环境变量:
打开你的.bashrc
文件,添加以下行来设置环境变量:export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
然后,使改动生效:
source ~/.bashrc
重启电脑:
安装完成后,重启你的电脑以确保所有驱动和变量设置正确加载。验证CUDA安装:
安装完成后,你可以通过运行nvcc --version
来验证CUDA编译器是否正确安装。为了测试整个CUDA Toolkit,你可以尝试编译并运行NVIDIA提供的示例程序。
四、ubuntu下如何升级CUDA
在Ubuntu系统上升级CUDA Toolkit需要谨慎进行,因为这可能会影响依赖于CUDA的应用程序。以下是升级CUDA的一般步骤:
备份重要数据:
在进行升级之前,确保备份你的重要数据和工作,以防升级过程中出现问题。卸载旧版本CUDA:
你可以使用以下命令来卸载旧版本的CUDA Toolkit:sudo apt-get --purge remove "*cuda*"
sudo apt-get --purge remove "*nvidia*"
这将移除当前安装的CUDA版本和相关的NVIDIA驱动程序。
清理系统:
清理系统中不再需要的依赖和包:sudo apt-get autoremove
sudo apt-get autoclean
安装新版本的NVIDIA驱动:
确保安装与新版本CUDA兼容的NVIDIA驱动。可以通过Ubuntu的额外驱动工具或从NVIDIA官网下载安装。下载新版本的CUDA Toolkit:
前往NVIDIA官方网站下载最新版本的CUDA Toolkit(https://developer.nvidia.com/cuda-downloads)。安装新版本的CUDA Toolkit:
根据下载的CUDA版本,使用dpkg
和apt-get
命令安装新版本的CUDA Toolkit。例如:sudo dpkg -i cuda-repo-<distro>_<version>_amd64.deb
sudo apt-key adv --fetch-keys http://developer.download.nvidia.com/compute/cuda/repos/<distro>/x86_64/7fa2af80.pub
sudo apt-get update
sudo apt-get install cuda
其中
<distro>
和<version>
需要替换成你下载的文件对应的发行版和版本号。更新环境变量:
更新.bashrc
文件,将CUDA的路径设置为新版本的路径:export PATH=/usr/local/cuda-<new_version>/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-<new_version>/lib64:$LD_LIBRARY_PATH
替换
<new_version>
为你安装的新版本号,然后运行source ~/.bashrc
使更改生效。重启电脑:
重启你的电脑以确保所有的驱动和环境变量设置正确加载。验证新版本的CUDA:
使用nvcc --version
命令来验证新版本的CUDA编译器是否安装成功。
LLM研究之-NVIDIA的CUDA的更多相关文章
- Nvidia的CUDA库现在恢复使用了
Nvidia的CUDA库现在恢复使用了 由于早期版本存在兼容问题,从去年8月nvidia-cuda-toolkit包被移除了.现在该软件包更新后,又重新可以用,被重新添加到Kali Linux软件 ...
- # Ubuntu16.04安装nvidia驱动+CUDA+cuDNN
Ubuntu16.04安装nvidia驱动+CUDA+cuDNN 准备工作 1.查看GPU是否支持CUDA lspci | grep -i nvidia 2.查看Linux版本 uname -m &a ...
- Ubuntu系统---“NVIDIA 驱动+CUDA+cuDNN ”之后 OpenCV安装
Ubuntu系统---“NVIDIA 驱动+CUDA+cuDNN ”之后 OpenCV安装 目录: 一.OpenCV安装包下载 二.cmake安装 三.OpenCV安装 正文 一.OpenCV安装包下 ...
- 在NVIDIA(CUDA,CUBLAS)和Intel MKL上快速实现BERT推理
在NVIDIA(CUDA,CUBLAS)和Intel MKL上快速实现BERT推理 直接在NVIDIA(CUDA,CUBLAS)或Intel MKL上进行高度定制和优化的BERT推理,而无需tenso ...
- ubuntu16.04安装nvidia ,cuda(待完善)
ubuntu16.04安装nvidia 1.首先查看自己的pc显卡的型号 ubuntu16.04 查看方法: 查看GPU型号 :lspci | grep -i nvidia 查看NVIDIA驱动版本: ...
- Ubuntu18.04安装RTX2080Ti+NVIDIA驱动+CUDA
Ubuntu18.04安装RTX 2080Ti 与 Cuda10 ==========血泪更新========= 如果可以使用ppa安装最方便了 具体参考:https://www.cnblogs.co ...
- win10下检查nvidia显卡支持的cuda版本
1.首先将[C:\Program Files\NVIDIA Corporation\NVSMI]添加至系统环境变量[path]中: 2.在powershell中使用命令[nvidia-smi],即可看 ...
- ubuntu显卡(NVIDIA)驱动以及对应版本cuda&cudnn安装
(已禁用集显,禁用方法可自行百度) 驱动在线安装方式进入tty文本模式ctrl+alt+F1关闭显示服务sudo service lightdm stop卸载原有驱动sudo apt-get remo ...
- 问题记录 | deepin15.10重装nvidia驱动及cuda
问题描述: nvidia-smi也有显示,显卡驱动是在的,而且nvcc显示出来的cuda版本9.0也没错,不是9.1.不知道问题所在,索性重装全部. sudo tee /proc/acpi/bbswi ...
- NVIDIA驱动安装、CUDA安装、cudnn安装
1.禁用 nouveau 驱动 sudo vim /etc/modprobe.d/nvidia-installer-disable-nouveau.conf 或者 sudo vim /etc/modp ...
随机推荐
- 使用markdown语法做笔记,相比txt多了很多样式
- css - 隐藏body滚动条
body::-webkit-scrollbar{ display: none; }
- 战略设计- DDD
随着系统的增长,它会变得越来越复杂,当我们无法通过分析对象来理解系统的时候,就需要掌握一些操纵和理解大模型的技术了.本文将介绍一些原则.遵循这些原则,就可以对非常复杂的领域进行建模.大部分这样的决策都 ...
- [转帖][java] GC (Allocation Failure)日志分析
日前查看某个程序的日志,发现一直在报GC相关的信息,不确定这样的信息是代表正确还是不正确,所以正好借此机会再复习下GC相关的内容: 以其中一行为例来解读下日志信息: [GC (Allocation F ...
- [转帖]Oracle中INITRANS和MAXTRANS参数
每个块都有一个块首部.这个块首部中有一个事务表.事务表中会建立一些条目来描述哪些事务将块上的哪些行/元素锁定.这个事务表的初始大小由对象的INITRANS 设置指定.对于表,这个值默认为2(索引的IN ...
- [转帖]DOCKER默认网段和主机网段冲突解决
https://www.cnblogs.com/yinliang/p/13189334.html 一. docker默认网卡docker0 172.17.0.0可能会与主机冲突,这时候需要修改dock ...
- [转帖]FIO 存储性能压测
一. FIO简介 FIO 是一个多线程IO生成工具,可以生成多种IO模式(随机.顺序.读.写四大类),用来测试磁盘设备的性能.GFIO是FIO的图形监测工具,它提供了图形界面的参数配置,和性能监测图像 ...
- [转帖]人人都应该知道的CPU缓存运行效率
https://zhuanlan.zhihu.com/p/628017496 提到CPU性能,大部分同学想到的都是CPU利用率,这个指标确实应该首先被关注.但是除了利用率之外,还有很容易被人忽视的指标 ...
- [转帖] Linux命令拾遗-网络抓包工具
https://www.cnblogs.com/codelogs/p/16060684.html 简介# Linux中有很多抓包工具,如ngrep.tcpdump与tshark等,它们有很多用法与使用 ...
- ELK搭建简单说明
ELK搭建简单说明 简单说明 周天陪孩子学习,自己简单研究了下如何处理 不是很系统,仅是能够展示部分文件的日志. 需要有很多坑需要进行填充. 搭建模式 自己采取rpm包方式进行搭建 183 机器上面安 ...