记:第一次更新服务器CUDA和GPU驱动
因有需求需要改动centos7中的CUDA(更新到10)和GUP 的driver(更新到410)的版本。
事先需要查看原版本的信息,使用nvidia-smi可以查看driver的版本信息(最新的也显示CUDA的版本信息);使用nvcc –version查看CUDA的信息。
服务器的基本配置是:CUDA的原始版本是9.1.85,driver的原始版本是390.46,GPU的型号是Tesla P4,系统是centos7。(网上的教程说是先更新CUDA再更新driver,我也是按照上述步骤来的。)
首先,打开官网,勾选配置(https://developer.nvidia.com/cuda-toolkit-archive)

图1 CUDA的下载
(PS:Installer Type的选择没有那么重要,每一个选择都给出了相关的安装步骤)
直接给定步骤安装即可。对于CUDA,我选择了直接覆盖,所以在安装完这个版本的时候系统中会存在两个版本的CUDA,一个是CUDA9.1,一个是CUDA10.0。所以多版本需要配置环境,将CUDA10.0给添加到环境中。代码如下:
####sudo vim ~/.bashrc
export PATH=$PATH:/usr/local/cuda-10.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-10.0/lib64/{LD_LIBRARY_PATH:+:{ LD_LIBRARY_PATH }}
export CUDA_HOME=/usr/local/cuda-10.0
#跳出
#####nvcc –version
这时候应该输出的CUDA的信息是你选定的,如果还是原版,建议####sudo reboot(不允许重启,再想辙)
更新完CUDA之后,接着可以更新driver,打开官网:https://www.nvidia.com/Download/index.aspx?lang=cn,根据自己电脑的版本勾选信息,

图2 GPU的driver的下载
(PS:重要的事情说3遍,因为我的系统是centos7的,所以我选的“操作系统”是Linux 64-bit,如果选错了,之后会报错)
我选的是后缀是.run的安装包,使用的安装命令如下:
####sudo sh ******************************.run
(PS:安装的过程我是选择了先卸载,后安装,据说直接覆盖也是可以的)
安装成功之后在命令行中输入####nvidia-smi ,有如下显示,则表示CUDA和driver升级成功!

自己遇到的坑:
1、使用nvidia-detect 命令检测,驱动发现符合的驱动版本是410.66,且不在yum中。对于不在yum中,我直接换了yum的环境,但是还是没有,最好的方法是直接下载,使用sudo wget “******(下载的链接)******” 下载的地址是(以CUDA为例),选择“下载按键”后单击右键,选择“复制链接地址”,这样即找到了下载的链接。

nvidia-detec推荐的是410.66的,官网上不一定有,一切以官网的为主。
2、 在GPU的驱动下载过程中,将操作系统(自己的操作系统是centos7)错误的选择了Linux 64-bit RHEL7(正确的应该是Linux 64-bit)。对于这个驱动,也是可以安装的,但是CUDA和驱动的版本并不匹配,所以使用####nvidia-smi命令会有如下的报错:

这样就不得不重新下载正确版本的driver,重新安装后才正确运行。
记:第一次更新服务器CUDA和GPU驱动的更多相关文章
- ubuntu16.04 Detectron目标检测库配置(包含GPU驱动,Cuda,Caffee2等配置梳理)
Detectron概述 Detectron是Facebook FAIR开源了的一个目标检测(Object Detection)平台. 用一幅图简单说明下Object Detection.如Mask R ...
- [转]如何远程连接运行OpenGL/Cuda 等GPU程序
发现一篇神文,解决了困扰许久的远程桌面OpenGL/GPU 等问题... 原地址在这:http://www.tanglei.name/how-to-run-gpu-programs-using-rem ...
- GPU驱动兼容性问题
GPU驱动兼容性问题 问题描述: 将笔记本的GTX860M 的驱动升级到了376.09版本,出现登陆界面,输入密码后黑屏. 解决思路: 由于正常显示登陆窗口,且可以输入密码,基本排除硬件问题和集成显卡 ...
- zeromq学习记录(二)天气更新服务器使用ZMQ_SUB ZMQ_PUB
/************************************************************** 技术博客 http://www.cnblogs.com/itdef/ ...
- linux上配置subversion服务器端安装配置并使用svn,windows本地检出,设置同步更新服务器的钩子
参考http://my.oschina.net/junn/blog/164041 http://songxj.blog.51cto.com/620981/396113 http://5iwww.blo ...
- Zookeeper动态更新服务器列表
-------------------------------------------------------------------------------------- [版权申明:本文系作者原创 ...
- 为什么作为下游的WSUS更新服务器总有一直处于下载状态的文件
/* Style Definitions */ table.MsoNormalTable {mso-style-name:普通表格; mso-tstyle-rowband-size:0; mso-ts ...
- 记一次服务器路由跟踪 (2019-01-23 TODO)
记一次服务器路由跟踪 有用户反馈网站 无法访问. 现象如下: ping 没有反馈,确认了可以 ping 通其它的网站. tracert 跟踪到服务器商的内部就没的反应了. 同样一家的服务器商,另外一台 ...
- Openfire更新服务器名称的方法
转自:http://blog.csdn.net/vikione/article/details/5996932 Openfire更新服务器名称的方法: 1.登陆openfire管理页面,在主页面下方选 ...
随机推荐
- event对象中offsetX,clientX,pageX,screenX的区别
1.offsetXoffset意为偏移量,是事件对象距左上角为参考原点的距离.以元素盒子模型的内容区域的左上角为参考点.不包括border.2.clientX事件对象相对于浏览器窗口可视区域的X,Y坐 ...
- C++、java、python的一些区别
1.变量类型 变量赋值命名不同 Python 中的变量赋值不需要类型声明 counter = 100 # 赋值整型变量 miles = 1000.0 # 浮点型 name = "John&q ...
- 对Serverless的研究
1. 引言 Serverless 是一种 “无服务器架构”,让用户无需关心程序运行环境.资源及数量,只要将精力 Focus 到业务逻辑上的技术. 现在公司已经实现 DevOps 化,正在向 Serve ...
- 10. ClustrixDB 故障恢复管理
一.前端网络故障 如果节点无法在其前端以太网网络端口上进行通信,例如,由于意外的电缆拉拔.交换机配置错误或NIC故障,则不需要人工干预.集群采取以下行动: 没有将其他连接分配给失败的实例. 如果失败的 ...
- Cassandra 安装部署
Linux 系统安装Cassandra 一.Cassandra需要安装jdk支持,首先安装jdk 自行百度查找安装 二.下载Cassandra 官网地址: https://cassandra.apac ...
- UI编辑
UI编辑 基本部件介绍 (1)Layout(布局) (2)Space(空间) (3)Button (4)ItemView (5)ItemWidget Widget继承自View,即ListWidget ...
- golang rabbitmq实践 (一 rabbitmq配置)
1:环境选择 系统为ubuntu 15.04 ,我装在虚拟机里面的 2:rabbitmq tabbitmq 3.5.4 download url : http://www.rabbitmq.com/ ...
- 进程and线程and协程效率对比
1.进程与进程池的效率对比 多进程:p.start()过程中,只是向操作系统发送一个信号,至于什么时候执行,都是操作系统的事情,操作系统接收到信号时,帮该进程申请一块内存空间+拷贝父进程的地址空间 # ...
- ModelSerializer 使用知识点_序列化和反序列化用法区别
1.ModelSerializer 如下 from api_test.errorCode.errorCode import Statusclass RelatedbSerializer(serial ...
- macOS 更新 git 命令提示 xcrun,.gitignore 配置不生效问题。
macOS 更新 运行git提示xcrun: error: invalid active developer path 在终端输入 xcode-select --install 即可以解决该问题 .g ...