因有需求需要改动centos7中的CUDA(更新到10)和GUP 的driver(更新到410)的版本。

事先需要查看原版本的信息,使用nvidia-smi可以查看driver的版本信息(最新的也显示CUDA的版本信息);使用nvcc –version查看CUDA的信息。

服务器的基本配置是:CUDA的原始版本是9.1.85,driver的原始版本是390.46,GPU的型号是Tesla P4,系统是centos7。(网上的教程说是先更新CUDA再更新driver,我也是按照上述步骤来的。)

首先,打开官网,勾选配置(https://developer.nvidia.com/cuda-toolkit-archive)

图1 CUDA的下载

(PS:Installer Type的选择没有那么重要,每一个选择都给出了相关的安装步骤)

直接给定步骤安装即可。对于CUDA,我选择了直接覆盖,所以在安装完这个版本的时候系统中会存在两个版本的CUDA,一个是CUDA9.1,一个是CUDA10.0。所以多版本需要配置环境,将CUDA10.0给添加到环境中。代码如下:

####sudo vim ~/.bashrc

export PATH=$PATH:/usr/local/cuda-10.0/bin${PATH:+:${PATH}}

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-10.0/lib64/{LD_LIBRARY_PATH:+:{ LD_LIBRARY_PATH }}

export CUDA_HOME=/usr/local/cuda-10.0

#跳出

#####nvcc –version

这时候应该输出的CUDA的信息是你选定的,如果还是原版,建议####sudo reboot(不允许重启,再想辙)

更新完CUDA之后,接着可以更新driver,打开官网:https://www.nvidia.com/Download/index.aspx?lang=cn,根据自己电脑的版本勾选信息,

图2 GPU的driver的下载

(PS:重要的事情说3遍,因为我的系统是centos7的,所以我选的“操作系统”是Linux 64-bit,如果选错了,之后会报错)

我选的是后缀是.run的安装包,使用的安装命令如下:

####sudo sh ******************************.run

(PS:安装的过程我是选择了先卸载,后安装,据说直接覆盖也是可以的)

安装成功之后在命令行中输入####nvidia-smi  ,有如下显示,则表示CUDA和driver升级成功!

自己遇到的坑:

1、使用nvidia-detect 命令检测,驱动发现符合的驱动版本是410.66,且不在yum中。对于不在yum中,我直接换了yum的环境,但是还是没有,最好的方法是直接下载,使用sudo wget “******(下载的链接)******”    下载的地址是(以CUDA为例),选择“下载按键”后单击右键,选择“复制链接地址”,这样即找到了下载的链接。

nvidia-detec推荐的是410.66的,官网上不一定有,一切以官网的为主。

2、     在GPU的驱动下载过程中,将操作系统(自己的操作系统是centos7)错误的选择了Linux 64-bit RHEL7(正确的应该是Linux 64-bit)。对于这个驱动,也是可以安装的,但是CUDA和驱动的版本并不匹配,所以使用####nvidia-smi命令会有如下的报错:

这样就不得不重新下载正确版本的driver,重新安装后才正确运行。

记:第一次更新服务器CUDA和GPU驱动的更多相关文章

  1. ubuntu16.04 Detectron目标检测库配置(包含GPU驱动,Cuda,Caffee2等配置梳理)

    Detectron概述 Detectron是Facebook FAIR开源了的一个目标检测(Object Detection)平台. 用一幅图简单说明下Object Detection.如Mask R ...

  2. [转]如何远程连接运行OpenGL/Cuda 等GPU程序

    发现一篇神文,解决了困扰许久的远程桌面OpenGL/GPU 等问题... 原地址在这:http://www.tanglei.name/how-to-run-gpu-programs-using-rem ...

  3. GPU驱动兼容性问题

    GPU驱动兼容性问题 问题描述: 将笔记本的GTX860M 的驱动升级到了376.09版本,出现登陆界面,输入密码后黑屏. 解决思路: 由于正常显示登陆窗口,且可以输入密码,基本排除硬件问题和集成显卡 ...

  4. zeromq学习记录(二)天气更新服务器使用ZMQ_SUB ZMQ_PUB

    /************************************************************** 技术博客 http://www.cnblogs.com/itdef/   ...

  5. linux上配置subversion服务器端安装配置并使用svn,windows本地检出,设置同步更新服务器的钩子

    参考http://my.oschina.net/junn/blog/164041 http://songxj.blog.51cto.com/620981/396113 http://5iwww.blo ...

  6. Zookeeper动态更新服务器列表

    -------------------------------------------------------------------------------------- [版权申明:本文系作者原创 ...

  7. 为什么作为下游的WSUS更新服务器总有一直处于下载状态的文件

    /* Style Definitions */ table.MsoNormalTable {mso-style-name:普通表格; mso-tstyle-rowband-size:0; mso-ts ...

  8. 记一次服务器路由跟踪 (2019-01-23 TODO)

    记一次服务器路由跟踪 有用户反馈网站 无法访问. 现象如下: ping 没有反馈,确认了可以 ping 通其它的网站. tracert 跟踪到服务器商的内部就没的反应了. 同样一家的服务器商,另外一台 ...

  9. Openfire更新服务器名称的方法

    转自:http://blog.csdn.net/vikione/article/details/5996932 Openfire更新服务器名称的方法: 1.登陆openfire管理页面,在主页面下方选 ...

随机推荐

  1. event对象中offsetX,clientX,pageX,screenX的区别

    1.offsetXoffset意为偏移量,是事件对象距左上角为参考原点的距离.以元素盒子模型的内容区域的左上角为参考点.不包括border.2.clientX事件对象相对于浏览器窗口可视区域的X,Y坐 ...

  2. C++、java、python的一些区别

    1.变量类型 变量赋值命名不同 Python 中的变量赋值不需要类型声明 counter = 100 # 赋值整型变量 miles = 1000.0 # 浮点型 name = "John&q ...

  3. 对Serverless的研究

    1. 引言 Serverless 是一种 “无服务器架构”,让用户无需关心程序运行环境.资源及数量,只要将精力 Focus 到业务逻辑上的技术. 现在公司已经实现 DevOps 化,正在向 Serve ...

  4. 10. ClustrixDB 故障恢复管理

    一.前端网络故障 如果节点无法在其前端以太网网络端口上进行通信,例如,由于意外的电缆拉拔.交换机配置错误或NIC故障,则不需要人工干预.集群采取以下行动: 没有将其他连接分配给失败的实例. 如果失败的 ...

  5. Cassandra 安装部署

    Linux 系统安装Cassandra 一.Cassandra需要安装jdk支持,首先安装jdk 自行百度查找安装 二.下载Cassandra 官网地址: https://cassandra.apac ...

  6. UI编辑

    UI编辑 基本部件介绍 (1)Layout(布局) (2)Space(空间) (3)Button (4)ItemView (5)ItemWidget Widget继承自View,即ListWidget ...

  7. golang rabbitmq实践 (一 rabbitmq配置)

    1:环境选择 系统为ubuntu 15.04 ,我装在虚拟机里面的 2:rabbitmq tabbitmq 3.5.4  download url : http://www.rabbitmq.com/ ...

  8. 进程and线程and协程效率对比

    1.进程与进程池的效率对比 多进程:p.start()过程中,只是向操作系统发送一个信号,至于什么时候执行,都是操作系统的事情,操作系统接收到信号时,帮该进程申请一块内存空间+拷贝父进程的地址空间 # ...

  9. ModelSerializer 使用知识点_序列化和反序列化用法区别

    1.ModelSerializer  如下 from api_test.errorCode.errorCode import Statusclass RelatedbSerializer(serial ...

  10. macOS 更新 git 命令提示 xcrun,.gitignore 配置不生效问题。

    macOS 更新 运行git提示xcrun: error: invalid active developer path 在终端输入 xcode-select --install 即可以解决该问题 .g ...