Ubuntu server16.04安装配置驱动418.87、cuda10.1、cudnn7.6.4.38、anaconda、pytorch超详细解决

本篇博文根据本人亲装碰到的问题搜集总结而成,具体参考见结尾REFERENCE

安装GCC

服务器版未装有gcc,但英伟达驱动安装需要gcc,尝试过换源、更新软件库、以及overstack的几种方法均未能解决,最终发现可以通过安装build-essential软件包来解决问题,它会安装一堆新包,包括gcc, g++和make。

sudo apt install build-essential

安装NVIDIA驱动

由于直接安装cuda如果选择安装驱动会直接版本较低的驱动,所以采用先装驱动后装cuda的方式。

1. 卸载原有驱动(没装跳过)

  1. 方法一、通用sudo apt-get remove –purge nvidia*
  2. 方法二、 非官网驱动sudo apt-get remove --purge nvidia(版本全称,如我的nvidia-384.130)
  3. 方法三、官网驱动 sh ./nvidia.run --uninstall

2. 禁用nouveau

安装NVIDIA需要先禁用系统自带的驱动

  1. 打开文件sudo gedit /etc/modprobe.d/blacklist.conf

  2. 在文本末尾添加

    blacklist nouveau
    option nouveau modeset=0

    无视warn

  3. wq, 执行sudo update-initramfs -u

  4. 检测,lsmod | grep nouveau,没有任何输出说明禁用成功

3. 安装NVIDIA显卡驱动

  1. 查看支持的驱动版本

    sudo apt-cache search nvidia*,一般安装大于等于最大的版本就好,我安装的是418.87

  2. 下载NVIDIA驱动,

    官网地址

  3. 禁用X服务(最好有一台备用电脑,因为这一步会黑屏...因为我是采用ssh连接,所以对我没影响)

    sudo service lightdm stop

  4. 给文件赋执行权限并cd到下载目录

    cd ~
    sudo chmod a+x NVIDIA-Linux-x86_64-384.130.run
  5. 安装

    sudo sh ./NVIDIA-Linux-x86_64-375.20.run –no-opengl-files

  6. 检测是否成功 nvidia-smi

安装CUDA10.1

  1. 官网地址

  2. 禁用X服务(黑屏)

    sudo service lightdm stop

  3. 给文件赋执行权限并安装

    sudo chmod a+x cuda_10.1.243_418.87.00_linux.run
    
    sudo sh cuda_10.1.243_418.87.00_linux.run --override

    accepted, 除了驱动不选择,其他都选。

  4. 打开配置文件 vim ~/.bashrc,末尾写入

    export PATH=/usr/local/cuda-10.1/bin:$PATH
    export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

    生效 source ~/.bashrc

  5. 检测是否成功 nvcc -V

安装cudnn

  1. 官网下载,找到与cuda版本配对的cudnn,查看官网配对,以及更全的版本配对,我的cuda为10.1所以,cudnn选的是7.6.4

  2. 将下载的添加为压缩包并解压

    # compression
    cp cudnn-8.0-linux-x64-v5.1.solitairetheme8 good.tgz
    # decompression
    tar -xvf good.tgz
  3. 安装,其实就是改变文件位置和权限

    sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
    $ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/ -d
    $ sudo chmod a+r /usr/local/cuda/include/cudnn.h
    $ sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
  4. 查看cudnn版本:

    cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2


以上便配置好服务器,以下为非root用户根据需要安装。

我安装的是anaconda、tensorflow、pytorch

安装anaconda

  1. 卸载anaconda(如有) rm-rf ~/anaconda,然后修改配置文件~/.bashrc

  2. 官网下载并安装

  3. 配置文件/home/yourusername/.profile,在最后一行添加如下

    # Anaconda
    export PATH=$PATH:/home/username/anaconda3/bin

    生效 source /home/username/.profile

安装tensorflow

查看官网配对,确定安装版本

# 如果你安装的是 Python 3.6 版的Anaconda:
conda create --name tf_gpu_env tensorflow-gpu # tf_gpu_env是这个环境的名字 # 如果你安装的是 Python 3.7 版的Anaconda,则需要声明新创建的环境使用 Python 3.6:
conda create --name tf_gpu_env python=3.6 anaconda tensorflow-gpu

安装pytorch

  1. 新建虚拟环境并激活环境

    conda create -n pytorch python=3.7
    activate pytroch
  2. 查看官网选择版本,获得代码

    如我的

解决问题:

  1. ERROR: Cannot uninstall 'wrapt'. during upgrade
  2. tensorboard 1.14.0 has requirement setuptools>=41.0.0, but you'll have setuptools 39.1.0

Reference

https://blog.csdn.net/zhang970187013/article/details/81012845

https://www.linuxidc.com/Linux/2019-06/159059.htm

https://blog.csdn.net/Eddy_zheng/article/details/52910249

https://blog.csdn.net/DarrenXf/article/details/82182449

https://blog.csdn.net/qq_41620607/article/details/81236525

https://www.cnblogs.com/onemorepoint/p/7453766.html

https://blog.csdn.net/qq_22474567/article/details/54984257

https://blog.csdn.net/yuejisuo1948/article/details/81043962

https://github.com/tensorflow/tensorflow/issues/30191

https://blog.csdn.net/weixin_44179909/article/details/96973208

https://zhuanlan.zhihu.com/p/59278962

Ubuntu server16.04安装配置驱动418.87、cuda10.1、cudnn7.6.4.38、anaconda、pytorch超详细解决的更多相关文章

  1. 【科研民工笔记2】Ubuntu 16.04 安装nvidia驱动

    我的主机是2060的显卡,用的是安装在U盘中的Ubuntu,开机进入后,因为没有安装驱动,所以界面看以来比较大. 通过手动方式,成功安装驱动,最终成功的方案使用的是run文件安装的方式. 1.手动下载 ...

  2. Ubuntu 18.04安装配置Apache Ant

    Ubuntu 18.04安装配置Apache Ant 文章目录 Ubuntu 18.04安装配置Apache Ant 下载 执行以下命令 `/etc/profile`中配置环境变量 载入配置 测试 执 ...

  3. Ubuntu 18.04 安装配置 go 语言

    Ubuntu 18.04 安装配置 go 语言 1.下载 下载 jdk 到 Downloands 文件夹下 cd 进入 /usr/local, 创建 go 文件夹, 然后 cd 进这个文件夹 cd / ...

  4. Ubuntu 16.04 安装显卡驱动后循环登录和无法设置分辨率的一种解决方案

    1. 安装环境 电脑:MSI GP63 显卡:GeForce GTX 1070 系统:Ubuntu 16.04 驱动版本:NVIDIA 384.130 2. 循环登录 如果按照这篇文章 Ubuntu ...

  5. Ubuntu 18.04 安装配置 MySQL 5.7

    Ubuntu 18.04 安装 mysql 的过程中,竟然没有让你输入秘密?!(之前在 Ubuntu 14.04 下,安装过程中会询问密码),这导致安装完 mysql 初始秘密不知道的问题. $ su ...

  6. 【转】Ubuntu 16.04安装配置TensorFlow GPU版本

    之前摸爬滚打总是各种坑,今天参考这篇文章终于解决了,甚是鸡冻\(≧▽≦)/,电脑不知道怎么的,安装不了16.04,就安装15.10再升级到16.04 requirements: Ubuntu 16.0 ...

  7. Ubuntu 14.04 安装配置备忘录

    完全在 Linux 下工作,大概有3年时间了. 之前都是用 Windows, 而把 Linux 装在虚拟机里,现在反过来,把 Windows 装在了虚拟机里,只是因为偶尔还要用网银的缘故. 以我这几年 ...

  8. ubuntu 12.04 安装无线网卡驱动

    安装ubuntu 12.04后,无线网卡不可用,采用以下方式解决: 1.在终端中运行如下命令,重新安装b43相关的全部驱动和firmware: sudo apt-get install bcmwl-k ...

  9. Ubuntu 16.04安装NVIDIA驱动后循环登录问题

    问题描述 最近买了两块NVIDIA Titan X Pascal显卡装到了服务器(运行Ubuntu 16.04)上.为了使用这两块GPU显卡,首先需要安装显卡驱动,安装方式为 #安装一个依赖文件,并更 ...

随机推荐

  1. 随笔编号-16 MySQL查看表及索引大小方法

    目标:阿里云OS数据库DMS,单个主库最大存储空间为2T.最近公司业务扩展很快,一天数据量达到7.9G左右.要求备份清理历史数据,备份到其他磁盘. 准备: 如果想知道MySQL数据库中每个表占用的空间 ...

  2. JSP指令、标签以及中文乱码

    JSP指令.标签以及中文乱码 一.JSP指令简介 JSP指令(directive)是为JSP引擎而设计的,它们并不直接产生任何可见输出,而只是告诉引擎如何处理JSP页面中的其余部分. JSP指令的基本 ...

  3. Leetcode之回溯法专题-52. N皇后 II(N-Queens II)

    Leetcode之回溯法专题-52. N皇后 II(N-Queens II) 与51题的代码80%一样,只不过52要求解的数量,51求具体解,点击进入51 class Solution { int a ...

  4. 技术改变生活| 免费看VIP视频,屏蔽广告,解锁新姿势!

    说到这个,我就忍不住的要介绍一下今天的主角 Tampermonkey 了.Tampermonkey 是一款免费的浏览器扩展和最为流行的用户脚本管理器,它适用于Chrome, Microsoft Edg ...

  5. UVA - 315 Network(tarjan求割点的个数)

    题目链接:https://vjudge.net/contest/67418#problem/B 题意:给一个无向连通图,求出割点的数量.首先输入一个N(多实例,0结束),下面有不超过N行的数,每行的第 ...

  6. NOIP 2009 最优贸易 题解

    一道最短路的题,找一个买入和卖出相差最高的点即可,我们先以1为起点跑spfa,d1[x]不再表示距离而表示能够经过权值最小的节点的权值即 if(d1[y]>min(d1[x],price[y]) ...

  7. bzoj3032 七夕祭题解

    题面 TYVJ七夕祭和11区的夏祭的形式很像.矩形的祭典会场由N排M列共计N×M个摊点组成.虽然摊点种类繁多,不过cl只对其中的一部分摊点感兴趣,比如章鱼烧.苹果糖.棉花糖.射的屋--什么的.Vani ...

  8. Python---变量和简单的数据类型

    我会站在一个c/c++的基础上去看python的学习,尽量会在文中比较两者的区别,有什么说的不对的地方,欢迎指出,大家共同学习(o_o).(此后的文章都会基于python3以上版本去写) 1.变量 变 ...

  9. 【Mac】快速复制文件路径

    一.使用Automator新建服务 二.配置 三.使用 四.创建快捷键 一.使用Automator新建服务 在应用程序文件夹里打开Automator,选择文件菜单,新建一个服务,如下  二.配置 在 ...

  10. mariadb 远程访问报:Host xxx is not allowed to connect to this MariaDb server

    刚开始试的是: 结果报错了,哎,这折腾的. 继续折腾,加个密码试试: 再用Navicat试试,果然成功了.