Ubuntu server16.04安装配置驱动418.87、cuda10.1、cudnn7.6.4.38、anaconda、pytorch超详细解决
Ubuntu server16.04安装配置驱动418.87、cuda10.1、cudnn7.6.4.38、anaconda、pytorch超详细解决
本篇博文根据本人亲装碰到的问题搜集总结而成,具体参考见结尾REFERENCE
安装GCC
服务器版未装有gcc,但英伟达驱动安装需要gcc,尝试过换源、更新软件库、以及overstack的几种方法均未能解决,最终发现可以通过安装build-essential软件包来解决问题,它会安装一堆新包,包括gcc, g++和make。
sudo apt install build-essential
安装NVIDIA驱动
由于直接安装cuda如果选择安装驱动会直接版本较低的驱动,所以采用先装驱动后装cuda的方式。
1. 卸载原有驱动(没装跳过)
- 方法一、通用
sudo apt-get remove –purge nvidia*
- 方法二、 非官网驱动
sudo apt-get remove --purge nvidia(版本全称,如我的nvidia-384.130)
- 方法三、官网驱动
sh ./nvidia.run --uninstall
2. 禁用nouveau
安装NVIDIA需要先禁用系统自带的驱动
打开文件
sudo gedit /etc/modprobe.d/blacklist.conf
在文本末尾添加
blacklist nouveau
option nouveau modeset=0
无视warn
wq, 执行
sudo update-initramfs -u
检测,
lsmod | grep nouveau
,没有任何输出说明禁用成功
3. 安装NVIDIA显卡驱动
查看支持的驱动版本
sudo apt-cache search nvidia*
,一般安装大于等于最大的版本就好,我安装的是418.87下载NVIDIA驱动,
禁用X服务(最好有一台备用电脑,因为这一步会黑屏...因为我是采用ssh连接,所以对我没影响)
sudo service lightdm stop
给文件赋执行权限并cd到下载目录
cd ~
sudo chmod a+x NVIDIA-Linux-x86_64-384.130.run
安装
sudo sh ./NVIDIA-Linux-x86_64-375.20.run –no-opengl-files
检测是否成功
nvidia-smi
安装CUDA10.1
禁用X服务(黑屏)
sudo service lightdm stop
给文件赋执行权限并安装
sudo chmod a+x cuda_10.1.243_418.87.00_linux.run sudo sh cuda_10.1.243_418.87.00_linux.run --override
accepted, 除了驱动不选择,其他都选。
打开配置文件
vim ~/.bashrc
,末尾写入export PATH=/usr/local/cuda-10.1/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
生效
source ~/.bashrc
检测是否成功
nvcc -V
安装cudnn
官网下载,找到与cuda版本配对的cudnn,查看官网配对,以及更全的版本配对,我的cuda为10.1所以,cudnn选的是7.6.4
将下载的添加为压缩包并解压
# compression
cp cudnn-8.0-linux-x64-v5.1.solitairetheme8 good.tgz
# decompression
tar -xvf good.tgz
安装,其实就是改变文件位置和权限
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/ -d
$ sudo chmod a+r /usr/local/cuda/include/cudnn.h
$ sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
查看cudnn版本:
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
以上便配置好服务器,以下为非root用户根据需要安装。
我安装的是anaconda、tensorflow、pytorch
安装anaconda
卸载anaconda(如有)
rm-rf ~/anaconda
,然后修改配置文件~/.bashrc
官网下载并安装
配置文件/home/yourusername/.profile,在最后一行添加如下
# Anaconda
export PATH=$PATH:/home/username/anaconda3/bin
生效
source /home/username/.profile
安装tensorflow
查看官网配对,确定安装版本
# 如果你安装的是 Python 3.6 版的Anaconda:
conda create --name tf_gpu_env tensorflow-gpu # tf_gpu_env是这个环境的名字
# 如果你安装的是 Python 3.7 版的Anaconda,则需要声明新创建的环境使用 Python 3.6:
conda create --name tf_gpu_env python=3.6 anaconda tensorflow-gpu
安装pytorch
新建虚拟环境并激活环境
conda create -n pytorch python=3.7
activate pytroch
查看官网选择版本,获得代码
如我的
解决问题:
- ERROR: Cannot uninstall 'wrapt'. during upgrade
- tensorboard 1.14.0 has requirement setuptools>=41.0.0, but you'll have setuptools 39.1.0
Reference
https://blog.csdn.net/zhang970187013/article/details/81012845
https://www.linuxidc.com/Linux/2019-06/159059.htm
https://blog.csdn.net/Eddy_zheng/article/details/52910249
https://blog.csdn.net/DarrenXf/article/details/82182449
https://blog.csdn.net/qq_41620607/article/details/81236525
https://www.cnblogs.com/onemorepoint/p/7453766.html
https://blog.csdn.net/qq_22474567/article/details/54984257
https://blog.csdn.net/yuejisuo1948/article/details/81043962
https://github.com/tensorflow/tensorflow/issues/30191
https://blog.csdn.net/weixin_44179909/article/details/96973208
https://zhuanlan.zhihu.com/p/59278962
Ubuntu server16.04安装配置驱动418.87、cuda10.1、cudnn7.6.4.38、anaconda、pytorch超详细解决的更多相关文章
- 【科研民工笔记2】Ubuntu 16.04 安装nvidia驱动
我的主机是2060的显卡,用的是安装在U盘中的Ubuntu,开机进入后,因为没有安装驱动,所以界面看以来比较大. 通过手动方式,成功安装驱动,最终成功的方案使用的是run文件安装的方式. 1.手动下载 ...
- Ubuntu 18.04安装配置Apache Ant
Ubuntu 18.04安装配置Apache Ant 文章目录 Ubuntu 18.04安装配置Apache Ant 下载 执行以下命令 `/etc/profile`中配置环境变量 载入配置 测试 执 ...
- Ubuntu 18.04 安装配置 go 语言
Ubuntu 18.04 安装配置 go 语言 1.下载 下载 jdk 到 Downloands 文件夹下 cd 进入 /usr/local, 创建 go 文件夹, 然后 cd 进这个文件夹 cd / ...
- Ubuntu 16.04 安装显卡驱动后循环登录和无法设置分辨率的一种解决方案
1. 安装环境 电脑:MSI GP63 显卡:GeForce GTX 1070 系统:Ubuntu 16.04 驱动版本:NVIDIA 384.130 2. 循环登录 如果按照这篇文章 Ubuntu ...
- Ubuntu 18.04 安装配置 MySQL 5.7
Ubuntu 18.04 安装 mysql 的过程中,竟然没有让你输入秘密?!(之前在 Ubuntu 14.04 下,安装过程中会询问密码),这导致安装完 mysql 初始秘密不知道的问题. $ su ...
- 【转】Ubuntu 16.04安装配置TensorFlow GPU版本
之前摸爬滚打总是各种坑,今天参考这篇文章终于解决了,甚是鸡冻\(≧▽≦)/,电脑不知道怎么的,安装不了16.04,就安装15.10再升级到16.04 requirements: Ubuntu 16.0 ...
- Ubuntu 14.04 安装配置备忘录
完全在 Linux 下工作,大概有3年时间了. 之前都是用 Windows, 而把 Linux 装在虚拟机里,现在反过来,把 Windows 装在了虚拟机里,只是因为偶尔还要用网银的缘故. 以我这几年 ...
- ubuntu 12.04 安装无线网卡驱动
安装ubuntu 12.04后,无线网卡不可用,采用以下方式解决: 1.在终端中运行如下命令,重新安装b43相关的全部驱动和firmware: sudo apt-get install bcmwl-k ...
- Ubuntu 16.04安装NVIDIA驱动后循环登录问题
问题描述 最近买了两块NVIDIA Titan X Pascal显卡装到了服务器(运行Ubuntu 16.04)上.为了使用这两块GPU显卡,首先需要安装显卡驱动,安装方式为 #安装一个依赖文件,并更 ...
随机推荐
- pip3 Traceback (most recent call last)错误调试
百度找的答案不知道是否正确反正不适用于deepin,就手动调试了一下,结果修复了原理不清楚. 调试环境: OS:deepin 15.11 Python3-pip 错误提示: python@python ...
- 翻牌动画(CocosCreator)
推荐阅读: 我的CSDN 我的博客园 QQ群:704621321 在游戏中,有时候为了通过一种有意思的途径,让用户在一些物品中随机获取某种物品,除了前面我们提到的使用大转盘抽奖获得, ...
- Codeforces 936C
题意略. 思路: 这个题目没做出来是因为缺少一个整体的构造思路. 正确的构造思路是不断地在s中去构造并且扩大t的后缀,构造好的后缀总是放在前面,然后不断地把它往后挤,最后将s构造成t. 比如: 现在在 ...
- 学习笔记之Java队列Queue中offer/add函数,poll/remove函数,peek/element函数的区别
队列是一种特殊的线性表,它只允许在表的前端进行删除操作,而在表的后端进行插入操作. LinkedList类实现了Queue接口,因此我们可以把LinkedList当成Queue来用. Java中Que ...
- Leetcode之深度优先搜索(DFS)专题-733. 图像渲染(Flood Fill)
Leetcode之深度优先搜索(DFS)专题-733. 图像渲染(Flood Fill) 深度优先搜索的解题详细介绍,点击 有一幅以二维整数数组表示的图画,每一个整数表示该图画的像素值大小,数值在 0 ...
- 用java实现取1-100之间的99个不重复的随机数 然后输出没有被取出的数字
package cn.kgc.springtest2.demo1.dao; import java.util.BitSet; /** * @author * @create 2019-08-02 17 ...
- 大型互联网公司分布式ID方案总结
ID是数据的唯一标识,传统的做法是利用UUID和数据库的自增ID,在互联网企业中,大部分公司使用的都是Mysql,并且因为需要事务支持,所以通常会使用Innodb存储引擎,UUID太长以及无序,所以并 ...
- ABC133F - Colorful Tree
ABC133FColorful Tree 题意 给定一颗边有颜色和权值的树,多次询问,每次询问,首先更改颜色为x的边的权值为y,然后输出u到v的距离. 数据都是1e5量级的. 思路 我自己一开始用树链 ...
- HDU-2089不要62-暴力或数位DP入门
不要62 题意:给定区间,求在这个区间中有多少个数字,不包含4且不包含62: 这道题作为数位DP的入门题: 暴力也是可以过 #include<cstdio> #include <io ...
- codeforces 811 E. Vladik and Entertaining Flags(线段树+并查集)
题目链接:http://codeforces.com/contest/811/problem/E 题意:给定一个行数为10 列数10w的矩阵,每个方块是一个整数, 给定l和r 求范围内的联通块数量 所 ...