安装基础包

yum -y install epel-release
yum -y install kernel-devel
yum -y install dkms

编辑文件 /etc/default/grub 修改 “GRUB_CMDLINE_LINUX
rd.driver.blacklist=nouveau nouveau.modeset=0

grub2-mkconfig -o /boot/grub2/grub.cfg

重启

安装显卡驱动

下载显卡驱动

 
 
下载完成是类似这样的文件 NVIDIA-Linux-x86_64-410.72.run 直接执行即可,
卸载 直接接参数 --uninstall
 
 
验证驱动是否正常
nvidia-smi

安装CUDA 9.0

我们使用rpm的方式安装

https://developer.nvidia.com/cuda-91-download-archive?target_os=Linux&target_arch=x86_64&target_distro=CentOS&target_version=7&target_type=rpmlocal

需要把patch也一并下载

-rw-r--r-- 1 root root   155023660 Jul 14  2018 cuda-repo-rhel7-9-0-176-local-patch-4-1.0-1.x86_64.rpm
-rw-r--r-- 1 root root  1595730326 Sep 23  2017 cuda-repo-rhel7-9-0-local-9.0.176-1.x86_64.rpm
-rw-r--r-- 1 root root   150679337 Dec 21  2017 cuda-repo-rhel7-9-0-local-cublas-performance-update-1.0-1.x86_64.rpm
-rw-r--r-- 1 root root   149765568 Feb 15  2018 cuda-repo-rhel7-9-0-local-cublas-performance-update-2-1.0-1.x86_64.rpm
-rw-r--r-- 1 root root   173037836 May 24  2018 cuda-repo-rhel7-9-0-local-cublas-performance-update-3-1.0-1.x86_64.rpm

在安装时,可能会有写软件包有冲突,比如ipa-client, salt-minion等, 我们可以暂时先把有冲突的卸载,回头在装回来

冲突的原因是用yum安装了python的模块,会造成python的pip管理有问题, 所以有冲突

rpm -ivh 安装完这些rpm 还没完事, 它其实只是解压在了/var目录

(paddle-venv) root@algorithmgpu-11-123:/var# ls -ld /var/cuda*
drwxr-xr-x 3 root root  138 Aug  6 11:48 /var/cuda-repo-9-0-176-local-patch-4/
drwxr-xr-x 3 root root 4096 Aug  6 11:56 /var/cuda-repo-9-0-local/
drwxr-xr-x 3 root root  138 Aug  6 11:48 /var/cuda-repo-9-0-local-cublas-performance-update/
drwxr-xr-x 3 root root  138 Aug  6 11:48 /var/cuda-repo-9-0-local-cublas-performance-update-2/
drwxr-xr-x 3 root root  182 Aug  6 11:48 /var/cuda-repo-9-0-local-cublas-performance-update-3/

我们需要在进入这些目录安装里面的rpm, 安装也是有顺序的

  1. /var/cuda-repo-9-0-local/   rpm -ivh *
  2. /var/cuda-repo-9-0-local/   rpm -Uvh *    其余patch依次按顺序

这样cuda就安装完成了, 安装目录在 /usr/local/cuda-9.0

下面配置环境变量

cat /etc/profile.d/cuda.sh
export LD_LIBRARY_PATH=/usr/local/cuda/lib64/:${LD_LIBRARY_PATH}
export PATH=/usr/local/cuda/bin/:${PATH}

导入一下环境变量  source  /etc/profile

安装cudnn-9.0-linux-x64-v7.1

下载上面的版本
https://developer.nvidia.com/rdp/cudnn-download
安装
https://docs.nvidia.com/deeplearning/sdk/cudnn-install/index.html
其实只是拷贝到对应目录
 
 
$ sudo cp cuda/include/cudnn.h /usr/local/cuda/include
$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
$ sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

编译安装paddle

文档

https://paddlepaddle.org.cn/documentation/docs/zh/1.5/beginners_guide/install/compile/compile_CentOS.html

注意这句话 执行编译前请您确认在虚环境中安装有编译依赖表中提到的相关依赖:

我们使用本机编译的方法, 非docker

照着文档一步步做就可以了

tips

make -j$(nproc) 这个命令执行时间可能得半天,根据不同网络而定

因为要下载很多git上的仓库

最后这个paddle的目录有 8.4G

GPU机器安装paddle的更多相关文章

  1. 百度Paddle速查_CPU和GPU的mnist预测训练_模型导出_模型导入再预测_导出onnx并预测

    需要做点什么 方便广大烟酒生研究生.人工智障炼丹师算法工程师快速使用百度PaddelPaddle,所以特写此文章,默认使用者已有基本的深度学习概念.数据集概念. 系统环境 python 3.7.4 p ...

  2. 百度Paddle会和Python一样,成为最流行的深度学习引擎吗?

    PaddlePaddle会和Python一样流行吗? 深度学习引擎最近经历了开源热.2013年Caffe开源,很快成为了深度学习在图像处理中的主要框架,但那时候的开源框架还不多.随着越来越多的开发者开 ...

  3. 使用 paddle来进行文本生成

    paddle 简单介绍 paddle 是百度在2016年9月份开源的深度学习框架. 就我最近体验的感受来说的它具有几大优点: 1. 本身内嵌了许多和实际业务非常贴近的模型比如个性化推荐,情感分析,词向 ...

  4. Google Colab 免费GPU服务器使用教程

    Google免费GPU使用教程(亲测可用)   今天突然看到一篇推文,里面讲解了如何薅资本主义羊毛,即如何免费使用Google免费提供的GPU使用权. 可以免费使用的方式就是通过Google Cola ...

  5. window 10 安装paddlepaddle 1.7 GPU版本

    window 10 安装paddlepaddle 1.7 GPU版本 1)更新显卡驱动 2)安装cuda 10 https://developer.nvidia.com/cuda-10.0-downl ...

  6. 安装paddle的问题,报错Can not find library: libcudnn.so. The process maybe hang.

    今天在服务器上安装paddle的GPU版时报错 报错截图如下: 其实报错已经提示的很明显了,就是要添加一个环境变量.但我想到我之前并没有在全局环境下安装cudnn,以为是这个原因.因为之前安装pyto ...

  7. Paddle源码之内存管理技术

    前言 在深度学习模型训练中,每次迭代过程中都涉及到Tensor的创建和销毁,伴随着的是内存的频繁 malloc和free操作,可能对模型训练带来不必要的 overhead. 在主流的深度学习框架中,会 ...

  8. Paddle Inference推理部署

    Paddle Inference推理部署 飞桨(PaddlePaddle)是集深度学习核心框架.工具组件和服务平台为一体的技术先进.功能完备的开源深度学习平台,已被中国企业广泛使用,深度契合企业应用需 ...

  9. Paddle Release Note

    Paddle Release Note 重要更新 飞桨paddle框架2.0.0版本有如下重要更新: 编程范式:默认开启动态图模式进行模型开发和训练,通过动转静的方式进行模型部署和训练加速.如果需要使 ...

随机推荐

  1. Squeeze Excitation Module 对网络的改进分析

    Squeeze-and-Excitation Networks SE-net 来自于Momenta 孙刚团队 SE的设计思路: 从卷积操作的实际作用来考虑,conv 把局部空间信息和通道信息组合起来, ...

  2. 【每天学一点Linux】快速清除文件内容

    linux几种快速清空文件内容的方法 几种快速清空文件内容的方法: $ : > filename #其中的 : 是一个占位符, 不产生任何输出. $ > filename $ echo “ ...

  3. Numpy | 06 从已有的数组创建数组

    numpy.asarray numpy.asarray 类似 numpy.array,但 numpy.asarray 参数只有三个,比 numpy.array 少两个. numpy.asarray(a ...

  4. web前端开发高级

    前端高效开发框架技术与应用 Vue 基础Vue 框架简介 MVX 模式介绍Vue 框架概述如何使用 Vue.js 基础语法 实例对象生命周期模板语法计算属性Methods 方法 渲染 列表渲染条件渲染 ...

  5. Flume 实战,将多台机器日志直接收集到 Kafka

    目前我们使用的一个 b 端软件的报错日志分散在集群各处,现在想把它收集到一个地方然后统一丢进 Kafka 提供给下游业务进行消费. 我想到了 flume,之前让同事搭建的这次自己想多了解一些细节于是就 ...

  6. MSSQL数据库 1000W数据优化整理

    GO SET STATISTICS TIME ON SELECT count([StyleId]) FROM [dbo].[Ky_Style] SET STATISTICS TIME OFF SET ...

  7. pandas批量读取带有日期的文件夹简单操作

    工作中碰到了这样一个数据处理的问题,想让你把某个文件夹下的子文件夹中的excel表级联成为1张表,用excel来做会很浪费时间并且很劳累,这时候我们就可以用pandas来加大工作效率,只需要半个小时就 ...

  8. eclipse Target runtime com.genuitec.runtime.generic.jee50 is not defined

      1.情景展示 报错信息如下: 2.原因分析 使用eclipse导入myeclipse时,唯独这个报错信息改不了. 需要通过修改这个项目的配置文件才行. 3.解决方案 第一步:切换到导航视图: 第二 ...

  9. 市值TOP10,人类进化及中美坐标

    题记:观察人类进化,以及各国.各民族在这个进化中所起的作用.所处的位置,市值 TOP 10 的变迁,会是一个再好不过的指标! 2008年,经历了全球金融危机后,原油期货一路飙升,创出了147.27美元 ...

  10. Linux上DNS解析总是选择resolv.conf中第二位的DNS服务器IP地址

    问题现象: 在Linux机器上,用户自建了一台DNS服务器.然后改动/etc/resolv.conf将其服务器IP地址添加到第一项.将阿里云的内网DNS放到第二位,然而在测试过程中发现telnet,p ...