服务器端的GPU使用

查看GPU信息

查看nvidia GPU信息：

# 输入指令

lspci | grep -i nvidia

# 结果如下：

# 04:00.0 3D controller: NVIDIA Corporation Device 1db4 (rev a1)

# 05:00.0 3D controller: NVIDIA Corporation Device 1db4 (rev a1)

# 08:00.0 3D controller: NVIDIA Corporation Device 1db4 (rev a1)

# 09:00.0 3D controller: NVIDIA Corporation Device 1db4 (rev a1)

# 84:00.0 3D controller: NVIDIA Corporation Device 1db4 (rev a1)

# 85:00.0 3D controller: NVIDIA Corporation Device 1db4 (rev a1)

# 88:00.0 3D controller: NVIDIA Corporation Device 1db4 (rev a1)

# 89:00.0 3D controller: NVIDIA Corporation Device 1db4 (rev a1)

输出结果04:00.0，可用于后续查看详细的信息

查看指定显卡的详细信息：

# 输入指令：

lspci -v -s 04:00.0

# 输出结果：

# 04:00.0 3D controller: NVIDIA Corporation Device 1db4 (rev a1)

# 	Subsystem: NVIDIA Corporation Device 1214

# 	Flags: bus master, fast devsel, latency 0, IRQ 26, NUMA node 0

# 	Memory at c4000000 (32-bit, non-prefetchable) [size=16M]

# 	Memory at 27800000000 (64-bit, prefetchable) [size=16G]

# 	Memory at 27c00000000 (64-bit, prefetchable) [size=32M]

# 	Capabilities: <access denied>

# 	Kernel driver in use: nvidia

# 	Kernel modules: nvidiafb, nouveau, nvidia_384_drm, nvidia_384

查看GPU的使用信息

nvidia-smi

其主要看Memory-Usage栏，避免使用了其他人已经占用了显卡
一般使用如下指令，周期性查看显卡的使用情况：
```
watch -n 10 nvidia-smi
```
每10s刷新一下显示

参考：Linux查看GPU信息和使用情况

指定GPU进行训练

在查看了GPU的信息后，在训练是指定空闲的GPU进行训练。

在终端执行时指定GPU

CUDA_VISIBLE_DEVICES=0 python3 ***.py  # 指定GPU集群中第一块GPU使用,其他的屏蔽掉

# CUDA_VISIBLE_DEVICES=1           Only device 1 will be seen

# CUDA_VISIBLE_DEVICES=0,1         Devices 0 and 1 will be visible

# CUDA_VISIBLE_DEVICES=""          No GPU will be visible

在配置文件头上指定GPU，此方法和上述方法类似，以下举个例子：
- 创建.sh文件；
- 通过chmod +x ***.sh给文件加入可执行的属性；
- 在文件中写入：
```
#! /bin/bash

CUDA_VISIBLE_DEVICES=1 \

python model_main.py \

        --model_dir=training/model \

        --pipeline_config_path=training/pipeline.config \

        --num_train_steps=25000
```
- 之后在执行时，通过bash ***.sh 运行即可。

在Python代码中指定

import os

os.environ["CUDA_VISIBLE_DEVICES"] = "0"  　#指定第一块gpu

在tensorflow中指定GPU的使用

# allow_soft_placement=True ： 如果你指定的设备不存在，允许TF自动分配设备

# log_device_placement=True : 是否打印设备分配日志

config = tf.ConfigProto(allow_soft_placement=True, log_device_placement=True)

# 限制GPU资源的使用：两者选其一即可

# 方式一：限制GPU使用率

config.gpu_options.per_process_gpu_memory_fraction = 0.4  #占用40%显存

# 方式二：动态申请显存

config.gpu_options.allow_growth = True

sess = tf.Session(config=config)

参考：

Linux查看GPU信息和使用情况

指定GPU进行训练

tensorflow中配置GPU使用

服务器端的GPU使用的更多相关文章

openGL 提升渲染性能之顶点数组 VBO IBO VAO
使用openGL图形库绘制,都需要通过openGL接口向图像显卡提交顶点数据,显卡根据提交的数据绘制出相应的图形. openGL绘制方式有:直接模式,显示列表,顶点数组,顶点索引. 直接模式:最简单, ...
TensorFlow从1到2（十五）（完结）在浏览器做机器学习
TensorFlow的Javascript版 TensorFlow一直努力扩展自己的基础平台环境,除了熟悉的Python,当前的TensorFlow还实现了支持Javascript/C++/Java/ ...
OpenStack 企业私有云的若干需求（1）：Nova 虚机支持 GPU
本系列会介绍OpenStack 企业私有云的几个需求: 自动扩展(Auto-scaling)支持多租户和租户隔离 (multi-tenancy and tenancy isolation) 混合云( ...
国内云计算的缺失环节: GPU并行计算（转）
[IT时代周刊编者按]云计算特有的优点和巨大的商业前景,让其成为了近年来的IT界最热门词汇之一.当然,这也与中国移动互联网的繁荣紧密相关,它们需要有相应的云计算服务作为支撑.但本文作者祁海江结合自身的 ...
Pycharm实现服务器端代码的远程调试
Pycharm是很多人在学习机器学习时的常用IDE.但是,当代码需要庞大计算资源的时候,我们往往需要借助远程服务器的GPU资源.很多人都是将代码拷贝到服务器,然后运行,但是当修改调试的时候,很不方便 ...
谈谈GPU与FPGA的一些看法
从几个方面来介绍一下GPU和FPGA. 从峰值性能来说,GPU(10Tflops)远远高于FPGA(<1TFlops).GPU上面成千上万个core同时跑在GHz的频率上还是非常壮观的,最新的G ...
OpenStack企业私有云新需求（1）：Nova 虚机支持 GPU
作者:Sammy Liu 刘世民本系列会介绍OpenStack 企业私有云的几个需求: GPU 支持自动扩展(Auto-scaling)支持混合云(Hybrid cloud)支持物理机(Bar ...
win7旗舰版+caffe+vs2013+matlab2014b(无GPU版)
参考网站: http://www.cnblogs.com/njust-ycc/p/5776286.html 无法找到gpu/mxGPUArray.h: No such file or director ...
ubuntu12.04通过Ganglia利用NVML模块进行GPU监控
1.安装Ganglia,这里安装的是3.1*版本,因为监控GPU的模块只支持3.1*版本系列的 apt-get install ganglia* 2.下载并安装PyNVML和NVML模块,下载地址ht ...

随机推荐

eBPF 安全项目 Tracee 初探
1. Tracee 介绍 1.1 Tracee 介绍 Tracee 是一个用于 Linux 的运行时安全和取证工具.它使用 Linux eBPF 技术在运行时跟踪系统和应用程序,并分析收集的事件以检 ...
MongoDB（10）- 查询嵌套文档
插入测试数据 db.inventory.insertMany( [ { item: "journal", qty: 25, size: { h: 14, w: 21, uom: & ...
Python中正则表达式简介
目录一.什么是正则表达式二.正则表达式的基础知识 1. 原子 1)普通字符作为原子 2)非打印字符作为原子 3) 通用字符作为原子 4) 原子表 2. 元字符 1)任意匹配元字符 2)边界限制元字 ...
C语言学习笔记---3.字符串格式化输入输出
1.C语言字符串字符串(character string)是一个或多个字符的序列,例如:"Zing went the strings of my heart!" C语言没有专门用 ...
Centos6.5时间服务器NTP搭建
NTP时间服务器安装与配置第1章 Server端的安装与配置 1.1 查看系统是否已经安装ntp服务组件 rpm -qa | grep "ntp" #<==查看是否已经安装 ...
kubectl工具的windows\linux安装方法
kubectl 安装下载kubectl二进制文件 curl -LO https://storage.googleapis.com/kubernetes-release/release/v1.10.0 ...
支持Cron表达式、间隔时间的工具（TaskScheduler）
后台任务如何支持间隔时间.Cron表达式两种方式? 分享一个项目TaskScheduler,这是我从Furion项目中拷出来的源码:https://gitee.com/dot-net-core/ta ...
利用滴答定时器(SysTick)实现简单的延时函数
预备知识: 对标准库来说,如果定义了时钟频率,则系统会默认初始化该时钟频率. SysTick是CM4的内核外设,是一个24位的向下递减计数器,每次计数时间是1/SYSCLK,即1/168000000. ...
转mybatis返回自增主键，亲测
重点是获取对象的主键值而不是insert的返回值 Mybatis获取插入数据的主键时,返回值总是1xml里的写法第一种方式 <insert id="insertLogin" ...
javascript 责任链模式 Chain of Responsibility
* 可拆分的责任链节点 // 可拆分的责任链节点 // Chain.prototype.setNextSuccessor 指定在链条中的下一个节点 // Chain.prototype.passReq ...

服务器端的GPU使用

服务器端的GPU使用

查看GPU信息

查看GPU的使用信息

指定GPU进行训练

参考：

服务器端的GPU使用的更多相关文章

随机推荐

热门专题