tensorflow 单机多卡官方cifar10例程

测试了官方历程，看没有问题，加上时间紧任务重，就不深究了。

官方tutorials：https://www.tensorflow.org/tutorials/images/deep_cnn

github源码：https://github.com/tensorflow/models/tree/master/tutorials/image/cifar10

值得注意的是：

运行多GPU训练的脚本：

python cifar10_multi_gpu_train.py --num_gpus = 1 --batch_size=4096

在有4个1080TI的服务器上运行如下shell命令，后者速度明显提升。

python cifar10_multi_gpu_train.py --num_gpus=1 --max_steps=100  --batch_size=4096

python cifar10_multi_gpu_train.py --num_gpus=2 --max_steps=100  --batch_size=2048

python cifar10_multi_gpu_train.py --num_gpus=3 --max_steps=100  --batch_size=1024

python cifar10_multi_gpu_train.py --num_gpus=4 --max_steps=100  --batch_size=512

结果为：

num_gpus	batch_size	min msec/batch
1	4096	256
2	2048	64
3	1024	29
4	512	15

tensorflow 单机多卡官方cifar10例程的更多相关文章

TensorFlow分布式部署【单机多卡】
让TensorFlow飞一会儿面对大型的深度神经网络训练工程,训练的时间非常重要.训练的时间长短依赖于计算处理器也就是GPU,然而单个GPU的计算能力有限,利用多个GPU进行分布式部署,同时完成一个 ...
tensorflow 单机多GPU训练时间比单卡更慢/没有很大时间上提升
使用tensorflow model库里的cifar10 多gpu训练时,最后测试发现时间并没有减少,反而更慢参考以下两个链接 https://github.com/keras-team/keras ...
Pytorch使用分布式训练，单机多卡
pytorch的并行分为模型并行.数据并行左侧模型并行:是网络太大,一张卡存不了,那么拆分,然后进行模型并行训练. 右侧数据并行:多个显卡同时采用数据训练网络的副本. 一.模型并行二.数据并行数 ...
zw版_zw中文增强版Halcon官方Delphi例程
[<zw版·delphi与halcon系列原创教程>zw版_zw中文增强版Halcon官方Delphi例程源码下载:http://files.cnblogs.com/files/ziwa ...
Tensorflow样例代码分析cifar10
github地址:https://github.com/tensorflow/models.git 本文分析tutorial/image/cifar10教程项目的cifar10_input.py代码. ...
将TensorFlow模型变为pb——官方本身提供API，直接调用即可
TensorFlow: How to freeze a model and serve it with a python API 参考:https://blog.metaflow.fr/tensorf ...
TensorFlow笔记六：基于cifar10数据库的AlexNet识别
准确率只有70%,cpu版本的TF居然跑了两天才跑完,其他方法将继续尝试. 生成数据目录: import numpy as np import os train_label = {} for i in ...
TensorFlow笔记五：将cifar10数据文件复原成图片格式
cifar10数据集(http://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz)源格式是数据文件,因为训练需要转换成图片格式转换代码: 注意文件路 ...
tensorflow 单机多GPU mnist实例
http://blog.csdn.net/guotong1988/article/details/74748806 如何使用多GPU http://wiki.jikexueyuan.com/proje ...

随机推荐

jvm源码解读--10 enum WKID 枚举
源码中对于枚举类型WKID的使用 static bool initialize_wk_klass(WKID id, int init_opt, TRAPS); static void initiali ...
solr（CVE-2017-12629）远程命令执行
影响版本Apache Solr 5.5.0到7.0.1版本 solr(CVE-2017-12629-RCE) 环境搭建 1.burp检测创建listen POST /solr/demo/config ...
2021陕西省大学生网络安全技能大赛 Web ez_checkin
web ez_checkin 进去看了一会,啥也没找到,直接上dirsearch 扫到一个index.php~,打开看一看,是php审计 <?php error_reporting(0); in ...
异地远程访问群晖NAS中的文件
异地远程访问群晖NAS中的文件我以群晖DS720+网络存储服务器为例,介绍我是如何异地远程访问群晖NAS中的文件的. 此文章只介绍部署操作的大概步骤,具体的操作方法和技巧可以在西瓜视频.抖音 ...
每个程序员的必经之路：Hello，world！
每个程序员的必经之路:Hello,world! Java 源程序也称源代码,是指未编译的按照一定的程序设计语言规范书写的文本文件,是一系列人类可读的计算机语言指令. 在现代程序语言中,源代码可以是以 ...
C++手写内存池
引言使用new expression为类的多个实例分配动态内存时,cookie导致内存利用率可能不高,此时我们通过实现类的内存池来降低overhead.从不成熟到巧妙优化的内存池,得益于union的 ...
K8S系列第九篇（持久化存储，emptyDir、hostPath、PV/PVC）
更多k8s内容,请关注威信公众好:新猿技术生态圈一.数据持久化 Pod是由容器组成的,而容器宕机或停止之后,数据就随之丢了,那么这也就意味着我们在做Kubernetes集群的时候就不得不考虑存储的问 ...
单机版搭建kubernetes(K8s)
准备云原生的概念越来越火,忍不住去看了看kubernetes,初次接触,晕晕乎乎的,于是不管三七二十一,先搭建个单机版的再说(没钱买服务器,目前也懒得装虚拟机),跑起来也算是第一步吧.网上教程一顿搜 ...
eslint+prettier+husky+lint-staged 统一前端代码规范
eslint+prettier+husky+lint-staged 统一前端代码规范遵循编码规范和使用语法检测,可以很好的提高代码的可读性,可维护性,并有效的减少一些编码错误. 1.终极目标团队中 ...
Shell-13-常用文件目录
linux系统目录结构环境变量文件系统级系统级变量文件对所有用户生效 #系统范围内的环境变量和启动文件. #不建议把要做的事情写在这里面,最好创建一个自定义的,放在/etc/profile.d ...

tensorflow 单机多卡 官方cifar10例程

tensorflow 单机多卡 官方cifar10例程的更多相关文章

随机推荐

热门专题

tensorflow 单机多卡官方cifar10例程

tensorflow 单机多卡官方cifar10例程的更多相关文章