『TensorFlow』使用集合collection控制variables
Variable
Tensorflow使用Variable类表达、更新、存储模型参数。
Variable是在可变更的,具有保持性的内存句柄,存储着Tensor- 在整个
session运行之前,图中的全部Variable必须被初始化Variable的值在sess.run(init)之后就确定了Tensor的值要在sess.run(x)之后才确定
- 创建的
Variable被添加到默认的collection中
tf.GraphKeys中包含了所有默认集合的名称,可以通过查看__dict__发现具体集合。
被收集在名为tf.GraphKeys.GLOBAL_VARIABLES:global_variablestf.GraphKeys.GLOBAL_VARIABLES的colletion中,包含了模型中的通用参数
tf.GraphKeys.TRAINABLE_VARIABLES:tf.Optimizer默认只优化tf.GraphKeys.TRAINABLE_VARIABLES中的变量。
| 函数 | 集合名 | 意义 |
|---|---|---|
| tf.global_variables() | GLOBAL_VARIABLES |
存储和读取checkpoints时,使用其中所有变量 跨设备全局变量集合 |
| tf.trainable_variables() | TRAINABLE_VARIABLES |
训练时,更新其中所有变量 存储需要训练的模型参数的变量集合 |
| tf.moving_average_variables() | MOVING_AVERAGE_VARIABLES |
实用指数移动平均的变量集合 |
| tf.local_variables() | LOCAL_VARIABLES |
在 进程内本地变量集合 |
| tf.model_variables() | MODEL_VARIABLES |
Key to collect model variables defined by layers. 进程内存储的模型参数的变量集合 |
| QUEUE_RUNNERS | 并非存储variables,存储处理输入的QueueRunner | |
| SUMMARIES | 并非存储variables,存储日志生成相关张量 |
除了上表中的函数外(上表中最后两个集合并非变量集合,为了方便一并放在这里),还可以使用tf.get_collection(集合名)获取集合中的变量,不过这个函数更多与tf.get_collection(集合名)搭配使用,操作自建集合。
另,slim.get_model_variables()与tf.model_variables()功能近似。
Summary
Summary被收集在名为tf.GraphKeys.UMMARIES的colletion中,
Summary是对网络中Tensor取值进行监测的一种Operation- 这些操作在图中是“外围”操作,不影响数据流本身
- 调用tf.scalar_summary系列函数时,就会向默认的
collection中添加一个Operation
自定义集合
除了默认的集合,我们也可以自己创造collection组织对象。网络损失就是一类适宜对象。
tensorflow中的Loss提供了许多创建损失Tensor的方式。
x1 = tf.constant(1.0)
l1 = tf.nn.l2_loss(x1) x2 = tf.constant([2.5, -0.3])
l2 = tf.nn.l2_loss(x2)
创建损失不会自动添加到集合中,需要手工指定一个collection:
tf.add_to_collection("losses", l1)
tf.add_to_collection("losses", l2)
创建完成后,可以统一获取所有损失,losses是个Tensor类型的list:
losses = tf.get_collection('losses')
一种常见操作把所有损失累加起来得到一个Tensor:
loss_total = tf.add_n(losses)
执行操作可以得到损失取值:
sess = tf.Session()
init = tf.global_variables_initializer()
sess.run(init)
losses_val = sess.run(losses)
loss_total_val = sess.run(loss_total)
实际上,如果使用TF-Slim包的losses系列函数创建损失,会自动添加到名为”losses”的collection中。
『TensorFlow』使用集合collection控制variables的更多相关文章
- 『TensorFlow』专题汇总
TensorFlow:官方文档 TensorFlow:项目地址 本篇列出文章对于全零新手不太合适,可以尝试TensorFlow入门系列博客,搭配其他资料进行学习. Keras使用tf.Session训 ...
- 『TensorFlow』流程控制
『PyTorch』第六弹_最小二乘法对比PyTorch和TensorFlow TensorFlow 控制流程操作 TensorFlow 提供了几个操作和类,您可以使用它们来控制操作的执行并向图中添加条 ...
- 『TensorFlow』滑动平均
滑动平均会为目标变量维护一个影子变量,影子变量不影响原变量的更新维护,但是在测试或者实际预测过程中(非训练时),使用影子变量代替原变量. 1.滑动平均求解对象初始化 ema = tf.train.Ex ...
- 『TensorFlow』梯度优化相关
tf.trainable_variables可以得到整个模型中所有trainable=True的Variable,也是自由处理梯度的基础 基础梯度操作方法: tf.gradients 用来计算导数.该 ...
- 『TensorFlow』SSD源码学习_其一:论文及开源项目文档介绍
一.论文介绍 读论文系列:Object Detection ECCV2016 SSD 一句话概括:SSD就是关于类别的多尺度RPN网络 基本思路: 基础网络后接多层feature map 多层feat ...
- 『TensorFlow』模型保存和载入方法汇总
『TensorFlow』第七弹_保存&载入会话_霸王回马 一.TensorFlow常规模型加载方法 保存模型 tf.train.Saver()类,.save(sess, ckpt文件目录)方法 ...
- 『TensorFlow』SSD源码学习_其五:TFR数据读取&数据预处理
Fork版本项目地址:SSD 一.TFR数据读取 创建slim.dataset.Dataset对象 在train_ssd_network.py获取数据操作如下,首先需要slim.dataset.Dat ...
- 『TensorFlow』分布式训练_其三_多机分布式
本节中的代码大量使用『TensorFlow』分布式训练_其一_逻辑梳理中介绍的概念,是成熟的多机分布式训练样例 一.基本概念 Cluster.Job.task概念:三者可以简单的看成是层次关系,tas ...
- 『TensorFlow』DCGAN生成动漫人物头像_下
『TensorFlow』以GAN为例的神经网络类范式 『cs231n』通过代码理解gan网络&tensorflow共享变量机制_上 『TensorFlow』通过代码理解gan网络_中 一.计算 ...
随机推荐
- 洛谷P1021邮票面值设计 [noip1999] dp+搜索
正解:dfs+dp 解题报告: 传送门! 第一眼以为小凯的疑惑 ummm说实话没看标签我还真没想到正解:D 本来以为这么多年前的noip应该不会很难:D 看来还是太菜了鸭QAQ 然后听说题解都可以被6 ...
- mac安装gcc
xcode-select --install安装命令行工具 安装完毕后,可能报错 xcrun: error: active developer path ("/Applications/Xc ...
- 实验一:C++简单程序设计
[实验一] #2-28 实现一个简单的菜单程序,运行时显示“Menu:A(dd) D(elete) S(ort) Q(uit),Selete one:”提示用户输入.A表示增加,D表示删除,S表示排序 ...
- C#设计模式(3)——工厂方法模式(转)
C#设计模式(3)——工厂方法模式 一.引言 在简单工厂模式中讲到简单工厂模式的缺点,有一点是——简单工厂模式系统难以扩展,一旦添加新产品就不得不修改简单工厂方法,这样就会造成简单工厂的实现逻辑过 ...
- laravel自定义验证
1.在控制器中直接写验证$this->validate($request, [ 'video_ids' => [ function($attribute, $value, $fail) { ...
- input file 上传 判断文件类型、路径是否为空
<html> <body bgcolor="white"> <TABLE cellSpacing=0 cellPadding=0 width=&quo ...
- Kubernetes 网络改进的三项实践分享
自研CNI IPAM插件 解决K8s功能问题 首先,在功能方面,Kubernetes 网络模型由于IP不固定,无法对IP资源进行精细管控,无法使用基于IP的监控和基于IP的安全策略,此外,一些IP发现 ...
- Lua C/C++互相调用
先来说下大致脚本引擎框架,此次采用如下,即运行C++代码启动程序,然后加载Lua脚本执行! 1.基础 Lua脚本中只能调用 int (*lua_CFunction) (lua_State *L) 这种 ...
- ECMAScript6 入门教程 初学记录let命令 块级作用域
一.基本语法-let命令 (1)ES6新增了let命令,用来声明变量.所声明的变量,只在let命令所在的代码块内有效. 循环的计数器,就很合适使用let命令.计数器i只在for循环体内有效,在循环体外 ...
- WebForm母版页
母版页:可以把界面的部分代码进行重用 添加新项-母版页 在母版页中界面代码不要写在 <asp:ContentPlaceHolder ID="head" runat=" ...