tensorflow冻结层的方法

其实常说的fine tune就是冻结网络前面的层，然后训练最后一层。那么在tensorflow里如何实现finetune功能呢？或者说是如何实现冻结部分层，只训练某几个层呢？可以通过只选择优化特定层的参数来实现该功能。

示例代码如下：

#定义优化算子

optimizer = tf.train.AdamOptimizer(1e-3)

#选择待优化的参数

output_vars = tf.get_collection(tf.GraphKyes.TRAINABLE_VARIABLES, scope='outpt')

train_step = optimizer.minimize(loss_score,var_list = output_vars)

#但是在这里，我却碰到了一个问题，关于adam的问题，如下：

Failed precondition: Attempting to use uninitialized value beta1_power

#查了一下，这个参数应该是Adam优化算子里的参数。问题出在定义优化算子的时间，晚于参数初始化的时间，导致beta1_power没有初始化，修改一下代码（调整代码顺序即可）

#即如下的顺序：

sess.run(init)

train_step = optimizer.minimize(loss_score,var_list=output_vars)

#改变成如下顺序即可

train_step = optimizer.minimize(loss_score,var_list=output_vars)

sess.run(init)

参考链接：
https://stackoverflow.com/questions/38749120/fine-tuning-a-deep-neural-network-in-tensorflow
https://stackoverflow.com/questions/45093499/how-to-fine-tune-weights-in-specific-layers-in-tensorflow

另外一个问题是，在用finetune的时候，发现速度并没有比retrain的速度快太多。分析原因在于finetune的时候，冻结了其它层，那么反向传播不会进入到这些层中，但是前向计算是会有的。如果想进一步加速finetune的速度，可以考虑先把所有数据执行一次前向操作，保存最后一层的中间的结果，然后以此中间结果为输入，训练整个网络。可以节省前向计算的一些时间。但如果finetune的epoch较少，那么感觉读写消耗的时间可能就已经很多了，不划算，加速效果也不明显。

tensorflow冻结层的方法的更多相关文章

tensorflow冻结变量方法（tensorflow freeze variable）
最近由于项目需要,要对tensorflow构造的模型中部分变量冻结,然后继续训练,因此研究了一下tf中冻结变量的方法,目前找到三种,各有优缺点,记录如下: 1.名词解释冻结变量,指的是在训练模型时, ...
R12供应商地点层付款方法SQL
--R12供应商地点层付款方法SQL:SELECT ipmv.payment_method_name , ipmv.payment_method_code , 'N' primary_ ...
基础才是重中之重~Data层如何调用BLL层的方法,如果觉得奇怪请看本文章
回到目录看似不伦不类这个题目有点不伦不类,或者说有点伪模式了,不错,确实是这样,我们正确的开发思维是WEB层->BLL层->DATA层,每个层有对它下层的引用,下层不能引用上层,因为这 ...
jsp传到java的control层的方法
jsp传到java的control层的方法1.form表单用<input type="submit">提交,提交到后台的参数在form表单内<form meth ...
Thinkhphp5控制器调用的Model层的方法总结
控制器器里: <?php /** * Created by PhpStorm. * User: Haima * Date: 2018/7/8 * Time: 15:58 */ namespace ...
安装tensorflow的最简单方法(Ubuntu 16.04 && CentOS)
先说点题外话:在用anaconda安装很多次tensorflow失败之后,我放弃了,如果你遇到这样的问题:Traceback (most recent call last)-如果不是因为pip版本,就 ...
tensorflow 卷积层
TensorFlow 卷积层让我们看下如何在 TensorFlow 里面实现 CNN. TensorFlow 提供了 tf.nn.conv2d() 和 tf.nn.bias_add() 函数来创 ...
TensorFlow卷积层-函数
函数1:tf.nn.conv2d是TensorFlow里面实现卷积的函数,实际上这是搭建卷积神经网络比较核心的一个方法函数原型: tf.nn.conv2d(input,filter,strides, ...
TensorFlow之Varibale 使用方法
------------------------------------------- 转载请注明: 来自博客园 xiuyuxuanchen 地址:http://www.cnblogs.com/gre ...

随机推荐

APICloud 获取缓存以及清除缓存（常用第三方方法）
一.app中经常会有缓存的清除这个操作,具体如下 1.获取缓存大小 apiready = function() { api.getCacheSize(function(ret, err) { //si ...
JavaEE的起步
因为某些原因,现在要从.net开发转向J2EE了,在这里记录一下学习经历
Codeforces Round #548 (Div. 2) B. Chocolates
You went to the store, selling
Pyhton高级-Socket
1,UDP实现收发数据 import socket def send_msg(udp_socket): """获取键盘数据,并将其发送给对方""&qu ...
CSS学习笔记之样式声明
目录 1.背景 2.文本 3.字体 4.列表 5.表格 6.轮廓在这篇文章中你能看到有关于 CSS 样式设置的常用属性,文章的目录如下: 1.背景 (1)背景颜色可以使用 background-c ...
jQuery升级踩坑之路
1.使用了被废弃的jQuery.browser属性 jQuery 从 1.9 版开始,移除了 $.browser 和 $.browser.version , 取而代之的是 $.support . 在更 ...
NYIST 99 单词拼接
单词拼接时间限制:3000 ms | 内存限制:65535 KB难度:5 描述给你一些单词,请你判断能否把它们首尾串起来串成一串.前一个单词的结尾应该与下一个单词的道字母相同.如 aloha dog ...
多个线程作用于同一个runnable对象
多个线程作用于同一个runnable对象学习了:https://www.cnblogs.com/ligang305/archive/2012/08/10/2632126.html http://as ...
setOutputFormat called in an invalid state: 1
在编写一个简单的录像应用程序的时候,爆出例如以下异常: E MediaRecorder: setOutputFormat called in an invalid state: 1 E Android ...
优雅的App全然退出方案(没有不论什么内存泄漏隐患)
在Android开发过程中,特别是界面比較多的情况下,用寻常的退出方式往往是不能全然退出这个应用,网络上也好多各种退出方案.当中一种应该是被广大开发人员採纳使用,也很的清晰方便.就是在Applicat ...

tensorflow冻结层的方法

tensorflow冻结层的方法的更多相关文章

随机推荐

热门专题