（原）tensorflow中finetune某些层

转载请注明处处：

http://www.cnblogs.com/darkknightzh/p/7608709.html

参考网址：

https://kratzert.github.io/2017/02/24/finetuning-alexnet-with-tensorflow.html

https://github.com/kratzert/finetune_alexnet_with_tensorflow/blob/master/finetune.py#L109

https://github.com/davidsandberg/facenet

得到正常训练时的train_op时，使用tf.trainable_variables()，想要finetune，使用下面这句话（参考网址1，其实网址1和2都是同一个人的。。。）：

fine_tune_var_list = [v for v in tf.trainable_variables() if v.name.split('/')[0] in train_layers]

或者

fine_tune_var_list = [i for i in tf.trainable_variables() if 'fc1/weights' in i.name]

可以得到需要finetune的参数。如果不知道参数名字，可以先print出来：

for var in tf.trainable_variables():

    print(var)

然后找到需要finetune的层。也可以通过其他方法，只要能找到就行。。。

将fine_tune_var_list传给train_op，之后正常训练，便可以对网络进行finetune了，如下（见参考网址2）：

with tf.name_scope("train"):

    # Get gradients of all trainable variables

    gradients = tf.gradients(loss, var_list)

    gradients = list(zip(gradients, var_list))

    # Create optimizer and apply gradient descent to the trainable variables

    optimizer = tf.train.GradientDescentOptimizer(learning_rate)

    train_op = optimizer.apply_gradients(grads_and_vars=gradients)

当然，也可以使用自己其他的代码。但是，我这边直接使用上面代码，保存模型时，后缀都是0，把train_op 那句改成train_op = optimizer.apply_gradients(grads_and_vars=gradients , global_step=global_step)就可以了。当然，我出现的问题，和自己的代码有关系。

也可以用下面的代码（从参考网址3中提取）：

opt = tf.train.GradientDescentOptimizer(learning_rate)

train_op = get_train_op(grad, opt, global_step, args.moving_average_decay, finetune_params)

其中，

def get_train_op(grads, opt, global_step, moving_average_decay, train_var):

    # Apply gradients.

    apply_gradient_op = opt.apply_gradients(grads, global_step=global_step)

    # Track the moving averages of trainable variables.

    variable_averages = tf.train.ExponentialMovingAverage(moving_average_decay, global_step)

    variables_averages_op = variable_averages.apply(train_var)

    with tf.control_dependencies([apply_gradient_op, variables_averages_op]):

        train_op = tf.no_op(name='train')

    return train_op

注意的是，参考网址2中的代码，再对参数更新的时候，没有使用滑动平均。上面的代码，使用了滑动平均。

（原）tensorflow中finetune某些层的更多相关文章

TensorFlow中max pooling层各参数的意义
官方教程中没有解释pooling层各参数的意义,找了很久终于找到,在tensorflow/python/ops/gen_nn_ops.py中有写: def _max_pool(input, ksize ...
（原）torch中微调某层参数
转载请注明出处: http://www.cnblogs.com/darkknightzh/p/6221664.html 参考网址: https://github.com/torch/nn/issues ...
tensorflow CNN 卷积神经网络中的卷积层和池化层的代码和效果图
tensorflow CNN 卷积神经网络中的卷积层和池化层的代码和效果图因为很多 demo 都比较复杂,专门抽出这两个函数,写的 demo. 更多教程:http://www.tensorflown ...
（原）torch和caffe中的BatchNorm层
转载请注明出处: http://www.cnblogs.com/darkknightzh/p/6015990.html BatchNorm具体网上搜索. caffe中batchNorm层是通过Batc ...
（原）tensorflow中函数执行完毕，显存不自动释放
转载请注明出处: http://www.cnblogs.com/darkknightzh/p/7608916.html 参考网址: https://stackoverflow.com/question ...
第十四节，TensorFlow中的反卷积，反池化操作以及gradients的使用
反卷积是指,通过测量输出和已知输入重构未知输入的过程.在神经网络中,反卷积过程并不具备学习的能力,仅仅是用于可视化一个已经训练好的卷积神经网络,没有学习训练的过程.反卷积有着许多特别的应用,一般可以用 ...
tensorflow中slim模块api介绍
tensorflow中slim模块api介绍翻译 2017年08月29日 20:13:35 http://blog.csdn.net/guvcolie/article/details/77686 ...
CNN中的卷积核及TensorFlow中卷积的各种实现
声明: 1. 我和每一个应该看这篇博文的人一样,都是初学者,都是小菜鸟,我发布博文只是希望加深学习印象并与大家讨论. 2. 我不确定的地方用了"应该"二字首先,通俗说一下,CNN ...
TensorFlow中的通信机制——Rendezvous（二）gRPC传输
背景 [作者:DeepLearningStack,阿里巴巴算法工程师,开源TensorFlow Contributor] 本篇是TensorFlow通信机制系列的第二篇文章,主要梳理使用gRPC网络传 ...

随机推荐

ArcGisServer根据最大最小坐标换算瓦片行列号【转】
1.前言在上一节中我们知道了屏幕上一像素等于实际中多少单位长度(米或经纬度)的换算方法,而知道这个原理后,接下来我们要怎么用它呢?它和我们前端显示地图有什么关联呢?这一节,我会尽量详细的将这两个问题 ...
HTML中的转义字符 (转)
HTML中<, >,&等有特殊含义,(前两个字符用于链接签,&用于转义),不能直接使用.使用这三个字符时,应使用它们的转义序列,如下所示: & 或 & &a ...
Java通信过程的中文乱码的解决
J在基于Java的编程中,常常会碰到汉字的处里及显示的问题.比方一大堆乱码或问号. 这是由于JAVA中默认的编码方式是UNICODE.而中国人通常使用的文件和DB都是基于GB2312或者BIG5等编码 ...
65. XPages自定义控件（三）高级搜索之三
RecordView控件的两个文件的完整代码在本文末尾给出.虽说完整,仅靠这两个文件,RecordView控件还不能正常工作,因为在这两个文件里还引用了其他自定义控件,调用了作为managed bea ...
Python 和 Asyncio 编写在线多人游戏（一）
在技术和文化领域,大规模多人在线游戏(MMO)毋庸置疑是我们当今世界的潮流之一.很长时间以来,写一个 MMO 游戏这件事总是会涉及到大量的预算与复杂的底层编程技术.不过在最近这几年,事情迅速发生了变化 ...
Struts2之server端验证
声明:在我的教程中有些东西,没有提及到.不是我不知道,而是在我个人来看对你们不是太重要的知识点.你们在看课本时有了解到即可.我不会面面俱到的都给你们提及.我写博文的目的是把我这一年的开发经验通过学习s ...
[Algorithm] How many meeting rooms needed?
Give you set of meetings start time and end time, count how many meeting rooms needed. For example: ...
loadscript加载
function load_script(xyUrl, callback){ var head = document.getElementsByTagName('head')[0]; var scri ...
微软BI 之SSAS 系列 - 在SQL Server 2012 中开发 Analysis Services Multidimensional Project
SQL Server 2012 中提供了开发 SSAS 项目的两种模型,一种是新增加的 Tabular Model 表格模型,另一种就是原始的 Multidimensional Model 多维模型. ...
Windows上Boost的编译步骤
一.FQ下载Boost最新版本官网:http://www.boost.org/ 假设解压到:D:\Applicaton\DevTools\boost\boost_1_65_1 二.使用VS编译器 c ...

（原）tensorflow中finetune某些层

（原）tensorflow中finetune某些层的更多相关文章

随机推荐

热门专题