tensorflow随机梯度下降算法使用滑动平均模型

在采用随机梯度下降算法训练神经网络时，使用滑动平均模型可以提高最终模型在测试集数据上的表现。在Tensflow中提供了tf.train.ExponentialMovingAverage来实现滑动平均模型。在初始化ExponentialMovingAverage时，需要提供一个衰减率（decay)。这个衰减率将用于控制模型更新的速度。ExponentialMovingAverage对每一个变量会维护一个影子变量（shadowvariable),这个影子变量的初始值就是相应变量的初始值，而每次运行变量更新时，影子变量的值会更新为：

shadow_variable=decay x shadow_variable+(1-decay) x variable

其中shadow_variable 为影子变量，variable为待更新的变量，decay为衰减率。decay决定了模型更新的速度，decay越大模型越趋于稳定。在实际应用中，decay一般会设成非常接近1的数（比如0.999或0.9999）。为了使得模型在训练前期可以更新得更快，ExponentialMovingAverage还提供了num_updates参数来动态设置decay的大小.

下面是ExponentailMovingAverage使用示例

# -*- coding:UTF- -*-

import  tensorflow as tf

# 定义一个初始为0的变量来计算滑动平均

v1=tf.Variable(,dtype=tf.float32)

#这里的step变量模拟神经网络中迭代的轮数，可以用于动态控制衰减率

step=tf.Variable(,trainable=False)

#定义一个滑动平均的类，初始化时给定了衰减率（0.99)和控制衰减率的变量step

ema=tf.train.ExponentialMovingAverage(0.99,step)

# 定义一个更新变量滑动平均的操作，这里给定一个列表，每次执行这个操作时，这个列表中的变量的值都会更新

maintain_averages_op=ema.apply([v1])

with tf.Session() as sess:

    # 初始化所有变量

     init_op=tf.global_variables_initializer()

     sess.run(init_op)

    # 通过ema.average(v1)获取滑动平均之后变量的取值。在初始化之后变量v1的值和v1的滑动平均都为0

     print sess.run([v1,ema.average(v1)])

    # 更新变量v1的值到5

     sess.run(tf.assign(v1,))

    # 更新v1的滑动平均值，衰减率为min{0.99,(+step)/(+step)=0.1}=0.1

    # 所以v1的滑动平均会被更新为0.*+0.9*=4.5

     sess.run(maintain_averages_op)

     print sess.run([v1,ema.average(v1)])

    # 更新 step的值为10000

     sess.run(tf.assign(step,))

    # 更新 v1的值为10。

     sess.run(tf.assign(v1,))

    # 更新v1 的滑动平均值。衰减率为min(0.99,(+step)/(+step)≈0.999}=0.99

    # 所以v1的滑动平均会被更新为0.*4.5+0.01*=4.555

     sess.run(maintain_averages_op)

     print sess.run([v1,ema.average(v1)])

    #再次更新滑动平均值，得到的新滑动平均值为0.*4.555+0.01*=4.60945

     sess.run(maintain_averages_op)

     print sess.run([v1,ema.average(v1)])

结果如下

[0.0, 0.0]
[5.0, 4.5]
[10.0, 4.555]
[10.0, 4.60945]

tensorflow随机梯度下降算法使用滑动平均模型的更多相关文章

Tensorflow中的滑动平均模型
原文链接在Tensorflow的教程里面,使用梯度下降算法训练神经网络时,都会提到一个使模型更加健壮的策略,即滑动平均模型. 基本思想在使用梯度下降算法训练模型时,每次更新权重时,为每个权重维护一 ...
tensorflow笔记之滑动平均模型
tensorflow使用tf.train.ExponentialMovingAverage实现滑动平均模型,在使用随机梯度下降方法训练神经网络时候,使用这个模型可以增强模型的鲁棒性(robust),可 ...
Tensorflow滑动平均模型tf.train.ExponentialMovingAverage解析
觉得有用的话,欢迎一起讨论相互学习~Follow Me 移动平均法相关知识移动平均法又称滑动平均法.滑动平均模型法(Moving average,MA) 什么是移动平均法移动平均法是用一组最近的实 ...
监督学习：随机梯度下降算法（sgd）和批梯度下降算法（bgd）
线性回归首先要明白什么是回归.回归的目的是通过几个已知数据来预测另一个数值型数据的目标值. 假设特征和结果满足线性关系,即满足一个计算公式h(x),这个公式的自变量就是已知的数据x,函数值h(x)就 ...
监督学习——随机梯度下降算法（sgd）和批梯度下降算法（bgd）
线性回归首先要明白什么是回归.回归的目的是通过几个已知数据来预测另一个数值型数据的目标值. 假设特征和结果满足线性关系,即满足一个计算公式h(x),这个公式的自变量就是已知的数据x,函数值h(x)就 ...
tensorflow入门笔记（二）滑动平均模型
tensorflow提供的tf.train.ExponentialMovingAverage 类利用指数衰减维持变量的滑动平均. 当训练模型的时候,保持训练参数的滑动平均是非常有益的.评估时使用取平均 ...
78、tensorflow滑动平均模型，用来更新迭代的衰减系数
''' Created on 2017年4月21日 @author: weizhen ''' #4.滑动平均模型 import tensorflow as tf #定义一个变量用于计算滑动平均,这个变 ...
吴裕雄 PYTHON 神经网络——TENSORFLOW 滑动平均模型
import tensorflow as tf v1 = tf.Variable(0, dtype=tf.float32) step = tf.Variable(0, trainable=False) ...
随机梯度下降算法求解SVM
测试代码(matlab)如下: clear; load E:\dataset\USPS\USPS.mat; % data format: % Xtr n1*dim % Xte n2*dim % Ytr ...

随机推荐

Saltstack 分发
把master上的hosts文件分发到所有主机 [root@node1 ~]# salt-cp '*' /etc/hosts /etc
web开发必备的浏览器常识
浏览器内核: 1.使用Trident内核的浏览器:IE.Maxthon.TT.The World等: 2.使用Gecko内核的浏览器:Netcape6及以上版本.FireFox.MozillaSuit ...
迭代函数：zip、enumerate，list解析
#encoding:utf-8 """ 并行迭代: zip enumerate 获取元素及下标 list解析 iter """ #zip # ...
Android:ImageView控件
ImageView 是用于在界面上展示图片的一个控件,通过它可以让我们的程序界面变得更加丰富多彩.学习这个控件需要提前准备好一些图片,由于目前 drawable 文件夹下已经有一张 ic_launc ...
asp.net mvc流程图4.6以前
.net里Release的pdb文件有什么用是否可以删除
程序数据库 (PDB) 文件保存着调试和项目状态信息,使用这些信息可以对程序的调试配置进行增量链接. 在使用 /debug 生成时,会创建一个 PDB 文件. 可以使用 /debug:full 或 / ...
asp.net mvc Session RedisSessionStateProvider锁的实现
最近项目用到了RedisSessionStateProvider来保存session,发现比内存session慢,后来慢慢了解,发现asp.net session是有锁的.我在文章你的项目真的需要S ...
【PMP】变更流程图与说明
点击下载viso原件以下是变更流程说明: 1.团队成员判定不需要变更发起人提出变更请求,团队成员对该变更进行分析与评估影响,通过判断后,如果决定不需要变,那么就编写反馈报告提交给相关方确认,相关方 ...
N1, T1刷机记录
硬件配置 N1和T1使用的是晶晨Amlogic方案的芯片, 配置明细分别如下, 都是现在盒子的主流配置 N1CPU: Amlogic S905, ARM Cortex-A53 四核 up to 2.0 ...
基于Centos搭建 Mono 开发环境
系统要求: CentOS 7.2 64 位操作系统安装 Mono 安装前的准备 yum install yum-utils 执行命令添加安装包仓库 rpm --import "http:/ ...

tensorflow随机梯度下降算法使用滑动平均模型

tensorflow随机梯度下降算法使用滑动平均模型的更多相关文章

随机推荐

热门专题