TensorFlow 实战(二)—— tf.train(优化算法)
- tf 下以大写字母开头的含义为名词的一般表示一个类(class)
 
1. 优化器(optimizer)
优化器的基类(Optimizer base class)主要实现了两个接口,一是计算损失函数的梯度,二是将梯度作用于变量。tf.train 主要提供了如下的优化函数:
- tf.train.Optimizer
 - tf.train.GradientDescentOptimizer
 - tf.train.AdadeltaOpzimizer 
- Ada delta
 
 - tf.train.AdagradDAOptimizer
 - tf.train.MomentumOptimizer
 - tf.train.AdamOptimizer
 - tf.train.FtrlOptimizer
 - tf.train.ProximalGradientDescentOptimizer
 - tf.train.ProximalAdagradOptimizer
 - tf.train.RMSPropOptimizer
 
2. 梯度计算
TensorFlow 同时也提供了给定 TensorFlow 计算图(computation graph)的导数。上节提到的优化器类(optimizer classes)会自动计算 computation graph 的导数,但用户自定义优化器时,可以使用如下低级别的函数:
- tf.gradients
 - tf.AggregationMethod
 - tf.stop_gradient
 - tf.hessians
 
2. 学习率衰减(decaying the learning rate)
tf.train.exponential_decay
# 实现的是如下的操作 decayed_lr = lr * decay_rate ^ (global_step/decay_steps)在其 tf 下的使用为:
lr = tf.train.exponential_decay(0.1, global_step, 100, .96, staircase=True)tf.train.inverse_time_decay
- tf.train.natural_exp_decay
 - tf.train.piecewise_constant
 - tf.train.polynomial_decay
 
TensorFlow 实战(二)—— tf.train(优化算法)的更多相关文章
- TensorFlow 中的 tf.train.exponential_decay() 指数衰减法
		
exponential_decay(learning_rate, global_step, decay_steps, decay_rate, staircase=False, name=None) 使 ...
 - TensorFlow+实战Google深度学习框架学习笔记(10)-----神经网络几种优化方法
		
神经网络的优化方法: 1.学习率的设置(指数衰减) 2.过拟合问题(Dropout) 3.滑动平均模型(参数更新,使模型在测试数据上更鲁棒) 4.批标准化(解决网络层数加深而产生的问题---如梯度弥散 ...
 - tensorflow 下的滑动平均模型 —— tf.train.ExponentialMovingAverage
		
在采用随机梯度下降算法训练神经网络时,使用 tf.train.ExponentialMovingAverage 滑动平均操作的意义在于提高模型在测试数据上的健壮性(robustness). tenso ...
 - 跟我学算法- tensorflow模型的保存与读取 tf.train.Saver()
		
save = tf.train.Saver() 通过save. save() 实现数据的加载 通过save.restore() 实现数据的导出 第一步: 数据的载入 import tensorflo ...
 - Tensorflow实战(二):Discuz验证码识别
		
一.前言 验证码是根据随机字符生成一幅图片,然后在图片中加入干扰象素,用户必须手动填入,防止有人利用机器人自动批量注册.灌水.发垃圾广告等等 . 验证码的作用是验证用户是真人还是机器人. 本文将使用深 ...
 - TensorFlow中的优化算法
		
搭建好网络后,常使用梯度下降类优化算法进行模型参数求解,模型越复杂我们在训练神经网络的过程上花的时间就越多,为了解决这一问题,我们就需要找一些优化算法来提高训练速度,TF的tf.train模块中提供了 ...
 - Tensorflow滑动平均模型tf.train.ExponentialMovingAverage解析
		
觉得有用的话,欢迎一起讨论相互学习~Follow Me 移动平均法相关知识 移动平均法又称滑动平均法.滑动平均模型法(Moving average,MA) 什么是移动平均法 移动平均法是用一组最近的实 ...
 - 梯度优化算法总结以及solver及train.prototxt中相关参数解释
		
参考链接:http://sebastianruder.com/optimizing-gradient-descent/ 如果熟悉英文的话,强烈推荐阅读原文,毕竟翻译过程中因为个人理解有限,可能会有谬误 ...
 - 深度学习原理与框架-Tensorflow基本操作-mnist数据集的逻辑回归  1.tf.matmul(点乘操作) 2.tf.equal(对应位置是否相等) 3.tf.cast(将布尔类型转换为数值类型) 4.tf.argmax(返回最大值的索引) 5.tf.nn.softmax(计算softmax概率值) 6.tf.train.GradientDescentOptimizer(损失值梯度下降器)
		
1. tf.matmul(X, w) # 进行点乘操作 参数说明:X,w都表示输入的数据, 2.tf.equal(x, y) # 比较两个数据对应位置的数是否相等,返回值为True,或者False 参 ...
 
随机推荐
- Valgrind的用法
			
Valgrind是执行在Linux上一套基于仿真技术的程序调试和分析工具,它包括一个内核──一个软件合成的CPU,和一系列的小工具,每一个工具都能够完毕一项任务──调试.分析,或測试等. Valgri ...
 - Loadrunner--集合点
			
集合点的意思是等到特定的用户数后再一起执行某个操作,比如一起保存,一起提交(我们通常意义上的并发数并不是指一起提交或者一起保存),一般情况下使用不到集合点,不过,订票系统或者促销类需要用到,比如说某个 ...
 - 汉字转换成对应ASCII
			
private static byte[] hanziToHexByte(string hanzistring) { byte[] bytes = Encoding ...
 - 简介及环境搭建跑通Hello
			
简介及环境搭建跑通Hello Spring Spring是一个开放源代码的设计层面框架,他解决的是业务逻辑层和其他各层的松耦合问题,因此它将面向接口的编程思想贯穿整个系统应用.是为了解决企业应用程序开 ...
 - orabbix 报错No suitable driver found for
			
orabbix报错如下: 2018-07-11 14:35:20,119 [main] ERROR Orabbix - Error on Configurator for database qa ...
 - Android中Activity切换时共享视图元素的切换动画(5.0以上)
			
同一时候公布在我的博客 点此进入 背景 说来这个的背景很easy,常常在使用图片列表的时候就会想,假设"列表中的图片放大到整个屏幕"作为 Activity 的补间动画.就很完美了. ...
 - php实现 计算字符串的距离
			
php实现 计算字符串的距离 一.总结 一句话总结:解决dp问题最好的方法是什么:分析出状态后 实例+画表. 1.解决dp问题最好的方法是什么? 分析出状态后 实例+画表 2.画图的好处? 画出来表之 ...
 - C#判断操作系统类型
			
操作系统 PlatformID 主版本号 副版本号 Windows95 1 4 0 Windows98 1 4 10 WindowsMe 1 4 90 WindowsN ...
 - oracle数据库的备份与恢复
			
一.备份 方法1: PLSQL中进行导出 对于方式1: 对于导出可执行文件的选择,可通过下面的几个参考位置去查找: 导入imp:F:\app\Administrator\product\11.1 ...
 - python中有关字符串的处理
			
原文 Python 字符串操作(string替换.删除.截取.复制.连接.比较.查找.包含.大小写转换.分割等) 去空格及特殊符号 s.strip().lstrip().rstrip(',') 复制字 ...