tensorflow-优化器

优化器可以通俗的理解成梯度下降那一套流程。

梯度下降

基本流程

a. 损失函数

b. 求导，计算梯度

c. 更新参数

d. 迭代下一批样本

可以对照着理解tf。

tf 优化器

正常使用流程

a. 创建优化器(也就是选择优化方法，只是选择方法，其他什么也没做)

b. 指定损失函数和可优化参数

c. minimize最小化损失函数，这步包含两个操作，首先计算梯度，然后更新参数

以tf基本优化器，也就是梯度下降为例

optimizer = tf.train.GradientDescentOptimizer(learning_rate)　　　　  # 优化器

global_step = tf.Variable(0, name='global_step', trainable=False)　  # 记录全局训练步骤

train_op = optimizer.minimize(loss, global_step=global_step)　　　　  # 最小化损失函数，包括计算梯度，更新参数，记录训练次数

注意tf中学习率可以是tensor，也就是说它可被feed。

tf 人工实现梯度下降

a. 计算梯度

b. 人工处理梯度

c. 优化参数

也就是把minimize拆开

# 创建一个optimizer.

opt = GradientDescentOptimizer(learning_rate=0.1)

# 计算<list of variables>相关的梯度

grads_and_vars = opt.compute_gradients(loss, <list of variables>)

# grads_and_vars为tuples (gradient, variable)组成的列表。

#对梯度进行想要的处理，比如cap处理

capped_grads_and_vars = [(MyCapper(gv[0]), gv[1]) for gv in grads_and_vars]

# 令optimizer运用capped的梯度(gradients)

opt.apply_gradients(capped_grads_and_vars)

优化器API详解

API	描述
tf.train.Optimizer	tf中优化器是个家族，Optimizer是个基类，一般不用用的是它的子类 GradientDescentOptimizer, AdagradOptimizer，MomentumOptimizer等等
tf.train.Optimizer.__init__(use_locking, name)	初始化
tf.train.Optimizer.minimize(loss, global_step=None, var_list=None, gate_gradients=1, aggregation_method=None, colocate_gradients_with_ops=False, name=None, grad_loss=None)	最小化损失函数，返回更新后的参数列表 global_step 为迭代次数，如果不为None，它的值会自增 var_list 为参数列表，此步包含计算梯度和更新参数两步，也就是下面两个API
tf.train.Optimizer.compute_gradients(loss, var_list=None, gate_gradients=1, aggregation_method=None, colocate_gradients_with_ops=False, grad_loss=None)	计算梯度，只是求导，没做其他的，返回（梯度，变量）的tuples loss是损失函数 var_list 是参数列表，基于loss对这些参数求导其他版本 tf.gradients
tf.train.Optimizer.apply_gradients(grads_and_vars, global_step=None, name=None)	将梯度应用到变量上，更新参数，返回一个应用指定梯度的操作Operation，并对global_step做自增操作
tf.train.Optimizer.get_name()	获取名称

并发性参数

调试函数（高级API）

子类优化器

tf.train.GradientDescentOptimizer　　　　梯度下降

tf.train.MomentumOptimizer　　　　　　动量梯度下降

tf.train.AdadeltaOptimizer

tf.train.AdagradOptimizer

tf.train.AdamOptimizer

tf.train.FtrlOptimizer

tf.train.RMSPropOptimizer

参考资料

http://www.cnblogs.com/hellcat/p/7041433.html

http://www.360doc.com/content/18/0505/10/54605916_751286822.shtml

https://www.cnblogs.com/wuzhitj/p/6648641.html

https://blog.csdn.net/hustqb/article/details/80302726

tensorflow-优化器的更多相关文章

TensorFlow从0到1之TensorFlow优化器（13）
高中数学学过,函数在一阶导数为零的地方达到其最大值和最小值.梯度下降算法基于相同的原理,即调整系数(权重和偏置)使损失函数的梯度下降. 在回归中,使用梯度下降来优化损失函数并获得系数.本节将介绍如何使 ...
TensorFlow优化器及用法
TensorFlow优化器及用法函数在一阶导数为零的地方达到其最大值和最小值.梯度下降算法基于相同的原理,即调整系数(权重和偏置)使损失函数的梯度下降. 在回归中,使用梯度下降来优化损失函数并获得系 ...
tensorflow优化器-【老鱼学tensorflow】
tensorflow中的优化器主要是各种求解方程的方法,我们知道求解非线性方程有各种方法,比如二分法.牛顿法.割线法等,类似的,tensorflow中的优化器也只是在求解方程时的各种方法. 比较常用的 ...
TensorFlow优化器浅析
本文基于tensorflow-v1.15分支,简单分析下TensorFlow中的优化器. optimizer = tf.train.GradientDescentOptimizer(learning_ ...
DNN网络（三）python下用Tensorflow实现DNN网络以及Adagrad优化器
摘自: https://www.kaggle.com/zoupet/neural-network-model-for-house-prices-tensorflow 一.实现功能简介: 本文摘自Kag ...
Tensorflow 中的优化器解析
Tensorflow:1.6.0 优化器(reference:https://blog.csdn.net/weixin_40170902/article/details/80092628) I: t ...
tensorflow的几种优化器
最近自己用CNN跑了下MINIST,准确率很低(迭代过程中),跑了几个epoch,我就直接stop了,感觉哪有问题,随即排查了下,同时查阅了网上其他人的blog,并没有发现什么问题之后copy了一篇 ...
莫烦大大TensorFlow学习笔记（8）----优化器
一.TensorFlow中的优化器 tf.train.GradientDescentOptimizer:梯度下降算法 tf.train.AdadeltaOptimizer tf.train.Adagr ...
TensorFlow使用记录 (六）：优化器
0. tf.train.Optimizer tensorflow 里提供了丰富的优化器,这些优化器都继承与 Optimizer 这个类.class Optimizer 有一些方法,这里简单介绍下: 0 ...
Tensorflow 2.0 深度学习实战 —— 详细介绍损失函数、优化器、激活函数、多层感知机的实现原理
前言 AI 人工智能包含了机器学习与深度学习,在前几篇文章曾经介绍过机器学习的基础知识,包括了监督学习和无监督学习,有兴趣的朋友可以阅读< Python 机器学习实战 >.而深度学习开始只 ...

随机推荐

基于C# winform实现图片流存储到文件
本文所述实例实现将一张图片上传到指定的文件夹,然后在窗体上的PictrueBox控件中显示出来. 具体功能代码如下: private void btnUpload_Click(object sende ...
day1-6 字符串、列表、元组、字典、类型转换
day1 1.python历史. 宏观上:python2 与 python3 区别: python2 源码不标准,混乱,重复代码太多, python3 统一标准,去除重复代码. 2.python的环 ...
dfs的一个小实现（啊哈算法的例题）
给定n个盒子,将n个小球放进这些盒子里,判断都有多少种情况写深度优先搜索最重要的是理解当前步怎么做,下一步就当系统已经帮你实现好了(因为只要写好当前步,下一步解决方法和当前步是一样的). #incl ...
Seagull License Server 9.4 SR3 2781 完美激活(解决不能打印问题)
BarTender 9.4 SR3完美激活方法网上下载的BarTender 9.4大部分不能正常打印,已经测试过了,完美解决无法打印,界面停留在“无法打印,出现正在试图连接到seagull lice ...
nginx本地缓存
Nginx 作为Web服务器或者负载均衡器,一般不执行业务逻辑,而是将请求转到后端服务器,比如 Tomcat 或者 php-fpm,后端处理完毕之后将经过 nginx 将数据返回给用户.在请求转发的过 ...
for + setTimeout
一.背景最近在翻看以前的老书<node.js开发指南>,恰好碰到 for 循环 + setTimeout 的经典例子,于是重新梳理了思路并记录下. 二.写在前面,setTimeout 和 ...
python-day81--Ajax
一.准备知识:json 1.什么是json? JSON(JavaScript Object Notation, JS 对象标记) 是一种轻量级的数据交换格式.任何的语言之间都可以用json进行数据的交 ...
SpringBoot项目Shiro的实现（一）
一.Shiro的简单介绍 Shiro是Apache下的一个开源项目,我们称之谓Apache Shiro,它是一个易用与Java项目的安全框架,提供了认证.授权.加密.会话管理,与Spring Secu ...
HashTable Queue Stack SortedList BitArray
HashTable 由于是非泛型集合,因此存储进去的都是object类型,不管是键还是值. Hashtable不允许排序 key不允许重复键不允许为null Queue和Queue<T> ...
const 内联枚举宏
const 常量程序运行时在常量表中,系统为它分配内存,在堆栈分配了空间:const常量有数据类型:语句末有分号:有类型检查:可以限制范围 //将所有不希望改变的变量加const修饰 const ...

tensorflow-优化器

tensorflow-优化器的更多相关文章

随机推荐

热门专题