TensorFlow框架下的RNN实践小结

截至目前，TensorFlow的RNN APIs还处于Draft阶段。不过据官方解释，RNN的相关API已经出现在Tutorials里了，大幅度的改动应该是不大可能，现在入手TF的RNN APIs风险应该是不大的。

目前TF的RNN APIs主要集中在tensorflow.models.rnn中的rnn和rnn_cell两个模块。其中，后者定义了一些常用的RNN cells，包括RNN和优化的LSTM、GRU等等；前者则提供了一些helper方法。

创建一个基础的RNN很简单：

`1`	`from` `tensorflow.models.rnn` `import` `rnn_cell`

`2`	`cell` `=` `rnn_cell.BasicRNNCell(inputs, state)`

创建一个LSTM或者GRU的cell？

`1`	`cell` `=` `rnn_cell.BasicLSTMCell(num_units)` `#最最基础的，不带peephole。`

`2`	`cell` `=` `rnn_cell.LSTMCell(num_units, input_size)` `#可以设置peephole等属性。`

`3`	`cell` `=` `rnn_cell.GRUCell(num_units)`

调用呢？

`1`	`output, state` `=` `cell(input, state)`

这样自己按timestep调用需要设置variable_scope的reuse属性为True，懒人怎么做，TF也给想好了：

`1`	`state` `=` `cell.zero_state(batch_size, dtype=tf.float32)`

`2`	`outputs, states` `=` `rnn.rnn(cell, inputs, initial_state=state)`

再懒一点：

`1`	`outputs, states` `=` `rnn.rnn(cell, inputs, dtype=tf.float32)`

怕overfit，加个Dropout如何？

`1`	`cell` `=` `rnn_cell.DropoutWrapper(cell, input_keep_prob=0.5, output_keep_prob=0.5)`

做个三层的带Dropout的网络？

`1`	`cell` `=` `rnn_cell.DropoutWrapper(cell, output_keep_prob=0.5)`

`2`	`cell` `=` `rnn_cell.MultiRNNCell([cell]` `*` `3)`

`3`	`inputs` `=` `tf.nn.dropout(inputs,` `0.5)` `#给第一层单独加个Dropout。`

一个坑——用rnn.rnn要按照timestep来转换一下输入数据，比如像这样：

`1`	`inputs` `=` `[tf.reshape(t, (input_dim[0],` `1))` `for` `t` `in` `tf.split(1, input_dim[1], inputs)]`

rnn.rnn()的输出也是对应每一个timestep的，如果只关心最后一步的输出，取outputs[-1]即可。

注意一下子返回值的dimension和对应关系，损失函数和其它情况没有大的区别。

目前饱受诟病的是TF本身还不支持Theano中scan()那样可以轻松实现的不定长输入的RNN，不过有人反馈说Theano中不定长训练起来还不如提前给inputs加个padding改成定长的训练快。

TensorFlow框架下的RNN实践小结的更多相关文章

TensorFlow框架(5)之机器学习实践
1. Iris data set Iris数据集是常用的分类实验数据集,由Fisher, 1936收集整理.Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集.数据集包含150个数据集,分为3类, ...
TensorFlow框架(6)之RNN循环神经网络详解
1. RNN循环神经网络 1.1 结构循环神经网络(recurrent neural network,RNN)源自于1982年由Saratha Sathasivam 提出的霍普菲尔德网络.RNN的主 ...
python机器学习TensorFlow框架
TensorFlow框架关注公众号"轻松学编程"了解更多. 一.简介 TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习系统,其命名来源于本身的运 ...
AlexeyAB DarkNet YOLOv3框架解析与应用实践（五）
AlexeyAB DarkNet YOLOv3框架解析与应用实践(五) RNNs in Darknet 递归神经网络是表示随时间变化的数据的强大模型.为了更好地介绍RNNs,我强烈推荐Andrej K ...
MySQL在Django框架下的基本操作（MySQL在Linux下配置）
[原]本文根据实际操作主要介绍了Django框架下MySQL的一些常用操作,核心内容如下: ------------------------------------------------------ ...
人工智能 tensorflow框架-->简介及安装01
简介:Tensorflow是google于2015年11月开源的第二代机器学习框架. Tensorflow名字理解:图形边中流动的数据叫张量(Tensor),因此叫Tensorflow 既张量流动 ...
【TensorFlow篇】--Tensorflow框架实现SoftMax模型识别手写数字集
一.前述本文讲述用Tensorflow框架实现SoftMax模型识别手写数字集,来实现多分类. 同时对模型的保存和恢复做下示例. 二.具体原理代码一:实现代码 #!/usr/bin/python ...
Tensorflow之MNIST的最佳实践思路总结
Tensorflow之MNIST的最佳实践思路总结在上两篇文章中已经总结出了深层神经网络常用方法和Tensorflow的最佳实践所需要的知识点,如果对这些基础不熟悉,可以返回去看一下.在< ...
基于TensorFlow的循环神经网络(RNN)
RNN适用场景循环神经网络(Recurrent Neural Network)适合处理和预测时序数据 RNN的特点 RNN的隐藏层之间的节点是有连接的,他的输入是输入层的输出向量.extend(上一 ...

随机推荐

Android View体系（二）实现View滑动的六种方法
1.View的滑动简介 View的滑动是Android实现自定义控件的基础,同时在开发中我们也难免会遇到View的滑动的处理.其实不管是那种滑动的方式基本思想都是类似的:当触摸事件传到View时,系统 ...
【HANA系列】SAP HANA XS使用JavaScript数据交互详解
公众号:SAP Technical 本文作者:matinal 原文出处:http://www.cnblogs.com/SAPmatinal/ 原文链接:[HANA系列]SAP HANA XS使用Jav ...
pyenv离线安装python各版本
1.问题描述: 可能是国内的网络原因,在线用pyenv安装python老是定住没反应 [root@zabbix ~]# pyenv install Downloading Python-.tar.xz ...
【PAT】B1065 单身狗（25 分）
#include<stdio.h> #include<algorithm> #include<math.h> using namespace std; int ca ...
KVM网络桥接模式解说
在上一篇博客中,我画了一张图来解说桥接模式下kvm的网络是什么样子的.那今天我就仔细来解释一下这方面的内容,让大家学会配置桥接网络. 还是这样的一张图,我们知道bridge就是桥接网卡的名称.让虚拟机 ...
PJ可能会用到的动态规划选讲-学习笔记
PJ可能会用到的动态规划选讲-学习笔记 by Pleiades_Antares 难度和速度全部都是按照普及组来定的咯数位状压啥就先不讲了这里主要提到的都是比较简单的DP 一道思维数学巧题(补昨天) ...
浅析Java中的23种设计模式
前言设计模式不论是在我们学习编程,还是在工作和面试过程中,都会涉及到的一个问题,所以了解和学习好设计模式,是我们每一位码农必须要具备的技能,对以后的发展和自己技能的提升都有好处. 什么是设计模式(D ...
css设置文字不能选中状态
高版本浏览器的处理方式 -webkit-touch-callout: none; -webkit-user-select: none; -khtml-user-select: none; -moz-u ...
Django admin 后台管理
在App 文件夹下的 admin.py 文件中写入 from django.contrib import admin from app名 import models admin.site.site_h ...
meta标签使用方法总结
meta标签是用来描述一个HTML网页文档的属性,比如该网页的作者,日期,网页的关键字,刷新,网页等级设定等等,是文档中的最基本的元信息,本文是对meta标签的学习总结,内容大多来自网上各个地方,非原 ...

TensorFlow框架下的RNN实践小结

TensorFlow框架下的RNN实践小结的更多相关文章

随机推荐

热门专题