RNN的深入理解

针对有着前后序列关系的数据，比如说随着时间变化的数据，显然使用rnn的效果会更好。

循环神经网络的简单结构如下图：简单表示是左边这幅图，展开来看就是右边对每个时刻的数据的处理。单层的RNN网络只有一个单元，前一时刻的数据输入之后得到输出结果然后再传给自己，与下一个时序的数据一块输入。

RNN的前向传播就是一个一个时序的数据输入

RNN的计算公式如下：

其中x<t>是当前时序的数据，W为权重，b为偏置，g是一个激活函数，a<t>是激活状态(相当于输出的初步结果)，y<t>是最终输出

因此对于每个时序，RNN都是输入当前时序的输入x<t> 和来自之前时序的状态a<t-1>，x<t>可以理解为当前的信息，而a<t-1>可以理解为对之前信息的总结。

RNN存在的问题：

随着时序长度边长，rnn的深度也就变深，这样就会产生深度学习的共同问题梯度爆炸和梯度消失，梯度爆炸可以通过剪枝来解决，而梯度消失一直是很难处理的问题，这里

出现两种RNN的改进，GRU以及LSTM,这两种改进都是加入了门结构来控制信息的更新。

首先是简单的GRU，1.在GRU中，引入了记忆细胞，以提供记忆能力，能够在当前时刻联想到之前的。

　　　　　　 2.在GRU中，a<t>和c<t>是相同的，但是在lstm中表达的含义是不同的，a<t>是激活值，c<t>是记忆细胞的值

　　　　　　 3.在GRU中，还引入了门结构，公式中的第二个就是为了给出如何更新记忆细胞的值。

　　　　　　 4.第三个公式可以看出，当前时刻的记忆细胞值的输入有：c-<t>以及c<t-1>和门结构

接下来是Full GRU

相比简单GRU又加入了一个门结构来控制记忆细胞的输出，r代表相关性，γr门告诉你计算出的c~<t>与c<t−1>有多大的相关性。

最后是LSTM，长短期记忆模型

经典的LSTM结构如下：

LSTM相对于GRU加入了其他的门结构，

忘记门，更新门，输出门。

计算公式如下：

LSTM加入了三个新的门结构，使模型更加完备；

遗忘门代替上面几个模型中的（1-yu）,更鲜明，但是引入了更多参数，其中每个门的输入都是a<t-1>,x<t>，每个门都是一个权值偏置后再经过一个激活函数得到输出值。

为什么LSTM能够预防梯度消失？

因为我们可以清晰地看到，在LSTM的上部长期记忆c从头到尾贯穿，每次只有更新的时候才会对它进行修改。而又因为门函数是sigmoid函数的原因，所以可以对信息进行很好的保留。

RNN的深入理解的更多相关文章

【Deep Learning】RNN的直觉理解
https://ujjwalkarn.me/2016/08/11/intuitive-explanation-convnets/
github上虽然已经有实现好的Char RNN
前言学习RNN的时候很多人应该都有看过Andrej Karpathy写的The Unreasonable Effectiveness of Recurrent Neural Networks,使用基 ...
RNN及其变体框架
RNN及其变体框架含RNN推导 LSTM理解理解LSTM网络算法细节理解及参考文献
机器学习- RNN以及LSTM的原理分析
概述 RNN是递归神经网络,它提供了一种解决深度学习的另一个思路,那就是每一步的输出不仅仅跟当前这一步的输入有关,而且还跟前面和后面的输入输出有关,尤其是在一些NLP的应用中,经常会用到,例如在NLP ...
[论文阅读] RNN 在阿里DIEN中的应用
[论文阅读] RNN 在阿里DIEN中的应用 0x00 摘要本文基于阿里推荐DIEN代码,梳理了下RNN一些概念,以及TensorFlow中的部分源码.本博客旨在帮助小伙伴们详细了解每一步骤以及为什 ...
如何简单的理解LSTM——其实没有那么复杂（转载）
转载地址:https://www.jianshu.com/p/4b4701beba92 1.循环神经网络人类针对每个问题的思考,一般不会是完全的从头开始思考.正如当你阅读这篇译文的时候,你会根据已经 ...
用LSTM分类 MNIST
LSTM是RNN的一种算法, 在序列分类中比较有用.常用于语音识别,文字处理(NLP)等领域. 等同于VGG等CNN模型在在图像识别领域的位置. 本篇文章是叙述LSTM 在MNIST 手写图中的使用 ...
Tensorflow应用之LSTM
学习RNN时原理理解起来不难,但是用TensorFlow去实现时被它各种数据的shape弄得晕头转向.现在就结合一个情感分析的案例来了解一下LSTM的操作流程. 一.深度学习在自然语言处理中的应用自 ...
使用TensorFlow动手实现一个Char-RNN
https://blog.csdn.net/thriving_fcl/article/details/72565455 前言学习RNN的时候很多人应该都有看过Andrej Karpathy写的The ...

随机推荐

iOS打包上传问题
iOS 打包不成功的原因: 1.打包时在下图 code signing没有选择发布证书 2.没有配置好pp文件 3.targets-> general 和 setting设置的签名方式不一样,要 ...
Java 输入/输出——处理流（BufferedStream、PrintStream、转换流、推回输入流）
关于使用处理流的优势,归纳起来就是两点:(1)对于开发人员来说,使用处理流进行输入/输出操作更简单:(2)使用处理流执行效率更高. 1.BufferedInputStream/BufferedOutp ...
[DPDK] 转发 DPDK分析
前半部分,对于背景和需求的分析,写的相当好啊! 原文地址:https://www.jianshu.com/p/0ff8cb4deaef 背景分析前10年中,网络程序性能优化的目标主要是为了解决C10 ...
添加图片后xcode报错：resource fork, Finder information, or similar detritus not allowed
/Users/songximing/Library/Developer/Xcode/DerivedData/Children-cvqgzlzddltkfndhdmzedxbnoxwx/Build/Pr ...
LeetCode 700 Search in a Binary Search Tree 解题报告
题目要求 Given the root node of a binary search tree (BST) and a value. You need to find the node in the ...
Qt5线程错误：QThread: Destroyed while thread is still running（执行runThread->exit(0)）
背景: 当前类,编写接收子线程类信号的槽函数和触发子线程类执行的信号: 新建一个子线程类,编写槽函数和信号,MyClass *m_MyClass=new MyClass(): 新建一个线程对象QThr ...
【python基础】常用的内置函数
python基础之内置函数参考: http://www.runoob.com/python/python-built-in-functions.html -zip() zip函数接受任意多个(包括0 ...
SpringBoot-@async异步执行方法
启动加上@EnableAsync ,需要执行异步方法上加入 @Async 在方法上加上@Async之后底层使用多线程技术演示代码: @RestController @Slf4j public c ...
env:bash \r解决
1.brew install dos2unix2.find . -type f -exec dos2unix {} \;
python 合并列表从大到小排序
#!/usr/bin/env python # -*- coding: utf-8 -*- a = [1,2,3,4,5] b = [6,7,8,9,10] a.extend(b) a.reverse ...

RNN的深入理解

RNN的深入理解的更多相关文章

随机推荐

热门专题