关于LSTM实现长短期记忆功能问题

2019-09-07 22:01:45

问题描述：LSTM是如何实现长短期记忆功能的？

问题求解：

与传统的循环神经网络相比，LSTM仍然是基于当前输入和之前的隐状态来计算当前的隐状态，只不过对内部的结构进行了精心的设计，加入了更新门，遗忘门和输出门这三个门和一个内部记忆单元。

在一个训练好的网络中，当输入的序列中没有重要的信息时，LSTM的遗忘门的数值接近于1，更新门的数据接近于0，此时过去的记忆会被保存，从而实现了长期的记忆功能；当输入的序列中出现了重要的信息时，LSTM应该把其存入记忆时，此时更新门的数值将接近于1；当输入的信息中出现了重要的信息，并且该信息意味着之前的记忆不再重要的时候，输入门的数值接近于1，遗忘门的数值接近于0，这样旧的记忆被遗忘，新的重要的信息被记忆。经过这样的设计，整个网络更容易学习到序列之间的长期依赖。

关于激活函数的选择，在LSTM中，更新门，遗忘门，输出门的激活函数选择的是Sigmoid函数；在生成候选记忆的时候，使用的双曲正切函数Tanh作为激活函数。

Sigmoid的输出介于0 - 1之间，符合门控的物理含义，且当输入较大/较小的时候，输出会非常接近1 / 0，从而保证了门控的开和关。

在生成候选记忆的时候，使用Tanh函数，是因为其输出在-1 - 1之间，这与大多数场景下特征分布是0中心的吻合。此外，Tanh函数在输入为0附近相比Sigmoid函数有更大的梯度，通常会帮助模型收敛的更快。

关于LSTM实现长短期记忆功能问题的更多相关文章

LSTM（长短期记忆网络）及其tensorflow代码应用
本文主要包括: 一.什么是LSTM 二.LSTM的曲线拟合三.LSTM的分类问题四.为什么LSTM有助于消除梯度消失一.什么是LSTM Long Short Term 网络即为LSTM,是一种 ...
递归神经网络之理解长短期记忆网络（LSTM NetWorks）（转载）
递归神经网络人类并不是每时每刻都从头开始思考.正如你阅读这篇文章的时候,你是在理解前面词语的基础上来理解每个词.你不会丢弃所有已知的信息而从头开始思考.你的思想具有持续性. 传统的神经网络不能做到这 ...
LSTM长短期记忆神经网络模型简介
LSTM网络也是一种时间递归神经网络,解决RNN的长期依赖关系. RNN模型在训练时会遇到梯度消失或者爆炸的问题,训练时计算和反向传播,梯度倾向于在每一时刻递增或递减,梯度发散到无穷大或者0..... ...
理解长短期记忆网络（LSTM NetWorks）
转自:http://www.csdn.net/article/2015-11-25/2826323 原文链接:Understanding LSTM Networks(译者/刘翔宇审校/赵屹华责编/ ...
如何预测股票分析--长短期记忆网络(LSTM)
在上一篇中,我们回顾了先知的方法,但是在这个案例中表现也不是特别突出,今天介绍的是著名的l s t m算法,在时间序列中解决了传统r n n算法梯度消失问题的的它这一次还会有令人杰出的表现吗? 长短期 ...
Keras（五）LSTM 长短期记忆模型原理及实例
LSTM 是 long-short term memory 的简称, 中文叫做长短期记忆. 是当下最流行的 RNN 形式之一 RNN 的弊端 RNN没有长久的记忆,比如一个句子太长时开头部分可能会忘 ...
TensorFlow——LSTM长短期记忆神经网络处理Mnist数据集
1.RNN(Recurrent Neural Network)循环神经网络模型详见RNN循环神经网络:https://www.cnblogs.com/pinard/p/6509630.html 2. ...
LSTM - 长短期记忆网络
循环神经网络(RNN) 人们不是每一秒都从头开始思考,就像你阅读本文时,不会从头去重新学习一个文字,人类的思维是有持续性的.传统的卷积神经网络没有记忆,不能解决这一个问题,循环神经网络(Recurre ...
LSTMs 长短期记忆网络系列
RNN的长期依赖问题什么是长期依赖? 长期依赖是指当前系统的状态,可能受很长时间之前系统状态的影响,是RNN中无法解决的一个问题. 如果从(1) “ 这块冰糖味道真?”来预测下一个词,是很容易得出“ ...

随机推荐

BTCU(高校区块链联盟)-联盟链第6讲作业
// payment project main.go package main import ( "fmt" "strconv" "github.co ...
React使用笔记2--创建登录组件
文章目录最近在学习使用React作为前端的框架,<React使用笔记>系列用于记录过程中的一些使用和解决方法.本文记录搭建登录页面的过程. 根据产品规划划分模块主要页面逻辑在这里,本 ...
百度地图API：使用百度定位
准备工作: 1.申请百度地图API 2.下载百度地图的SDK 3.将SDK包中的BaiduLBS_Android.jar文件放到,项目里的app/libs里面 4.在src/main目录下创建一个名为 ...
CF 1305E. Kuroni and the Score Distribution
题目大意:题目给定两个数n和m(1<=n<=5000,0<=m<=1e9)要求构造一个数列A,A中元素大于等于1,小于等于1e9且满足严格递增满足ai+aj=ak的(i,j ...
p2.js 与 createjs 的组合应用
开始前简单说下其他几款js物理引擎 box2d老牌,功能全面,但是效率低下,移动端基不用考虑的 matterjs 效率目前我测试下来最高,但是依然还在开发中(好像还很缓慢),目前功能局限,而且有bu ...
高性能内存队列Disruptor--原理分析
1.起源 Disruptor最初由lmax.com开发,2010年在Qcon公开发表,并于2011年开源,其官网定义为:"High Performance Inter-Thread ...
编程老司机带你玩转 CompletableFuture 异步编程
本文从实例出发,介绍 CompletableFuture 基本用法.不过讲的再多,不如亲自上手练习一下.所以建议各位小伙伴看完,上机练习一把,快速掌握 CompletableFuture. 个人博文地 ...
细说集群技术（Cluster）
今天本人给大家讲解一些我对集群技术一个理解,如有不对的或者讲的不好的可以多多提出,我会进行相应的更改,先提前感谢提出意见的各位了!!! 集群(Cluster)技术:通过此可以用较低的成本获取较高的性能 ...
vue的插件使用
插件通常是为Vue添加全局功能,vue的官网介绍了5中添加插件的方法. vue的插件有个公开方法install.第一个参数是Vue构造器,第二个参数是一个可选的选项对象. 在plugin.js中可以这 ...

关于LSTM实现长短期记忆功能问题

关于LSTM实现长短期记忆功能问题的更多相关文章

随机推荐

热门专题