人工智能算法综述（二） RNN and LSTM

接上一篇：AI算法综述（一）

RNN：循环神经网络 and LSTM 长短期记忆网络

LSTM就是一个RNN网络，外部的结构是一样的，主要是单元的内在结构不同。或者说LSTM是为了让RNN能够更好的处理NLP（自然语言问题）做的一些内部改造。

我推荐这篇文章理解LSTM ：https://www.jianshu.com/p/9dc9f41f0b29

可能会比我自己说的更好，我这里就简单说一下，不涉及太多技术细节。

我们先回顾一下基本的神经网络结构图

整体结构就是输入层+N层隐层+输出层。

数据的流向就是由左往右，输入X1，X2，X3 会分发给隐层通过这些连线传递过去，然后在节点计算之后有一个输出，继续分发给下一层。

那么单独拎一个节点放大来看的话就是这样的。

Z就是某中间节点。这就是标准的前馈神经网络的结构。

这种结构在处理某一类问题的时候非常无力，就是比方说当前的识别结果，需要依赖上一次的识别结果。

具体的场景就是自然语言的翻译，翻译需要结合上下文语境才能更精确的翻译出来。而不能像某些机译一样，一句一句单独翻译。

那么RNN 所谓的循环神经网络就是在这中间节点做了一个改造。

这个改造就是，把中间节点的输出拷贝一份出来，然后混合着下一次的输入再做一次计算（激活函数）得出结果，反复如是，直到没有输入。

那LSTM跟这个RNN有什么区别呢？

RNN当然也不是万能的，其中也存在各种利弊。

然后有个缺陷，就是假如当前 T 结果依赖上一次（就是 T -1）的结果，这问题不大，那如果依赖 T-2 或者更远一点 T-10 的结果呢？

然后大家看回那个结构图，h20 的结果如果依赖 X1 那么中间的路途遥远，原输入经过了很多次计算才到H20 损耗非常大，变数更大。

而且需要依赖上下文语境的情况在自然语言处理中还普遍存在。所以……

当当当……

LSTM应运而生，为了世界和平而生。

我们先看一下LSTM跟常规的RNN区别。

主要是绿色块里面的变化，外部结构是一样的。

这个内在结构长的很像电路板，可以把这个电路板分为3个部件。

分别是“遗忘门” “输入门” “输出门”

具体这个结构怎么实现的这3个门这里不细说，上面那个地址有详细说明，爱看公式的童鞋可以移步。

这里我概括性的讲为啥要有遗忘门跟输入门、输出门

接我们刚才在RNN那里讲的，如果依赖的结果离的很远，比如说T 依赖 T-10 的输出结果。中间隔了一条银河。

你想要T么？先忘掉T-11 T-12…… 之前的所有信息，然后输入T-10，然后忘掉 T-9 T-8 T-7 …… 然后把 T-10 的输入通过输出门得出结果。

那么遗忘门的摊开之后的参数就是从T-12 到 T 就是：

T-11	T-10	T-9	T-8	T-7	T-6	T-5	T-4	T-3	T-2	T-1	T-0
0	1	0	0	0	0	0	0	0	0	0	0

输入门就是：

T-11	T-10	T-9	T-8	T-7	T-6	T-5	T-4	T-3	T-2	T-1	T-0
0	0	0	0	0	0	0	0	0	0	0	1

所以由

RNN的训练过程就是根据标识好的数据，训练调整这些参数到符合这些数据的规律。

好了，RNN就讲到这里，感谢各位阅读！

后续我会补充，GANs，跟迁移学习方面的综述。

人工智能算法综述（二） RNN and LSTM的更多相关文章

【机器学习PAI实战】—— 玩转人工智能之综述
摘要: 基于人工智能火热的大背景下,通过阿里云的机器学习平台PAI在真实场景中的应用,详细阐述相关算法及使用方法,力求能够让读者读后能够马上动手利用PAI搭建属于自己的机器学习实用方案,真正利用PAI ...
深度学习：浅谈RNN、LSTM+Kreas实现与应用
主要针对RNN与LSTM的结构及其原理进行详细的介绍,了解什么是RNN,RNN的1对N.N对1的结构,什么是LSTM,以及LSTM中的三门(input.ouput.forget),后续将利用深度学习框 ...
RNN、LSTM、Char-RNN 学习系列（一）
RNN.LSTM.Char-RNN 学习系列(一) zoerywzhou@gmail.com http://www.cnblogs.com/swje/ 作者:Zhouw 2016-3-15 版权声明 ...
RNN 与 LSTM 的应用
之前已经介绍过关于 Recurrent Neural Nnetwork 与 Long Short-Trem Memory 的网络结构与参数求解算法( 递归神经网络(Recurrent Neural N ...
TensorFlow之RNN：堆叠RNN、LSTM、GRU及双向LSTM
RNN(Recurrent Neural Networks,循环神经网络)是一种具有短期记忆能力的神经网络模型,可以处理任意长度的序列,在自然语言处理中的应用非常广泛,比如机器翻译.文本生成.问答系统 ...
RNN和LSTM
一.RNN 全称为Recurrent Neural Network,意为循环神经网络,用于处理序列数据. 序列数据是指在不同时间点上收集到的数据,反映了某一事物.现象等随时间的变化状态或程度.即数据之 ...
浅谈RNN、LSTM + Kreas实现及应用
本文主要针对RNN与LSTM的结构及其原理进行详细的介绍,了解什么是RNN,RNN的1对N.N对1的结构,什么是LSTM,以及LSTM中的三门(input.ouput.forget),后续将利用深度学 ...
深度学习之从RNN到LSTM
1.循环神经网络概述循环神经网络(RNN)和DNN,CNN不同,它能处理序列问题.常见的序列有:一段段连续的语音,一段段连续的手写文字,一条句子等等.这些序列长短不一,又比较难拆分成一个个独立的样本 ...
RNN以及LSTM的介绍和公式梳理
前言好久没用正儿八经地写博客了,csdn居然也有了markdown的编辑器了,最近花了不少时间看RNN以及LSTM的论文,在组内『夜校』分享过了,再在这里总结一下发出来吧,按照我讲解的思路,理解RN ...

随机推荐

fastjson从1.1.41升级到1.2.28的坑
最近因为fastjson安全漏洞,升级jar包时,踩了一些坑. 新版本FastJsonHttpMessageConverter初始化,默认设置MediaType为*/* 背景: 使用Spring Re ...
passwd命令使用
2018-03-01 10:01:06 例1:passwd username 直接修改用户的密码普通用户可以且只能修改自己的密码,root用户可以修改任何人的密码[root@localhost ~] ...
剑指Offer-字符流中第一个不重复的字符
package String; import java.util.LinkedHashMap; import java.util.Map; /** * 字符流中第一个不重复的字符 * 题目描述 * 请 ...
笔记：Spring Cloud Hystrix 服务容错保护
由于每个单元都在不同的进程中运行,依赖通过远程调用的方式执行,这样就有可能因为网络原因或是依赖服务自身问题出现调用故障或延迟,而这些问题会直接导致调用方的对外服务也出现延迟,若此时调用方的请求不断增加 ...
笔记：Spring Cloud Ribbon RestTemplate 详解
详细介绍RestTemplate 针对几种不同请求类型和参数类型的服务调用实现,示例代码中的 restTemplate 都是通过Spring 注入方式创建的,相关代码如下: @Autowired pr ...
多线程——工具类之Semaphore
一.Semaphore功能介绍 Semaphore类相当于线程计数器,在获取Semaphore对象时设定可以产生的线程总数(线程并不是Semaphore类生成的,它只是统计线程的数量),创建Semap ...
实现Windows数据绑定
dataSet数据集 dataset驻留于内存临时存储数据简单的理解为一个临时数据库将数据源的数据保存在内存中独立于任何数据库创建dataset对象引入命名空间:system.Datadatase ...
lua_cocos精灵的不断闪动
一. 刚开始使用 local blink = cc.Blink:create(1, 10) sprite:runAction(blink) ...
shell命令总结一
简述:这篇总结是在360企业安全实习第一周学到的. Linux中的 2>&1 .if文件命令 .tr .$0等相关参数含义的用法 1. 2>&1 command>/d ...
Spring学习笔记四整合SSH
三大框架架构(整合原理) 步骤1:导包 Hibernate包 1.Hibernate包,hibernate/lib/required 2.hibernate/lib/jpa | java persis ...

人工智能算法综述（二） RNN and LSTM

人工智能算法综述（二） RNN and LSTM的更多相关文章

随机推荐

热门专题