RNN总结

RNN既可以表述为循环神经网络（recurrent neural network），也可以表述为递归神经网络（recursive neural network），前者一般用于处理以时间序列为输入的问题（比如把一个句子看成词组成的序列），每次向循环神经网络输入一个词，知道整个句子输入结束。后者一般用于处理图结构或树结构问题（比如为了处理歧义问题，我们构造语法树为输入，而不是循环输入每一个词）。

下图是循环神经网络的展开

图1

下面是一个句子对上图的应用

图2

可以这样理解：将所有用到的英文词向量化之后，the表示为（0.4,0.3），对应图1中的x输入，经过神经元计算之后输出为（1,3.5），神经元内部的计算方式为:

函数f通常是诸如tanh或者ReLU的非线性函数,U，x，St-1都为向量且U、V、W都是待训练参数。输出O可以选择softmax函数，其表达式如下

这里的变量i对应图1中的变量t，可见

也就是说循环神经网络所有输出之和为1，输出O的计算公式为

其中V和St都是向量。也就是说神经元先计算隐状态St，然后计算输出Ot

下面以树结构为例来说明递归神经网络的输入与计算

1.将句子分词之后，给每个词一个向量，这里词的向量化可以采用one-hot或者其他一些向量化工具，比如Google的gensim

2.将词按照树形结构输入，以图3为例

图3

2.1 首先计算“两个”和“外语学院”的父节点的向量，计算方法是：假设“两个”的词向量表示为c1，“外语学院”的词向量表示为c2，那么父节点对应的向量P为

其中W和b是训练好的参数，tanh是双曲正切函数，表达式为

2.2 依次迭代计算各个父节点对应的向量，最终得到根节点对应向量。

因为是以语法树输入的，所以对于歧义问题有较好的处理能力，比如图3中的句子也可以用图4的语法树来表示：

图4

事实上，图3与图4对应的根节点向量完全不同，因为词向量的输入顺序是不一样的。

在得到根节点向量后，我们就可以去完成一些更高级的任务，比如计算语义相似度或者情感分析等。

RNN总结的更多相关文章

RNN求解过程推导与实现
RNN求解过程推导与实现 RNN LSTM BPTT matlab code opencv code BPTT,Back Propagation Through Time. 首先来看看怎么处理RNN. ...
在RNN中使用Dropout
dropout在前向神经网络中效果很好,但是不能直接用于RNN,因为RNN中的循环会放大噪声,扰乱它自己的学习.那么如何让它适用于RNN,就是只将它应用于一些特定的RNN连接上. LSTM的长期记 ...
RNN 入门学习资料整理
建议按序阅读 1. RNN的一些简单概念介绍 A guide to recurrent neural networks and backpropagation Deep learning:四十九(RN ...
lecture7-序列模型及递归神经网络RNN
Hinton 第七课 .这里先说下RNN有recurrent neural network 和 recursive neural network两种,是不一样的,前者指的是一种人工神经网络,后者指的是 ...
RNN 入门教程 Part 4 – 实现 RNN-LSTM 和 GRU 模型
转载 - Recurrent Neural Network Tutorial, Part 4 – Implementing a GRU/LSTM RNN with Python and Theano ...
RNN 入门教程 Part 3 – 介绍 BPTT 算法和梯度消失问题
转载 - Recurrent Neural Networks Tutorial, Part 3 – Backpropagation Through Time and Vanishing Gradien ...
RNN 入门教程 Part 2 – 使用 numpy 和 theano 分别实现RNN模型
转载 - Recurrent Neural Networks Tutorial, Part 2 – Implementing a RNN with Python, Numpy and Theano 本 ...
RNN 入门教程 Part 1 – RNN 简介
转载 - Recurrent Neural Networks Tutorial, Part 1 – Introduction to RNNs Recurrent Neural Networks (RN ...
CNN & RNN 及一些常识知识（不断扩充中）
参考: http://blog.csdn.net/iamrichardwhite/article/details/51089199 一.神经网络的发展历史五六十年代,提出感知机八十年代,提出多层感 ...
循环神经网络(RNN, Recurrent Neural Networks)介绍（转载）
循环神经网络(RNN, Recurrent Neural Networks)介绍这篇文章很多内容是参考:http://www.wildml.com/2015/09/recurrent-neur ...

随机推荐

influxdb基本操作
名词解释在具体的讲解influxdb的相关操作之前先说说influxdb的一些专有名词,这些名词代表什么. influxDB名词 database:数据库: measurement:数据库中的表: ...
SWIFT Optional Value
SWIFT中有一个类型定义叫可选值,在变量类型后面加一个?号即可定义一个类型为Optional Value的变量,当在使用变量时要用到强制解包!. 如在页面上有一个可选输入年龄的框,在接受数据的时间就 ...
Magento邮件发送完美设置
Magento新站上线伊始,不料在邮件上遇到了问题.此时常用的邮件模板已经编辑完毕,诸如New Account, New Order, Password Forget等. CentOS下发送邮件很简单 ...
TensorRT简介-转载
前言 NVIDIA TensorRT是一种高性能神经网络推理(Inference)引擎,用于在生产环境中部署深度学习应用程序,应用有图像分类.分割和目标检测等,可提供最大的推理吞吐量和效率.Tens ...
Unity 3D的常用快捷键
Unity中的常用快捷键本文提供全流程,中文翻译.Chinar坚持将简单的生活方式,带给世人!(拥有更好的阅读体验 -- 高分辨率用户请根据需求调整网页缩放比例) 1 Windows系统Unity3 ...
IDEA错误：Cannot start compilation: the output path is not specified for module "XXX".
错误是发生在从github上checkout自己的项目时.因为没有将配置文件一起上传,所以在运行java程序时有了这个报错: Cannot start compilation: the output ...
2017 ECL-FINAL J.Straight Master
题目链接:http://codeforces.com/gym/101775/problem/J 思路:序列差分一下,然后用得到的查分序列乱搞就可以了注意差分序列第一项等于a[i],之后n-1项为ch ...
torodb docker 运行试用
torodb 可以方便的让你迁移到pg,同时使用标准原生的sql 查询使用官方的docker-compose 进行测试环境准备 docker-compose 文件 wget https://raw ...
Selenium（ThoughtWorks公司开发的web自动化测试工具）
Selenium也是一个用于Web应用程序测试的工具.Selenium测试直接运行在浏览器中,就像真正的用户在操作一样.支持的浏览器包括IE(7.8.9).Mozilla Firefox.Mozill ...
MOSFET 线路 12V 无法工作的问题（等待回复）
问题: ˇ星空-北京:5V的时候,MOS管可以关断:12V的时候关不断: 初步判断在 Q4 上,先建议按以下方式测量数据. (Excel 文件) 等待回复. 参考链接:http://blog.51ct ...

RNN总结

RNN总结的更多相关文章

随机推荐

热门专题