循环IRNNv2Layer实现

IRNNv2Layer实现循环层，例如循环神经网络（RNN），门控循环单元（GRU）和长期短期记忆（LSTM）。支持的类型为RNN，GRU和LSTM。它执行循环操作，该操作由几个众所周知的循环神经网络（RNN）“单元”之一定义。

层描述

该层接受输入序列 X，初始隐藏状态 H₀_，如果该单元格是长短期记忆（LSTM）单元格，则初始单元格状态 C₀_，并产生输出 y 代表通过计算得出的最终RNN“子层”的输出 t时间步长（请参见下文）。可选地，该层还可以产生输出 h_T 代表最终的隐藏状态，如果该单元格是LSTM单元格，则输出 c_T代表最终的细胞状态。

单元的操作定义为函数 G(x, h, c)。此功能需要向量输入x,h,and c，并产生最多两个向量输出 ^ h “ 和 ç “，表示执行单元操作后的隐藏状态和单元状态。

在默认（单向）配置中，RNNv2层适用 G如下图所示：

G' 是G的变体。

进入方框的箭头是功能输入，而远离方框的箭头是功能输出。X = [x₀, x₁, …, x_T], Y = [y₀, y₁, …, y_T], H_i= [h_i,0, h_i,1, …, h_i,L], and C_i= [c_i,0, c_i,1, …, c_i,L]。

灰色 C 仅当RNN将LSTM单元用于 G 和 G'。

注意：以上结构有L "sub-layers" (horizontal rows of G)，以及矩阵matrices H_i and C_i have dimensionality L。

可选地，序列长度 t可以被指定为RNNv2层的输入，从而允许客户端指定一批具有不同长度的输入序列。

双向RNN （BiRNN）：可以将RNN配置为双向。在这种情况下，每个子层都由一个“前向”层和“向后”层组成。前向层迭代地适用G 使用 The forward layer iteratively applies G using x_i from0to T，然后向后层迭代地应用 applies G using x_i from T to0，如下图所示：

上图中的黑条表示串联。完全隐藏状态 h_t 由前向隐藏状态的串联定义 h_tf 和向后隐藏状态 h_tb：

h_t,i = [ h_tf,i,h_tb,i]
h_t= [ h_t,0,,h_t,1, …,h_t,L]。

类似地，对于单元状态（未示出）。每ht,i，用作下一个子层的输入，如上所示。

RNN算子： RNNv2层支持以下单元操作：

ReLU: G(x, h, c) := max(W_ix + R_ih + W_b + R_b, 0) (c not used)
tanh: G(x, h, c) := tanh(W_ix + R_ih + W_b + R_b) (c not used)
GRU:

Z := sigmoid(W_zx + R_zh + W_bz + R_bz)
M := sigmoid(W_rx + R_rh + W_br + R_br)
G(x, h, c) := tanh(W_hx + M(h + R_bh) + W_bh) (c not used)

LSTM:

I := sigmoid(W_Ix + R_Ih + W_bi + R_bi)
F := sigmoid(W_fx + R_fh + W_bf + R_bf)
O := sigmoid(W_ox + R_oh + W_bo + R_bo)
C := tanh(W_Cx + R_Ch + W_bc + R_bc)
C’ := F × C
H := O x tanh(C’)
G(x, h, c) := { H, C’ }

对于GRU和LSTM，我们指的是Z, M, I, F, etc. as "gates"等称为“门”。

在单向情况下， the W matrices is HxE for the first layer and HxH，对于后续图层（除非设置了跳越模式，请参见下文）。在双向情况下，the dimensionality of the W matrices is HxE for the first forward/backward layer, and Hx2H for subsequent layers用于后续图层。

维度the R matrices is always HxH. The biases W_bx and R_bx have dimensionality H。

跳越模式： RNNv2使用的默认模式是“线性模式”。在此模式下，RNNv2层的第一子层使用该单元G’(x, h, c)，它接受一个大小 e的向量 X （嵌入尺寸）和向量 H 和 C 大小 H（隐藏状态大小），并由单元格算子公式定义。后续层使用单元G（x， h，c），其中 X， H和 C 都是大小的向量 h，并且还由单元格算子公式定义。

可选地，可以将RNN配置为以“跳越模式”运行，这意味着第一层的输入权重矩阵是隐式的单元矩阵，并且 X 预期是大小 H。

条件与限制

数据（X）输入和初始隐藏/单元格状态（高₀ 和 C ₀张量至少具有2个非批量尺寸。其它尺寸被认为是批次尺寸。

可选的序列长度输入 T is0-dimensional (scalar)尺寸（标量）（不包括批次尺寸）。

数据（y）输出和最终的隐藏/单元状态（H_T and C_T张量至少具有2个非批量尺寸。其他尺寸被认为是批次尺寸。如果提供了序列长度输入，则将批次中的每个输出填充到最大序列长度T_max。

IRNNv2Layer 支持：

FP32和FP16数据类型用于输入和输出，隐藏和单元张量。
INT32数据类型仅用于序列长度张量。

定义网络后，可以标记所需的输出。未标记为网络输出或不用作另一层输入的RNNv2输出张量将被丢弃。

network->markOutput(*pred->getOutput(1));

pred->getOutput(1)->setType(DataType::kINT32);

rnn->getOutput(1)->setName(HIDDEN_OUT_BLOB_NAME);

network->markOutput(*rnn->getOutput(1));

if (rnn->getOperation() == RNNOperation::kLSTM)

{

rnn->getOutput(2)->setName(CELL_OUT_BLOB_NAME);

network->markOutput(*rnn->getOutput(2));

};

参阅C ++类 IRNNv2Layer或Python类 IRNNv2Layer 有关更多详细信息。

循环IRNNv2Layer实现的更多相关文章

【.net 深呼吸】细说CodeDom（8）：分支与循环
有人会问,为啥 CodeDom 不会生成 switch 语句,为啥没生成 while 语句之类.要注意,CodeDom只关心代码逻辑,而不是语法,语法是给写代码的人用的.如果用.net的“反编译”工具 ...
Recurrent Neural Network系列1--RNN（循环神经网络）概述
作者:zhbzz2007 出处:http://www.cnblogs.com/zhbzz2007 欢迎转载,也请保留这段声明.谢谢! 本文翻译自 RECURRENT NEURAL NETWORKS T ...
Python学习--04条件控制与循环结构
Python学习--04条件控制与循环结构条件控制在Python程序中,用if语句实现条件控制. 语法格式: if <条件判断1>: <执行1> elif <条件判断 ...
模仿Linux内核kfifo实现的循环缓存
想实现个循环缓冲区(Circular Buffer),搜了些资料多数是基于循环队列的实现方式.使用一个变量存放缓冲区中的数据长度或者空出来一个空间来判断缓冲区是否满了.偶然间看到分析Linux内核的循 ...
【JS基础】循环
for 循环的语法: for (语句 1; 语句 2; 语句 3) { 被执行的代码块 } 语句 1 在循环(代码块)开始前执行语句 2 定义运行循环(代码块)的条件语句 3 在循环(代码块)已被 ...
【python之路4】循环语句之while
1.while 循环语句 #!/usr/bin/env python # -*- coding:utf-8 -*- import time bol = True while bol: print '1 ...
To Java程序员：切勿用普通for循环遍历LinkedList
ArrayList与LinkedList的普通for循环遍历对于大部分Java程序员朋友们来说,可能平时使用得最多的List就是ArrayList,对于ArrayList的遍历,一般用如下写法: p ...
JavaScript单线程和浏览器事件循环简述
JavaScript单线程在上篇博客<Promise的前世今生和妙用技巧>的开篇中,我们曾简述了JavaScript的单线程机制和浏览器的事件模型.应很多网友的回复,在这篇文章中将继续展 ...
.NET基础一步步一幕幕[循环、逻辑语句块]
循环.逻辑语句块好久不写博客了,断更了好几天了,从上周五到今天,从北京到上海,跨越了1213.0公里,从一个熟悉的城市到陌生的城市,还好本人适应力比较好,还有感谢小伙伴的接风咯,一切都不是事,好 ...

随机推荐

Python中Numpy模块的使用
目录 NumPy ndarray对象 Numpy数据类型 Numpy数组属性 NumPy NumPy(Numerical Python) 是 Python 的一个扩展程序库,支持大量的维度数组与矩阵运 ...
18张图带你入门最新版JumpServer
环境要求 docker-ce Python3+ mysql5.6+ Redis 1 Ubuntu 安装 docker-ce 环境参考文档 https://docs.docker.com/engine ...
spring中注解@Resource 与@Autowire 区别
① .@Resource 是根据名字进行自动装配:@Autowire是通过类型进行装配. ②. @Resource 注解是 jdk 的:@Autowire 是spring的.
python中的的异步IO
asyncio 是干什么的? 异步网络操作并发协程 python3.0 时代,标准库里的异步网络模块:select(非常底层) python3.0时代,第三方异步网络库:Tornado pytho ...
基于Gitlab的CICD流程
本片文章主要初步介绍什么是CICD流程,并且把整个流程进行拆分理解整个流程的跑通过程. 1.CICD概述什么是CICD呢? 简单的说CICD就是持续集成自动构建自动测试自动部署. 从概念上就可以看出 ...
vue中的nextTick
今天在浏览elementUI官网时,又一次看到了nextTick,其实nextTIck我已经不是第一次看到了,但之前都没怎么弄懂,这次决定好好研究一番-- 异步说明 vue是异步执行DOM更新的. ...
推荐系统论文之序列推荐：KERL
KERL: A Knowledge-Guided Reinforcement Learning Modelfor Sequential Recommendation 摘要 ‍时序推荐是基于用户的顺序行 ...
Spring事务明明开启了，为什么没起作用？？？
一.事务的特性(ACID) 1.原子性(Atomicity):事务是一个原子操作,由一系列动作组成.事务的原子性确保动作要么全部完成,要么完全不起作用. 2.一致性(Consistency):执行事务 ...
Go快速入门（二）
提示:本系列文章适合有其他语音基础并对Go有持续冲动的读者一.package介绍 Go语言的代码是通过package来组织的,package的概念和你知道的其它语言里的libraries或者m ...
关于文字内容过长，导致文本内容超出html 标签宽度的解决方法之自动换行
在标签的style 属性中设置 word-break style="word-break:break-all;" 这样就可以实现换行上截图没设置之前设置之后完美解决!!!!! ...

循环IRNNv2Layer实现

循环IRNNv2Layer实现的更多相关文章

随机推荐

热门专题