官方实现

PyTorch已经实现了一个RNN类，就在torch.nn工具包中，通过torch.nn.RNN调用。

使用步骤：

实例化类；
将输入层向量和隐藏层向量初始状态值传给实例化后的对象，获得RNN的输出。

在实例化该类时，需要传入如下属性：

input_size：输入层神经元个数；
hidden_size：每层隐藏层的神经元个数；
num_layers：隐藏层层数，默认设置为1层；
nonlinearity：激活函数的选择，可选是'tanh'或者'relu'，默认设置为'tanh'；
bias：偏置系数，可选是'True'或者'False'，默认设置为'True'；
batch_first：可选是'True'或者'False'，默认设置为'False'；
dropout：默认设置为0。若为非0，将在除最后一层的每层RNN输出上引入Dropout层，dropout概率就是该非零值；
bidirectional：默认设置为False。若为True，即为双向RNN。

RNN的输入有两个，一个是input，一个是h₀。input就是输入层向量，h₀就是隐藏层初始状态值。

若没有采用批量输入，则输入层向量的形状为(L, H_in)；

若采用批量输入，且batch_first为False，则输入层向量的形状为(L, N, H_in)；

若采用批量输入，且batch_first为True，则输入层向量的形状为(N, L, H_in)；

对于(N, L, H_in)，在文本输入时，可以按顺序理解为(每次输入几句话，每句话有几个字，每个字由多少维的向量表示)。

若没有采用批量输入，则隐藏层向量的形状为(D * num_layers, H_out)；

若采用批量输入，则隐藏层向量的形状为(D * num_layers, N, H_out)；

注意，batch_first的设置对隐藏层向量的形状不起作用。

RNN的输出有两个，一个是output，一个是h_n。output包含了每个时间步最后一层的隐藏层状态，h_n包含了最后一个时间步每层的隐藏层状态。

若没有采用批量输入，则输出层向量的形状为(L, D * H_out)；

若采用批量输入，且batch_first为False，则输出层向量的形状为(L, N, D * H_out)；

若采用批量输入，且batch_first为True，则输出层向量的形状为(N, L, D * H_out)。

参数解释：

N代表的是批量大小；
L代表的是输入的序列长度；
若是双向RNN，则D的值为2；若是单向RNN，则D的值为1；
H_in在数值上是输入层神经元个数；
H_out在数值上是隐藏层神经元个数。

import torch

import torch.nn as nn

rnn = nn.RNN(10, 20, 1, batch_first=True)  # 实例化一个单向单层RNN

input = torch.randn(5, 3, 10)

h0 = torch.randn(1, 5, 20)

output, hn = rnn(input, h0)

手写复现

复现代码

import torch

import torch.nn as nn

class MyRNN(nn.Module):

    def __init__(self, input_size, hidden_size):

        super().__init__()

        self.input_size = input_size

        self.hidden_size = hidden_size

        self.weight_ih = torch.randn(self.hidden_size, self.input_size) * 0.01

        self.weight_hh = torch.randn(self.hidden_size, self.hidden_size) * 0.01

        self.bias_ih = torch.randn(self.hidden_size)

        self.bias_hh = torch.randn(self.hidden_size)

    def forward(self, input, h0):

        N, L, input_size = input.shape

        output = torch.zeros(N, L, self.hidden_size)

        for t in range(L):

            x = input[:, t, :].unsqueeze(2)  # 获得当前时刻的输入特征，[N, input_size, 1]。unsqueeze(n)，在第n维上增加一维

            w_ih_batch = self.weight_ih.unsqueeze(0).tile(N, 1, 1)  # [N, hidden_size, input_size]

            w_hh_batch = self.weight_hh.unsqueeze(0).tile(N, 1, 1)  # [N, hidden_size, hidden_size]

            w_times_x = torch.bmm(w_ih_batch, x).squeeze(-1)  # [N, hidden_size]。squeeze(n)，在第n维上减小一维

            w_times_h = torch.bmm(w_hh_batch, h0.unsqueeze(2)).squeeze(-1)  # [N, hidden_size]

            h0 = torch.tanh(w_times_x + self.bias_ih  + w_times_h + self.bias_hh)

            output[:, t, :] = h0

        return output, h0.unsqueeze(0)

验证正确性

my_rnn = MyRNN(10, 20)

input = torch.randn(5, 3, 10)

h0 = torch.randn(5, 20)

my_output, my_hn = my_rnn(input, h0)

print(output.shape == my_output.shape, hn.shape == my_hn.shape)

True True

主要参考

官方说明文档

RNN的PyTorch实现的更多相关文章

Pytorch基础——使用 RNN 生成简单序列
一.介绍内容使用 RNN 进行序列预测今天我们就从一个基本的使用 RNN 生成简单序列的例子中,来窥探神经网络生成符号序列的秘密. 我们首先让神经网络模型学习形如 0^n 1^n 形式的上下文无 ...
pytorch_08_RNN
1.循环神经网络的提出是基于记忆模型的想法,期望网络能够记住前面出现的特征,并依据特征推断后面的结果,而且整体的网络结构不断循环,因而得名循环神经网络. 2.循环神经网络的基本结构特别简单,就是将网络 ...
“你什么意思”之基于RNN的语义槽填充(Pytorch实现)
1. 概况 1.1 任务口语理解(Spoken Language Understanding, SLU)作为语音识别与自然语言处理之间的一个新兴领域,其目的是为了让计算机从用户的讲话中理解他们的意图 ...
Pytorch系列教程-使用字符级RNN生成姓名
前言本系列教程为pytorch官网文档翻译.本文对应官网地址:https://pytorch.org/tutorials/intermediate/char_rnn_generation_tutor ...
Pytorch系列教程-使用字符级RNN对姓名进行分类
前言本系列教程为pytorch官网文档翻译.本文对应官网地址:https://pytorch.org/tutorials/intermediate/char_rnn_classification_t ...
pytorch实现rnn并且对mnist进行分类
1.RNN简介 rnn,相比很多人都已经听腻,但是真正用代码操练起来,其中还是有很多细节值得琢磨. 虽然大家都在说,我还是要强调一次,rnn实际上是处理的是序列问题,与之形成对比的是cnn,cnn不能 ...
pytorch中如何处理RNN输入变长序列padding
一.为什么RNN需要处理变长输入假设我们有情感分析的例子,对每句话进行一个感情级别的分类,主体流程大概是下图所示: 思路比较简单,但是当我们进行batch个训练数据一起计算的时候,我们会遇到多个训练 ...
pytorch之 RNN 参数解释
上次通过pytorch实现了RNN模型,简易的完成了使用RNN完成mnist的手写数字识别,但是里面的参数有点不了解,所以对问题进行总结归纳来解决. 总述:第一次看到这个函数时,脑袋有点懵,总结了下总 ...
PyTorch快速入门教程七（RNN做自然语言处理）
以下内容均来自: https://ptorch.com/news/11.html word embedding也叫做word2vec简单来说就是语料中每一个单词对应的其相应的词向量,目前训练词向量的方 ...
pytorch rnn 2
import torch import torch.nn as nn import numpy as np import torch.optim as optim class RNN(nn.Modul ...

随机推荐

Windows Server体验之管理
安装了只有命令行界面的Windows Server之后怎么去管理,对于传统的Windows管理员来说确实是比较棘手的.因为没有了图形化的管理界面,需要更多的去依赖Powershell或者cmd命令去做 ...
Windows客户端DNS工作原理
通常大家对Windows客户端DNS的配置存在多个误区. 误区一,配置1个内网DNS,1个外网DNS.解析内网的时候用内网DNS,解析外网的时候用外网. 电脑怎么知道哪个是内网?哪个是外网?我们内部的 ...
《网页设计基础——CSS的四种引入方式详解》
网页设计基础--CSS的四种引入方式详解一.行内式: 规则: 1. 行内式是所有样式方法中最为直接的一种,它直接对HTML的标记使用style属性,然后将CSS代码直接写在其中. 格 ...
带你了解CANN的目标检测与识别一站式方案
摘要: 了解通用目标检测与识别一站式方案的功能与特性,还有实现流程,以及可定制点. 本文分享自华为云社区<玩转CANN目标检测与识别一站式方案>,作者: Tianyi_Li. 背景介绍目 ...
MySQL主从同步报错故障处理记录
从库上记录删除失败,Error_code: 1032 问题描述:在master上删除一条记录,而slave上找不到,导致报错 Last_SQL_Error: Could not execute Del ...
Elastic：使用Postman来访问需要账号密码的Elastic Stack
21. Fluentd输出插件：rewrite_tag_filter用法详解
我们在做日志处理时,往往会从多个源服务器收集日志,然后在一个(或一组)中心服务器做日志聚合分析. 源服务器上的日志可能属于同一应用类型,也可能属于不同应用类型.我们可能需要在聚合服务器上对这些不同类型 ...
.NET 反向代理 YARP 自定义配置提供程序（Configuration Providers）
介绍基本 Yarp 示例显示从 appsettings.json 加载的代理配置.相反,代理配置可以从您选择的源以编程方式加载.您可以通过提供几个实现 IProxyConfigProvider 和 ...
NSIS检测并统计字符串中某个字符个数
!include "LogicLib.nsh" OutFile "检查找字符串中c出现的次数.exe" Name "test" Sectio ...
如何使用 Yolov4 训练人脸口罩检测模型
前言疫情当下,出入医院等公共场所都被要求佩戴口罩.这篇博客将会介绍如何使用 Yolov4,训练一个人脸口罩检测模型(使用 Yolov4 的原因是目前只复现到了 v4 ),代码地址为 https:// ...

RNN的PyTorch实现