pytorch之 RNN 参数解释

上次通过pytorch实现了RNN模型，简易的完成了使用RNN完成mnist的手写数字识别，但是里面的参数有点不了解，所以对问题进行总结归纳来解决。

总述：
第一次看到这个函数时，脑袋有点懵，总结了下总共有五个问题：

1.这个input_size是啥？要输入啥？feature num又是啥？

2.这个hidden_size是啥？要输入啥？feature num又是啥？

3.不是说RNN会有很多个节点连在一起的吗？这怎么定义连接的节点数呢？

4.num_layer中说的stack是怎么stack的？

5.怎么输出会有两个东西呀output，hn

pytorch中RNN的一些参数，并且解决以上五个问题

1.Pytorch中的RNN

2.input_size是啥？
说白了input_size无非就是你输入RNN的维度，比如说NLP中你需要把一个单词输入到RNN中，这个单词的编码是300维的，那么这个input_size就是300.这里的input_size其实就是规定了你的输入变量的维度。用f(wX+b)来类比的话，这里输入的就是X的维度。

3.hidden_size是啥？
和最简单的BP网络一样的，每个RNN的节点实际上就是一个BP嘛，包含输入层，隐含层，输出层。这里的hidden_size呢，你可以看做是隐含层中，隐含节点的个数。

那个输入层的三个节点代表输入维度为3，也就是input_size=3，然后这个hidden_size就是5了。当然这是是对于RNN某一个节点而言的，那么如何规定RNN的节点个数呢？

4.如何规定节点个数？

事实上，节点个数并不需要规定，你的输入序列是这样子的，[x1,x2,x3,x4,x5]，那么input_size呢就是你的xi的维度，而你的RNN的节点数呢，就是由你的序列长度决定的，在这里我们的序列长度是5，所以会有5个节点。那么问题来了，我咋知道你的序列长度呢？pytorch里面不是只有input_size的参数吗？实际上，你声明RNN是这样声明的

self.encoder = nn.RNN(input_size=300,hidden_size=128,dropout=0.5)
但是你用的时候;

output,hn = self.encoder(encoder_input,encoder_hidden)
你会把你的数据丢进去吧，也就是你把encoder_input这一整个序列丢进去了，那么序列长度他不就知道了？

5.num_layers是啥？
一开始你是不是以为这个就是RNN的节点数呀，hhh，然而并不是:),如果num_layer=2的话，表示两个RNN堆叠在一起。那么怎么堆叠的呢？

如果是num_layer==1的话：

如果num_layer==2的话：

ok了~最后再来看看最后一个问题

6.hn,output分别是啥？

　　hidden的输出size为[ num_layers* num_directions, batch_size, n_hidden].

　　说白了，hidden就是每个方向，每个层的隐藏单元的输出，所以是n_hidden个。

　　output的size(如果RNN设定的batch_first=True),那么就是[batch_size,seq_len,n_hidden]，对于分类任务如果要取得最后一个output，只需添加下标 [ :,-1,:]

看图找答案：

hn就是RNN的最后一个隐含状态，output就是RNN最终得到的结果。

pytorch之 RNN 参数解释的更多相关文章

pytorch之 RNN regression
关于RNN模型参数的解释,可以参看RNN参数解释 1 import torch from torch import nn import numpy as np import matplotlib.py ...
pytorch实现rnn并且对mnist进行分类
1.RNN简介 rnn,相比很多人都已经听腻,但是真正用代码操练起来,其中还是有很多细节值得琢磨. 虽然大家都在说,我还是要强调一次,rnn实际上是处理的是序列问题,与之形成对比的是cnn,cnn不能 ...
http load 的使用以及参数解释
http load 的使用以及参数解释 1.参数含义参数全称含义 -p -parallel 并发的用户进程数.-f -fetches ...
/etc/sysctl.conf参数解释
/etc/sysctl.conf参数解释: fs.file max = 999999 #表示进程(例如一个worker进程)可能同时打开的最大句柄数,直接限制最大并发连接数 net.ipv4.tcp_ ...
lcd参数解释及刷新率计算，LCD时序
一.LCD显示图像的过程如下: 其中,VSYNC和HSYNC是有宽度的,加上后如下: 参数解释: HBP(Horizontal Back Porch)水平后沿:在每行或每列的象素数据开始输出时要插入的 ...
Yolov3参数解释以及答疑
目录参数解析训练答疑参数解析 [net] #Testing #batch=1 //test:一次一个图片 #subdivisions=1 #Training batch=32 //一次迭代送 ...
angular-cli.json配置参数解释，以及依稀常用命令的通用关键参数解释
一. angular-cli.json常见配置 { "project": { "name": "ng-admin", //项目名称 &quo ...
mysql命令行各个参数解释
mysql命令行各个参数解释 http://blog.51yip.com/mysql/1056.html Usage: mysql [OPTIONS] [database] //命令方式 -?, ...
Wget用法、参数解释
wget功能的强大就不用多说了,在高手手里,它就像是个无往不利的杀人利器,下面是转载的一篇Wget用法.参数解释的比较好的一个文章,当然最好的老师还是man wget 是一个从网络上自动下载文件的自由 ...

随机推荐

python隐藏类中的属性
方法一: 效果图一: 代码一: # 定义一个矩形的类 class Rectangle: # 定义初始化方法 def __init__(self,width,height): self.hidden_w ...
继承Exception⭐⭐
public class ECOrderException : Exception { //第一种类型: throw new ECOrderException { ErrorCode = " ...
Centos7.6部署k8s v1.16.4高可用集群(主备模式)
一.部署环境主机列表: 主机名 Centos版本 ip docker version flannel version Keepalived version 主机配置备注 master01 7.6. ...
Redis常用命令详细介绍
一.字符串字符串键是Redis最基本的键值对类型,将一个单独的键和一个单独的值关联起来.通过字符串键,不仅可以存储和读取字符串,如果输入能被解释为整数和浮点数,还能执行自增或自减操作. 1.SET: ...
Java入门 - 导读
原文地址:http://www.work100.net/training/java 更多教程:光束云 - 免费课程 Java入门 Java 是由 Sun Microsystems 公司于1995年5月 ...
「从0到1学习微服务SpringCloud 」07 RabbitMq的基本使用
系列文章(更新ing): 「从0到1学习微服务SpringCloud 」01 一起来学呀! 「从0到1学习微服务SpringCloud 」02 Eureka服务注册与发现「从0到1学习微服务S ...
# 团队项目-Beta冲刺2（七个小矮人）
团队项目-Beta冲刺2(七个小矮人) 一.格式描述这个作业属于哪个课程 https://edu.cnblogs.com/campus/xnsy/GeographicInformationScien ...
java内存模型梳理
java内存模型内存模型和内存结构区别它们是两个概念. 内存模型是和jvm多线程相关的. 内存结构是指的jvm内存结构. 内存模型的作用内存模型简称JMM JMM是决定一个线程对共享变量的写入时 ...
Docker深入浅出系列 | 单节点多容器网络通信
目录教程目标准备工作带着问题开车同一主机两个容器如何相互通信? 怎么从服务器外访问容器 Docker的三种网络模式是什么 Docker网络通信原理计算机网络模型回顾 Linux中的网卡查看 ...
python接口自动化测试 - 数据驱动DDT模块的简单使用
DDT简单介绍名称:Data-Driven Tests,数据驱动测试作用:由外部数据集合来驱动测试用例的执行核心的思想:数据和测试代码分离应用场景:一组外部数据来执行相同的操作优点:当测试数 ...

pytorch之 RNN 参数解释

pytorch之 RNN 参数解释的更多相关文章

随机推荐

热门专题