pytorch-LSTM()

torch.nn包下实现了LSTM函数，实现LSTM层。多个LSTMcell组合起来是LSTM。

LSTM自动实现了前向传播，不需要自己对序列进行迭代。

LSTM的用到的参数如下：创建LSTM指定如下参数，至少指定前三个参数

input_size:

	输入特征维数

hidden_size:

	隐层状态的维数

num_layers:

	RNN层的个数，在图中竖向的是层数，横向的是seq_len

bias:

	隐层状态是否带bias，默认为true

batch_first:

	是否输入输出的第一维为batch_size，因为pytorch中batch_size维度默认是第二维度，故此选项可以将	batch_size放在第一维度。如input是(4,1,5)，中间的1是batch_size，指定batch_first=True后就是(1,4,5)

dropout:

	是否在除最后一个RNN层外的RNN层后面加dropout层

bidirectional:

	是否是双向RNN，默认为false，若为true，则num_directions=2，否则为1

为了统一，以后都batch_first=True

LSTM的输入为：LSTM(input,(h0,co))

其中，指定batch_first=True后，input就是(batch_size,seq_len,input_size)

(h0,c0)是初始的隐藏层，因为每个LSTM单元其实需要两个隐藏层的。记hidden=(h0,c0)

其中，h0的维度是(num_layers*num_directions, batch_size, hidden_size)

c0维度同h0。注意，即使batch_first=True，这里h0的维度依然是batch_size在第二维度

LSTM的输出为：out,(hn,cn)

其中，out是每一个时间步的最后一个隐藏层h的输出，假如有5个时间步（即seq_len=5），则有5个对应的输出，out的维度是：(batch_size,seq_len,hidden_size)

而hidden=(hn,cn)，他自己实现了时间步的迭代，每次迭代需要使用上一步的输出和hidden层，最后一步hidden=(hn,cn)记录了最后一各时间步的隐藏层输出，有几层对应几个输出，如果这个是RNN-encoder，则hn,cn就是中间的编码向量。hn的维度是(num_layers*num_directions,batch_size,hidden_size)，cn同。

应用LSTM

创建一LSTM:

lstm = torch.nn.LSTM(input_size,hidden_size,num_layers,batch_first=True)

forward使用LSTM层：

out,hidden = lstm(input,hidden)

其中，hidden=(h0,c0)是个tuple

最终得到out,hidden

举例：

import torch

# 实现一个num_layers层的LSTM-RNN

class RNN(torch.nn.Module):

    def __init__(self,input_size, hidden_size, num_layers):

        super(RNN,self).__init__()

        self.input_size = input_size

        self.hidden_size=hidden_size

        self.num_layers=num_layers

        self.lstm = torch.nn.LSTM(input_size=input_size,hidden_size=hidden_size,num_layers=num_layers,batch_first=True)

    def forward(self,input):

        # input应该为(batch_size,seq_len,input_szie)

        self.hidden = self.initHidden(input.size(0))

        out,self.hidden = lstm(input,self.hidden)

        return out,self.hidden

    def initHidden(self,batch_size):

        if self.lstm.bidirectional:

            return (torch.rand(self.num_layers*2,batch_size,self.hidden_size),torch.rand(self.num_layers*2,batch_size,self.hidden_size))

        else:

            return (torch.rand(self.num_layers,batch_size,self.hidden_size),torch.rand(self.num_layers,batch_size,self.hidden_size))

input_size = 12

hidden_size = 10

num_layers = 3

batch_size = 2

model = RNN(input_size,hidden_size,num_layers)

# input (seq_len, batch, input_size) 包含特征的输入序列，如果设置了batch_first，则batch为第一维

input = torch.rand(2,4,12)

model(input)

【pytorch】pytorch-LSTM的更多相关文章

【翻译】理解 LSTM 网络
目录理解 LSTM 网络递归神经网络长期依赖性问题 LSTM 网络 LSTM 的核心想法逐步解析 LSTM 的流程长短期记忆的变种结论鸣谢本文翻译自 Christopher Olah ...
【翻译】理解 LSTM 及其图示
目录理解 LSTM 及其图示本文翻译自 Shi Yan 的博文 Understanding LSTM and its diagrams,原文阐释了作者对 Christopher Olah 博文 U ...
【转载】PyTorch系列 (二)：pytorch数据读取
原文:https://likewind.top/2019/02/01/Pytorch-dataprocess/ Pytorch系列: PyTorch系列(一) - PyTorch使用总览 PyTorc ...
【转载】Pytorch tutorial 之Datar Loading and Processing
前言上文介绍了数据读取.数据转换.批量处理等等.了解到在PyTorch中,数据加载主要有两种方式: 1.自定义的数据集对象.数据集对象被抽象为Dataset类,实现自定义的数据集需要继承Datase ...
【转载】 pytorch笔记：06)requires_grad和volatile
原文地址: https://blog.csdn.net/jiangpeng59/article/details/80667335 作者:PJ-Javis 来源:CSDN --------------- ...
【转载】 Pytorch 细节记录
原文地址: https://www.cnblogs.com/king-lps/p/8570021.html ---------------------------------------------- ...
【转载】 pytorch之添加BN
原文地址: https://blog.csdn.net/weixin_40123108/article/details/83509838 ------------------------------- ...
【转载】 pytorch自定义网络结构不进行参数初始化会怎样？
原文地址: https://blog.csdn.net/u011668104/article/details/81670544 ------------------------------------ ...
【转载】 Pytorch中的学习率调整lr_scheduler,ReduceLROnPlateau
原文地址: https://blog.csdn.net/happyday_d/article/details/85267561 ------------------------------------ ...
【转载】 PyTorch学习之六个学习率调整策略
原文地址: https://blog.csdn.net/shanglianlm/article/details/85143614 ----------------------------------- ...

随机推荐

SLAM+语音机器人DIY系列：（三）感知与大脑——4.音响麦克风与摄像头
摘要在我的想象中机器人首先应该能自由的走来走去,然后应该能流利的与主人对话.朝着这个理想,我准备设计一个能自由行走,并且可以与人语音对话的机器人.实现的关键是让机器人能通过传感器感知周围环境,并通过 ...
【憩园】C#并发编程之异步编程(二)
写在前面前面一篇文章介绍了异步编程的基本内容,同时也简要说明了async和await的一些用法.本篇文章将对async和await这两个关键字进行深入探讨,研究其中的运行机制,实现编码效率与运行效率 ...
SpringCloud系列——Config 配置中心
前言 Spring Cloud Config为分布式系统中的外部化配置提供了服务器端和客户端支持.有了配置服务器,您就有了一个中心位置来管理跨所有环境的应用程序的外部属性.本文记录实现一个配置中心.客 ...
盘点 Python 中的那些冷知识（二）
上一篇文章分享了 Python中的那些冷知识,地址在这里盘点 Python 中的那些冷知识(一) 今天将接着分享!! 06. 默认参数最好不为可变对象函数的参数分三种可变参数默认参数关键字参 ...
js获取url 中的值，并跳转相应页面
实现方法:一:获取URL带QUESTRING参数的JAVASCRIPT客户端解决方案,相当于asp的request.querystring,PHP的$_GET1.函数: <Script lang ...
DevOps实例
DevOps实例 ------------------------------------------------------------------ 今天先到这儿,希望对您DevOPS, 技术领导力 ...
Excel自动换行、Export2Excel 自动换行
1需求:导出excel后自动换行显示. 2插件:Export2Excel 3.测试 listToExcel() { import('@/vendor/Export2Excel').then(excel ...
如何在Eclipse中彻底修改一个项目名称
在实际工作中,有时候为了赶时间,往往通过复制项目得到一个成型的框架.那么怎么才可以彻底修改项目名称呢? 1.web.xml 2.工作空间中找到当前项目下.project文件 3.工作空间中找到当前项目 ...
04 入门 - ASP.NET MVC应用程序的结构
目录索引:<ASP.NET MVC 5 高级编程>学习笔记用Visual Studio创建了一个新的ASP.NET MVC应用程序后,将自动向这个项目中添加一些文件和目录. 如图所示: ...
SAP MM 明明已经扩展供应商到采购组织下，采购订单里还是报错？
SAP MM 明明已经扩展供应商到采购组织下,采购订单里还是报错? 如下的PO 4400000069,处于HELD状态.ME22N试图保存它为一个正式的采购订单,报错说供应商没有在采购组织下维护, 使 ...

【pytorch】pytorch-LSTM

pytorch-LSTM()

应用LSTM

举例：

【pytorch】pytorch-LSTM的更多相关文章

随机推荐

热门专题