pytorch seq2seq模型示例

以下代码可以让你更加熟悉seq2seq模型机制

"""

    test

"""

import numpy as np

import torch

import torch.nn as nn

import torch.optim as optim

from torch.autograd import Variable

# 创建字典

seq_data = [['man', 'women'], ['black', 'white'], ['king', 'queen'], ['girl', 'boy'], ['up', 'down'], ['high', 'low']]

char_arr = [c for c in 'SEPabcdefghijklmnopqrstuvwxyz']

num_dict = {n:i for i,n in enumerate(char_arr)}

# 网络参数

n_step = 5

n_hidden = 128

n_class = len(num_dict)

batch_size = len(seq_data)

# 准备数据

def make_batch(seq_data):

    input_batch, output_batch, target_batch =[], [], []

    for seq in seq_data:

        for i in range(2):

            seq[i] = seq[i] + 'P' * (n_step-len(seq[i]))

        input = [num_dict[n] for n in seq[0]]

        ouput = [num_dict[n] for n in ('S'+ seq[1])]

        target = [num_dict[n] for n in (seq[1]) + 'E']

        input_batch.append(np.eye(n_class)[input])

        output_batch.append(np.eye(n_class)[ouput])

        target_batch.append(target)

    return Variable(torch.Tensor(input_batch)), Variable(torch.Tensor(output_batch)), Variable(torch.LongTensor(target_batch))

input_batch, output_batch, target_batch = make_batch(seq_data)

# 创建网络

class Seq2Seq(nn.Module):

    """

    要点：

    1.该网络包含一个encoder和一个decoder，使用的RNN的结构相同，最后使用全连接接预测结果

    2.RNN网络结构要熟知

    3.seq2seq的精髓：encoder层生成的参数作为decoder层的输入

    """

    def __init__(self):

        super().__init__()

        # 此处的input_size是每一个节点可接纳的状态，hidden_size是隐藏节点的维度

        self.enc = nn.RNN(input_size=n_class, hidden_size=n_hidden, dropout=0.5)

        self.dec = nn.RNN(input_size=n_class, hidden_size=n_hidden, dropout=0.5)

        self.fc = nn.Linear(n_hidden, n_class)

    def forward(self, enc_input, enc_hidden, dec_input):

        # RNN要求输入：(seq_len, batch_size, n_class)，这里需要转置一下

        enc_input = enc_input.transpose(0,1)

        dec_input = dec_input.transpose(0,1)

        _, enc_states = self.enc(enc_input, enc_hidden)

        outputs, _ = self.dec(dec_input, enc_states)

        pred = self.fc(outputs)

        return pred

# training

model = Seq2Seq()

loss_fun = nn.CrossEntropyLoss()

optimizer = optim.Adam(model.parameters(), lr=0.001)

for epoch in range(5000):

    hidden = Variable(torch.zeros(1, batch_size, n_hidden))

    optimizer.zero_grad()

    pred = model(input_batch, hidden, output_batch)

    pred = pred.transpose(0, 1)

    loss = 0

    for i in range(len(seq_data)):

        temp = pred[i]

        tar = target_batch[i]

        loss +=  loss_fun(pred[i], target_batch[i])

    if (epoch + 1) % 1000 == 0:

        print('Epoch: %d   Cost: %f' % (epoch + 1, loss))

    loss.backward()

    optimizer.step()

# 测试

def translate(word):

    input_batch, output_batch, _ = make_batch([[word, 'P' * len(word)]])

    # hidden 形状 (1, 1, n_class)

    hidden = Variable(torch.zeros(1, 1, n_hidden))

    # output 形状（6，1， n_class)

    output = model(input_batch, hidden, output_batch)

    predict = output.data.max(2, keepdim=True)[1]

    decoded = [char_arr[i] for i in predict]

    end = decoded.index('E')

    translated = ''.join(decoded[:end])

    return translated.replace('P', '')

print('girl ->', translate('girl'))

参考：https://blog.csdn.net/weixin_43632501/article/details/98525673

pytorch seq2seq模型示例的更多相关文章

pytorch seq2seq模型中加入teacher_forcing机制
在循环内加的teacher forcing机制,这种为目标确定的时候,可以这样加. 目标不确定,需要在循环外加. decoder.py 中的修改 """ 实现解码器 &q ...
pytorch seq2seq模型训练测试
num_sequence.py """ 数字序列化方法 """ class NumSequence: """ ...
PyTorch专栏（六）: 混合前端的seq2seq模型部署
欢迎关注磐创博客资源汇总站: http://docs.panchuang.net/ 欢迎关注PyTorch官方中文教程站: http://pytorch.panchuang.net/ 专栏目录: 第一 ...
混合前端seq2seq模型部署
混合前端seq2seq模型部署本文介绍,如何将seq2seq模型转换为PyTorch可用的前端混合Torch脚本.要转换的模型来自于聊天机器人教程Chatbot tutorial. 1.混合前端在 ...
时间序列深度学习：seq2seq 模型预测太阳黑子
目录时间序列深度学习:seq2seq 模型预测太阳黑子学习路线商业中的时间序列深度学习商业中应用时间序列深度学习深度学习时间序列预测:使用 keras 预测太阳黑子递归神经网络设置.预处 ...
seq2seq模型详解及对比（CNN，RNN，Transformer）
一,概述在自然语言生成的任务中,大部分是基于seq2seq模型实现的(除此之外,还有语言模型,GAN等也能做文本生成),例如生成式对话,机器翻译,文本摘要等等,seq2seq模型是由encoder, ...
PyTorch 自动微分示例
PyTorch 自动微分示例 autograd 包是 PyTorch 中所有神经网络的核心.首先简要地介绍,然后训练第一个神经网络.autograd 软件包为 Tensors 上的所有算子提供自动微分 ...
pytorch生成对抗示例
pytorch生成对抗示例本文对ML(机器学习)模型的安全漏洞的认识,并将深入了解对抗性机器学习的热门话题.图像添加难以察觉的扰动会导致模型性能大不相同.通过图像分类器上的示例探讨该主题.使用第一种 ...
[炼丹术]使用Pytorch搭建模型的步骤及教程
使用Pytorch搭建模型的步骤及教程我们知道,模型有一个特定的生命周期,了解这个为数据集建模和理解 PyTorch API 提供了指导方向.我们可以根据生命周期的每一个步骤进行设计和优化,同时更加 ...

随机推荐

Asp.NetCoreWebApi入门 - 从零开始新建api项目
开发环境打开VS,建立项目项目结构修改 StartUp 类代码 ConfigureServices方法 Configure方法为开发环境和生产环境配置不同的 Startup 新建一个Contr ...
【翻译】asp.net core 3.0基本概念
这篇文章描述了开发asp.net core所需要掌握的基本概念. 原文地址:https://docs.microsoft.com/en-us/aspnet/core/fundamentals/?vie ...
深挖Jvm垃圾收集
垃圾收集(Garbage Collection,GC),它的任务是解决以下 3 件问题: 哪些内存需要回收? 什么时候回收? 如何回收? 其中第一个问题很好回答,在 Java 中,GC 主要发生在 J ...
常用的python内置模块
1.time模块: time模块是普通的时间模块在python的三种时间表现形式: 1.时间戳: 给电脑看的. - 自1970-01-01 00:00:00到当前时间,按秒计算,计算了多少秒. 2. ...
看一下“Dubbo 2.7”的三大新特性
Dubbo 2.7.x 作为 Apache 的孵化版本,除了代码优化之外,还新增了许多重磅的新特性,本文将会介绍其中最典型的三个新特性: 一.异步化改造二.三大中心改造三.服务治理增强一.异步支 ...
Java 9新特性
1.jdk 目录结构 JDK9 具体目录结构如下所示: bin: 该目录包含所有的命令. conf: 包含用户可以编辑的配置文件,例如以前位于 jre\lib 目录中的.properties 和 .p ...
cocos2d-js中jsc逆向为js攻略
笔记: 主要发现有两个工具存档记录一下 https://github.com/OEDx/cocos-jsc-endecryptor python的解密需要秘钥推荐这个: https://git ...
实验吧简单的sql注入3
今天早上起来发现有人评论说我没更新实验吧sql注入3,主要是因为前段时间都去做bugku去了但是重做这道题发现以前的姿势不行了,exp()报错不再溢出,现在不能用这个姿势,所以这里重新整理了一遍思路 ...
JavaWeb Listener之HttpSessionBindListener
HttpSessionBindListener 监听把自身这个对象绑定到HttpSession对象上.解绑绑定到HttpSession对象上,其实就是调用session的setAttr ...
NioCopy文件
步骤: 1.创建输入输出流 fis fos 2.创建通道 fis.getchannel() fos.getchannel(); 3.创建缓存区 ByteBuffer buffer = ...

pytorch seq2seq模型示例

pytorch seq2seq模型示例的更多相关文章

随机推荐

热门专题