Pytorch系列教程-使用Seq2Seq网络和注意力机制进行机器翻译

【Pytorch系列教程-使用Seq2Seq网络和注意力机制进行机器翻译】的更多相关文章

Pytorch系列教程-使用Seq2Seq网络和注意力机制进行机器翻译

前言本系列教程为pytorch官网文档翻译.本文对应官网地址:https://pytorch.org/tutorials/intermediate/seq2seq_translation_tutorial.html 系列教程总目录传送门:我是一个传送门本系列教程对应的 jupyter notebook 可以在我的Github仓库下载: 下载地址:https://github.com/Holy-Shine/Pytorch-notebook 本教程我们将会搭建一个网络来将法语翻译成英语. [KE…

Pytorch系列教程

介绍不久前Pytorch发布了1.0版本,官网的doc页也更新了.这里说下官网的教程很实用,边学pytorch搭网络边学NLP-图像等领域的先进技术. 官网的教程都是英文的,本人就用这个系列博客做个小小的翻译工作,希望能帮到一些英语苦手(当然也包括双开谷歌翻译的我Orz)的小伙伴学习pytorch. Github仓库使用 jupyternote book 是一个很好的快速构建代码的选择,本系列教程都能在我的Github仓库找到对应的 jupyter notebook . 下载地址:https…

Pytorch系列教程-使用字符级RNN生成姓名

前言本系列教程为pytorch官网文档翻译.本文对应官网地址:https://pytorch.org/tutorials/intermediate/char_rnn_generation_tutorial.html 系列教程总目录传送门:我是一个传送门本系列教程对应的 jupyter notebook 可以在我的Github仓库下载: 下载地址:https://github.com/Holy-Shine/Pytorch-notebook 我们仍然使用手工搭建的包含几个线性层的小型RNN.与之…

Pytorch系列教程-使用字符级RNN对姓名进行分类

前言本系列教程为pytorch官网文档翻译.本文对应官网地址:https://pytorch.org/tutorials/intermediate/char_rnn_classification_tutorial.html 系列教程总目录传送门:我是一个传送门本系列教程对应的 jupyter notebook 可以在我的Github仓库下载: 下载地址:https://github.com/Holy-Shine/Pytorch-notebook 1. 数据准备数据下载通道: 点击这里下载数…

Seq2Seq模型与注意力机制

Seq2Seq模型基本原理核心思想:将一个作为输入的序列映射为一个作为输出的序列编码输入解码输出解码第一步,解码器进入编码器的最终状态,生成第一个输出以后解码器读入上一步的输出,生成当前步输出组成部件: Encoder Decoder 连接两者的固定大小的State Vector 解码方法最核心部分,大部分的改进贪心法选取一种度量标准后,在当前状态下选择最佳的一个结果,直到结束计算代价低局部最优解集束搜索(Beam Search) 启发式算法保存beam size个当…

PyTorch 系列教程之空间变换器网络

在本教程中,您将学习如何使用称为空间变换器网络的视觉注意机制来扩充您的网络.你可以在DeepMind paper 阅读更多有关空间变换器网络的内容. 空间变换器网络是对任何空间变换的差异化关注的概括.空间变换器网络(简称STN)允许神经网络学习如何在输入图像上执行空间变换,以增强模型的几何不变性.例如,它可以裁剪感兴趣的区域,缩放并校正图像的方向.而这可能是一种有用的机制,因为CNN对于旋转和缩放以及更一般的仿射变换并不是不变的. 关于STN的最棒的事情之一是能够简单地将其插入任何现有的CNN,…