NMT 机器翻译

本文近期学习NMT相关知识,学习大佬资料,汇总便于后期复习用,有问题,欢迎斧正. 目录 RNN Seq2Seq Attention Seq2Seq + Attention Transformer Transformer-xl 1. RNN 根据输出和输入序列不同数量rnn可以有多种不同的结构,不同结构自然就有不同的引用场合.如下图, one to one 结构,仅仅只是简单的给一个输入得到一个输出,此处并未体现序列的特征,例如图像分类场景.one to many 结构,给一个输入得到一系列输出,…

tensorflow 笔记13：了解机器翻译，google NMT，Attention

一.关于Attention,关于NMT 未完待续... 以google 的 nmt 代码引入探讨下端到端: 项目地址:https://github.com/tensorflow/nmt 机器翻译算是深度学习在垂直领域应用最成功的之一了,深度学习在垂直领域的应用的确能解决很多之前繁琐的问题,但是缺乏范化能力不足,这也是各大公司一直解决的问题: 最近开源的模型: lingvo:一种新的侧重于sequence2sequence的框架: bert :一种基于深度双向Transform的语言模型预训…

TensorFlow从1到2（十一）变分自动编码器和图片自动生成

基本概念 "变分自动编码器"(Variational Autoencoders,缩写:VAE)的概念来自Diederik P Kingma和Max Welling的论文<Auto-Encoding Variational Bayes>.现在有了很广泛的应用,应用范围已经远远超出了当时论文的设想.不过看起来似乎,国内还没有见到什么相关产品出现. 作为普及型的文章,介绍"变分自动编码器",要先从编码说起. 简单说,编码就是数字化,前面第六篇我们已经介绍了一些…

神经机器翻译（NMT）相关资料整理

作者:zhbzz2007 出处:http://www.cnblogs.com/zhbzz2007 欢迎转载,也请保留这段声明.谢谢! 1 简介自2013年提出了神经机器翻译系统之后,神经机器翻译系统取得了很大的进展.最近几年相关的论文,开源系统也是层出不穷.本文主要梳理了神经机器翻译入门.进阶所需要阅读的资料和论文,并提供了相关链接以及简单的介绍,以及总结了相关的开源系统和业界大牛,以便其他的小伙伴可以更快的了解神经机器翻译这一领域. 随着知识的逐步积累,本文后续会持续更新.请关注. 2 入门…

【转载 | 翻译】Visualizing A Neural Machine Translation Model（神经机器翻译模型NMT的可视化）

转载并翻译Jay Alammar的一篇博文:Visualizing A Neural Machine Translation Model (Mechanics of Seq2seq Models With Attention) 原文链接:https://jalammar.github.io/visualizing-neural-machine-translation-mechanics-of-seq2seq-models-with-attention/ 神经机器翻译模型(基于注意力机制的Seq2…

TensorFlow+TVM优化NMT神经机器翻译

TensorFlow+TVM优化NMT神经机器翻译背景神经机器翻译(NMT)是一种自动化的端到端方法,具有克服传统基于短语的翻译系统中的弱点的潜力.本文为全球电子商务部署NMT服务. 目前,将Transformer用作NMT系统的主要骨干,对基于经典RNN / LSTM模型的同等(甚至更高)精度进行高效的离线训练更为友好.尽管Transformer在离线训练阶段很友好,打破了跨时间步长的依赖性,但在线推理效率不高.在生产环境中,已经发现,初始版本的Transformer的推理速度约为1.5倍…

【Machine Translation】CMU的NMT教程论文：最全面的神经机器翻译学习教程

这是一篇CMU发的神经机器翻译教程论文,很全很详细,适合新手阅读,即使没有什么MT.DNN.RNN的基础知识. 另外它还配套了CMU自己的一个框架DyNet的练习. 全文共9章,从统计语言模型到DNN到RNN到Encoder-Deconder再到注意力模型,中间穿插了许多技巧方法,如SGD.其他梯度方法.Beam-search.梯度消失/爆炸.LSTM.GRU等等,非常全面.链接如下:https://arxiv.org/abs/1703.01619 百度学术地址:http://xueshu.ba…

神经机器翻译（NMT）开源工具

博客地址:http://blog.csdn.net/wangxinginnlp/article/details/52944432 工具名称:T2T: Tensor2Tensor Transformers 地址:https://github.com/tensorflow/tensor2tensor 语言:Python/Tensorflow 简介:★★★★★ 五颗星 https://research.googleblog.com/2017/06/accelerating-deep-learning-…

【论文集合】机器翻译NMT中数据打分和数据选择的经典方法

根据Survey of Data-Selection Methods in Statistical Machine Translation的总结,MT中的数据选择分类图如下: 使用场景数据使用的场景决定了选择什么样的数据,及该方法要解决什么问题. Improve Quality:Domain Improvement.Unhelpful Data Reduction.Noise Reduction Limited Resources:Training Resources.Deployment R…

RNN与应用案例：注意力模型与机器翻译

1. 注意力模型 1.2 注意力模型概述注意力模型(attention model)是一种用于做图像描述的模型.在笔记6中讲过RNN去做图像描述,但是精准度可能差强人意.所以在工业界,人们更喜欢用attention model. 结合下图,先简单地讲一下,注意力模型的运作原理. 第一步:进来一张图片第二步:图片进入卷积神经网络,进行前向运算,将某个卷积层的结果输出.注意,上一个笔记中讲的RNN做图像描述,用的是全链接层的输出.至于说哪个层的输出好,没法下结论,这个需要去不同的场景中做实验比较…

Phrase-Based & Neural Unsupervised Machine Translation基于短语非监督机器翻译

1. 前言本文介绍一种无监督的机器翻译的模型.无监督机器翻译最早是<UNSUPERVISED NEURAL MACHINE TRANSLATION>提出.这个模型主要的特点,无需使用平行语料库,使用去噪和回译的步骤构建NMT系统. 2018年Facebook人工智能实验室再次公布了有关无监督神经网络翻译的最新模型<Phrase-Based & Neural Unsupervised Machine Translation>,相当于用 10 万个参考译文训练过的监督模型.&…

google nmt 实验踩坑记录

最近因为要做一个title压缩的任务,所以调研了一些text summary的方法. text summary 一般分为抽取式和生成式两种.前者一般是从原始的文本中抽取出重要的word or sentence,然后按照一定的语法或者句法进行组合,从而对原始的文本进行压缩.再文本摘要的早期,基本都是这个思路,代表性的方法是textrank.所谓生成式的方法,就是试图让机器理解原始的文本,从而自己归纳出原始文本的摘要,给出的结果(词语或者句子)可能是原始文本中没有出现过的,这也是其与抽取…

EMNLP 2018 | 用强化学习做神经机器翻译：中山大学&MSRA填补多项空白

人工深度学习和神经网络已经为机器翻译带来了突破性的进展,强化学习也已经在游戏等领域取得了里程碑突破.中山大学数据科学与计算机学院和微软研究院的一项研究探索了强化学习在神经机器翻译领域的应用,相关论文已被 EMNLP 2018 接收,相关代码和数据集也已开源. 论文地址:https://arxiv.org/abs/1808.08866 开源项目:https://github.com/apeterswu/RL4NMT 神经机器翻译(NMT)[Bahdanau et al., 2015; Hassan…

TensorFlow从1到2（十）带注意力机制的神经网络机器翻译

基本概念机器翻译和语音识别是最早开展的两项人工智能研究.今天也取得了最显著的商业成果. 早先的机器翻译实际脱胎于电子词典,能力更擅长于词或者短语的翻译.那时候的翻译通常会将一句话打断为一系列的片段,随后通过复杂的程序逻辑对每一个片段进行翻译,最终组合在一起.所得到的翻译结果应当说似是而非,最大的问题是可读性和连贯性非常差. 实际从机器学习的观点来讲,这种翻译方式,也不符合人类在做语言翻译时所做的动作.其实以神经网络为代表的机器学习,更多的都是在"模仿"人类的行为习惯. 一名职业翻译通…

机器翻译注意力机制及其PyTorch实现

前面阐述注意力理论知识,后面简单描述PyTorch利用注意力实现机器翻译 Effective Approaches to Attention-based Neural Machine Translation 简介 Attention介绍在翻译的时候,选择性的选择一些重要信息.详情看这篇文章 . 本着简单和有效的原则,本论文提出了两种注意力机制. Global 每次翻译时,都选择关注所有的单词.和Bahdanau的方式有点相似,但是更简单些.简单原理介绍. Local 每次翻译时,只选择关注一…

神经机器翻译（seq2seq RNN）实现详解

http://c.biancheng.net/view/1947.html seq2seq 是一类特殊的 RNN,在机器翻译.文本自动摘要和语音识别中有着成功的应用.本节中,我们将讨论如何实现神经机器翻译,得到类似于谷歌神经机器翻译系统得到的结果(https://research.googleblog.com/2016/09/a-neural-network-for-machine.html). 关键是输入一个完整的文本序列,理解整个语义,然后输出翻译结果作为另一个序列.阅读整个序列的想法与以前…

TVM优化GPU机器翻译

TVM优化GPU机器翻译背景神经机器翻译(NMT)是一种自动化的端到端方法,具有克服传统基于短语的翻译系统中的弱点的潜力.最近,阿里巴巴集团正在为全球电子商务部署NMT服务. 将Transformer用作NMT系统的关键技术,相对于基于经典RNN / LSTM的模型具有同等(甚至更高)的精度,对于高效的离线训练更为友好.尽管Transformer在离线训练阶段很友好,打破了跨时间步长的依赖性,但在线推理效率不高.在生产环境中,已经发现,初始版本的Transformer的推理速度约为1.5倍至…

NLP教程(6) - 神经机器翻译、seq2seq与注意力机制

作者:韩信子@ShowMeAI 教程地址:http://www.showmeai.tech/tutorials/36 本文地址:http://www.showmeai.tech/article-detail/242 声明:版权所有,转载请联系平台与作者并注明出处收藏ShowMeAI查看更多精彩内容本系列为斯坦福CS224n<自然语言处理与深度学习(Natural Language Processing with Deep Learning)>的全套学习笔记,对应的课程视频可以在这里查看…

RNN神经网络和英中机器翻译的实现

本文系qitta的文章翻译而成,由renzhe0009实现.转载请注明以上信息,谢谢合作. 本文主要讲解以recurrent neural network为主,以及使用Chainer和自然语言处理其中的encoder-decoder翻译模型. 并将英中机器翻译用代码实现. Recurrent Neural Network 最基本的recurrent neural network(RNN),像下面的图一样,最典型的是追加3层神经网络隐含层的反馈. 这是非常简单的模型,本文接下来介绍的翻译模型就…

NOIP2010 机器翻译

1机器翻译题目背景小晨的电脑上安装了一个机器翻译软件,他经常用这个软件来翻译英语文章. 题目描述这个翻译软件的原理很简单,它只是从头到尾,依次将每个英文单词用对应的中文含义来替换.对于每个英文单词,软件会先在内存中查找这个单词的中文含义,如果内存中有,软件就会用它进行翻译:如果内存中没有,软件就会在外存中的词典内查找,查出单词的中文含义然后翻译,并将这个单词和译义放入内存,以备后续的查找和翻译. 假设内存中有M个单元,每单元能存放一个单词和译义.每当软件将一个新单词存入内存前,如果当前…

机器翻译评测——BLEU算法详解

◆版权声明:本文出自胖喵~的博客,转载必须注明出处. 转载请注明出处:http://www.cnblogs.com/by-dream/p/7679284.html 前言近年来,在自然语言研究领域中,评测问题越来越受到广泛的重视,可以说,评测是整个自然语言领域最核心和关键的部分.而机器翻译评价对于机器翻译的研究和发展具有重要意义:机器翻译系统的开发者可以通过评测得知系统存在的问题而不断改进,用户也可以根据评测报告选择满足自己需求的产品,而对于机器翻译的研究人员来说,评测能够给他们的技术发展方向提…

机器翻译评价指标 — BLEU算法

1,概述机器翻译中常用的自动评价指标是 $BLEU$ 算法,除了在机器翻译中的应用,在其他的 $seq2seq$ 任务中也会使用,例如对话系统. 2 $BLEU$算法详解假定人工给出的译文为$reference$,机器翻译的译文为$candidate$. 1)最早的$BLEU$算法最早的$BLEU$算法是直接统计$cadinate$中的单词有多少个出现在$reference$中,具体的式子是: $BLEU = \frac {出现在reference中的candinate的单词的个数} {c…

自然语言处理（四）统计机器翻译SMT

1.统计机器翻译三要素 1.翻译模型 2.语言模型 3.排序模型 2.翻译流程 1.双语数据预处理 2.词对齐 3.构造短语翻译表 4.对短语翻译表进行概率估计 5.解码,beam search 6.评估…

利用BLEU进行机器翻译检测（Python-NLTK-BLEU评分方法）

双语评估替换分数(简称BLEU)是一种对生成语句进行评估的指标.完美匹配的得分为1.0,而完全不匹配则得分为0.0.这种评分标准是为了评估自动机器翻译系统的预测结果而开发的,具备了以下一些优点: 计算速度快,计算成本低. 容易理解. 与具体语言无关. 已被广泛采用. BLEU评分是由Kishore Papineni等人在他们2002年的论文BLEU a Method for Automatic Evaluation of Machine Translation中提出的.BLEU计算的原理是计算待…

神经机器翻译 - NEURAL MACHINE TRANSLATION BY JOINTLY LEARNING TO ALIGN AND TRANSLATE

论文:NEURAL MACHINE TRANSLATION BY JOINTLY LEARNING TO ALIGN AND TRANSLATE 综述背景及问题背景: 翻译: 翻译模型学习条件分布后,给定一个源句,通过搜索最大条件概率的句子,可以生成相应的翻译. 神经网络翻译:两个组件:第一个:合成一个源句子x:第二个:解码一个目标句子y. 问题:固定长度向量是编码器 - 解码器架构性能提升的瓶颈. 本文主要思想本文提出:允许模型自动(软)搜索与预测目标单词相关的源句 --- 扩展的编码器…

机器翻译质量评测算法-BLEU

机器翻译领域常使用BLEU对翻译质量进行测试评测.我们可以先看wiki上对BLEU的定义. BLEU (Bilingual Evaluation Understudy) is an algorithm for evaluating the quality of text which has been machine-translated from one natural language to another. Quality is considered to be the correspond…