Dynamic seq2seq in tensorflow

v1.0中 tensorflow渐渐废弃了老的非dynamic的seq2seq接口，已经放到 tf.contrib.legacy_seq2seq目录下面。

tf.contrib.seq2seq下面的实现都是dynamic seq2seq接口。

按照google的rd说法下个月将会给出更加完善的接口和实现。

当前版本也可以使用这里尝试分析一下现有dynamic seq2seq的代码。

首先核心函数是seq2seq.py下面的 dynamic_rnn_decoder

这里首先看下dynamic的概念，即不需要确定的输入长度，以及batch 大小，
都可以动态。

但是注意首先每个batch对应所有样本的输入长度还是需要一样的
作为dense数据
否则
不可处理

这也就是说如果你需要特别在意速度的话，即使使用dyanmic 也可能还需要使用bucket来聚集相似长度的

输入样本作为一个batch 加速训练。

不过一般意义上不用的话，代码比较简单，加上dyanmic的seq2seq 性能也可以接受，同时好处是每个batch

的样本可以完全随机。

dynamic_rnn_decoder核心是内部调用raw_rnn来实现迭代过程，这里的dynamic最主要体现在输入的

decoder_fn函数上面。

这个函数允许计算提前终止(early stop) 也就是说
假如你做inference，不用dynamic seq2seq

你一般的做法是指定一个
最大decode长度
比如20, 那么对应所有样本其实都需要decode走完20个

Step 哪怕所有的样本对应输出序列长度都不大于10。

而有了dynamic decode 当一个batch 所有的样本decode到达
类似<END>结束符之后，整个decode过程就

结束了。

但是注意这里仍然是以batch为基础的，也就是说有一个样本比如decode 2次就到达结束符，但是由于

组内其它样本没有结束，仍然需要所有样本继续向后解析，也就是说batch size越大，结束的可能越晚。

dynamic_rnn_decoder有train和inference两种模式，不过如果不使用attention，个人感觉train的时候直接

用dynamic_rnn接口就可以了。

最后按照刚刚master的代码，seq2seq提供了decoder.py以及sampling_decoder.py等相关的示例，

这个接口更加简洁清晰，也就是说不再用context_state来记录用户其余的状态，而是用户自定义

output的结构
将其它信息也直接写入output。

mmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmimmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmm

Dynamic seq2seq in tensorflow的更多相关文章

Dynamic attention in tensorflow
新代码在contrib\seq2seq\python\ops\attention_decoder_fn.py 和之前代码相比不再采用conv的方式来计算乘,直接使用乘法和linear 给出了两种at ...
Effective Tensorflow[转]
Effective TensorFlow Table of Contents TensorFlow Basics Understanding static and dynamic shapes Sco ...
Tensorflow.nn 核心模块详解
看过前面的例子,会发现实现深度神经网络需要使用 tensorflow.nn 这个核心模块.我们通过源码来一探究竟. # Copyright 2015 Google Inc. All Rights Re ...
tensorflow 控制流操作，条件判断和循环操作
Control flow operations: conditionals and loops When building complex models such as recurrent neura ...
【转载 | 翻译】Visualizing A Neural Machine Translation Model（神经机器翻译模型NMT的可视化）
转载并翻译Jay Alammar的一篇博文:Visualizing A Neural Machine Translation Model (Mechanics of Seq2seq Models Wi ...
深度学习与CV教程(8) | 常见深度学习框架介绍
作者:韩信子@ShowMeAI 教程地址:http://www.showmeai.tech/tutorials/37 本文地址:http://www.showmeai.tech/article-det ...
Hinton's paper Dynamic Routing Between Capsules 的 Tensorflow ， Keras ，Pytorch实现
Tensorflow 实现 A Tensorflow implementation of CapsNet(Capsules Net) in Hinton's paper Dynamic Routing ...
ChatGirl 一个基于 TensorFlow Seq2Seq 模型的聊天机器人[中文文档]
ChatGirl 一个基于 TensorFlow Seq2Seq 模型的聊天机器人[中文文档] 简介简单地说就是该有的都有了,但是总体跑起来效果还不好. 还在开发中,它工作的效果还不好.但是你可以直 ...
ChatGirl is an AI ChatBot based on TensorFlow Seq2Seq Model
Introduction [Under developing,it is not working well yet.But you can just train,and run it.] ChatGi ...

随机推荐

JDK提供的几种线程池比较
JDK提供的几种线程池 newFixedThreadPool创建一个指定工作线程数量的线程池.每当提交一个任务就创建一个工作线程,如果工作线程数量达到线程池初始的最大数,则将提交的任务存入到池队列中. ...
C_求两个日期相隔的天数（闰年）
#include <stdio.h> #include <math.h> int leap_year(int year){ == || (year%== && ...
唯美PS转手绘之SAI篇_百度经验
唯美PS转手绘之SAI篇 https://jingyan.baidu.com/article/fd8044fad3d5c05030137a5f.html
Delphi 之弹出气泡消息提示
//h:窗体中控件的句柄(用在某个控件上提示消息)(要调用的控件句柄) //text:要提示的文本 //cap:提示框上的标题 //IconType:提示框上显示的图标(共三个值.1.2.3分别为提示 ...
CSS魔法堂：稍稍深入伪类选择器
前言过去零零星星地了解和使用:link.::after和content等伪类.伪元素选择器,最近看书时发现这方面有所欠缺,于是决定稍微深入学习一下,以下为伪类部分的整理. 伪类伪类选择器实质上 ...
urllib 报错 IOError: [Errno socket error] TLS/SSL connection has been closed (EOF) (_ssl.c:590)
解决方案: My evil workaround (don't do this in production!): import urllib2 #也可以是urllib import ssl ctx = ...
为Ubuntu新创建用户创建默认.bashrc并自动加载
首先,su – 到新创建的用户拷贝默认的.bashrc过来 1 cp /etc/skel/.bashrc ~/ 然后创建.profile文件 1 vi ~/.profile 粘贴下面的内容 ...
mysql sql执行慢分析过程
摘自: https://blog.csdn.net/zhuzaijava/article/details/77935200 为了验证select 1 与 select 1 from tableName ...
使用Jenkins pipeline流水线构建docker镜像和发布
新建一个pipeline job 选择Pipeline任务,然后进入配置页面. 对于Pipeline, Definition选择 "Pipeline script from SCM" ...
kalman滤波
kalman滤波原理(通俗易懂) 1. 在学习卡尔曼滤波器之前,首先看看为什么叫“卡尔曼”.跟其他著名的理论(例如傅立叶变换,泰勒级数等等)一样,卡尔曼也是一个人的名字,而跟他们不同的是,他是个现代人 ...

Dynamic seq2seq in tensorflow

Dynamic seq2seq in tensorflow的更多相关文章

随机推荐

热门专题