tensorflow实现lstm中遇到的函数记录

函数一：initializer=tf.random_uniform_initializer(-0.1, 0.1, seed=123)

tf.random_uniform_initializer

参数：

minval：一个 python 标量或一个标量张量。要生成的随机值范围的下限。
maxval：一个 python 标量或一个标量张量。要生成的随机值范围的上限。对于浮点类型默认为1。
seed：一个 Python 整数。用于创建随机种子。查看 tf.set_random_seed 的行为。
dtype：数据类型。

函数二：lstm = tf.contrib.rnn.LSTMCell(rnn_size, initializer=tf.random_uniform_initializer(-0.1, 0.1, seed=123))

　　定义基本的lstm单元，rnn_size是lstm cell中的单元数，与输入向量的维度是一致的。根据输入的词向量，来定义维度。

函数三：lstms = tf.contrib.rnn.MultiRNNCell([get_lstm(rnn_size) for _ in range(rnn_num_layers)])

　　用于实例化递归神经网络，rnncell由多个simple cell组成，返回值为输入张量或者张量列表

函数四：encoder_outputs, encoder_states = tf.nn.dynamic_rnn(lstms, encoder_embed, source_sequence_len, dtype=tf.float32)

　　encoder_embed代表输入，[x,y,z]x代表batch的大小，y文本长度，z是embedding编码的长度。　　

　　source-sequence_len代表输入的文本长度，可以设置为[x,y],x代表最大长度，y是此次长度，我也没看太懂，之后继续补充：https://blog.csdn.net/u010223750/article/details/71079036

　　encoder_outputs,每一个迭代隐状态的输出

　　encode_states，代表最后的编码的码字context Vector（其长度有什么确定？后面再补充）

　　补充：官方文档：

　　'outputs' is a tensor of shape [batch_size, max_time, cell_state_size]

　　'state' is a tensor of shape [batch_size, cell_state_size]

　　我们用一个小例子来说明其用法，假设你的RNN的输入input是[2,20,128]，其中2是batch_size,20是文本最大长度，128是embedding_size，可以看出，有两个example，我们假设第二个文本长度只有13，剩下的7个是使用0-padding方法填充的。dynamic返回的是两个参数：outputs,last_states，其中outputs是[2,20,128]，也就是每一个迭代隐状态的输出,last_states是由(c,h)组成的tuple，均为[batch,128]

　　因此context vector的输出的长度为embedding编码的长度。

函数五：tf.identity

　　看例子：https://blog.csdn.net/hu_guan_jie/article/details/78495297

　　自己理解作用，通过tf.identity，在图中只有operation才会执行，因此通过简单的y=x赋值，在图中并不会执行，因此需要定义一个operation，在图中形成一个节点，tf.identity是返回一个一　　模一样新的tensor的op，这会增加一个新节点到gragh中。

函数六：masks = tf.sequence_mask(target_sequence_len, max_target_sequence_len, dtype=tf.float32, name="masks")

　　返回一个表示每个单元的前N个位置的mask张量。

　　示例：

　　tf.sequence_mask([1, 3, 2], 5) # [[True, False, False, False, False],

　　　　　　　　　　　　　　　　 # [True, True, True, False, False],

　　　　　　　　　　　　　　　　 # [True, True, False, False, False]]

　　tf.sequence_mask([[1, 3],[2,0]]) # [[[True, False, False],

　　　　　　　　　　　　　　　　　 # [True, True, True]],

　　　　　　　　　　　　　　　　　# [[True, True, False],

　　　　　　　　　　　　　　　　　　 # [False, False, False]]]

函数七：encoder_embed = tf.contrib.layers.embed_sequence(rnn_inputs, source_vocab_size, encoder_embedding_size)

　　tf.contrib.layers.embed_sequence(ids, vocab_size, embed_dim)

　　ids: 形状为[batch_size, doc_length]的int32或int64张量，也就是经过预处理的输入数据。

　　vocab_size: 输入数据的总词汇量，指的是总共有多少类词汇，不是总个数

　　embed_dim：想要得到的嵌入矩阵的维度

　　返回值：Tensor of [batch_size, doc_length, embed_dim] with embedded sequences.

tensorflow实现lstm中遇到的函数记录的更多相关文章

Swift中关于集合计算的几种函数记录（intersect、symmetricDifference、union、subtract）
很久之前用过一次,后来就忘了...扎心,现在记录一下 PS:这几种函数其实不限于swift内的,在JavaScript.python.DB等其他语言,应该也有类似用法,这里我只简单讲了在swift内的 ...
Tensorflow中的run()函数
1 run()函数存在的意义 run()函数可以让代码变得更加简洁,在搭建神经网络(一)中,经历了数据集准备.前向传播过程设计.损失函数及反向传播过程设计等三个过程,形成计算网络,再通过会话tf.Se ...
numpy函数库中一些常用函数的记录
##numpy函数库中一些常用函数的记录最近才开始接触Python,python中为我们提供了大量的库,不太熟悉,因此在<机器学习实战>的学习中,对遇到的一些函数的用法进行记录. (1) ...
【tensorflow基础】tensorflow中 tf.reduce_mean函数
参考 1. tensorflow中 tf.reduce_mean函数: 完
第二十一节，使用TensorFlow实现LSTM和GRU网络
本节主要介绍在TensorFlow中实现LSTM以及GRU网络. 一 LSTM网络 Long Short Term 网络—— 一般就叫做 LSTM ——是一种 RNN 特殊的类型,可以学习长期依赖信息 ...
Tensorflow的基本概念与常用函数
Tensorflow一些常用基本概念与函数(一) 1.tensorflow的基本运作为了快速的熟悉TensorFlow编程,下面从一段简单的代码开始: import tensorflow as tf ...
Tensorflow一些常用基本概念与函数（二）
1.tensorflow的基本运作为了快速的熟悉TensorFlow编程,下面从一段简单的代码开始: import tensorflow as tf #定义‘符号’变量,也称为占位符 a = tf. ...
Tensorflow一些常用基本概念与函数（三）
摘要:本系列主要对tf的一些常用概念与方法进行描述.本文主要针对tensorflow的数据IO.图的运行等相关函数进行讲解.为‘Tensorflow一些常用基本概念与函数’系列之三. 1.序言本文所 ...
Tensorflow一些常用基本概念与函数（四）
摘要:本系列主要对tf的一些常用概念与方法进行描述.本文主要针对tensorflow的模型训练Training与测试Testing等相关函数进行讲解.为‘Tensorflow一些常用基本概念与函数’系 ...

随机推荐

DML_Data Modification_UPDATE
DML_Data Modification_UPDATE写不进去,不能专注了...... /* */ ------------------------------------------------- ...
docker-mcr 助您全速下载 dotnet 镜像
2018 年五月之后,微软将后续发布的所有 docker image 都推送到了 MCR (Miscrosoft Container Registry),但在中国大陆,它的速度实在是令人发指,本文将介 ...
小师妹学JVM之:JDK14中JVM的性能优化
目录简介 String压缩分层编译(Tiered Compilation) Code Cache分层新的JIT编译器Graal 前置编译压缩对象指针 Zero-Based 压缩指针 Escap ...
《Java并发编程的艺术》第9章 Java中的线程池
第9章 Java中的线程池在开发过程中,合理地使用线程池能带来3个好处: 降低资源消耗.通过重复利用已创建的线程降低线程创建和销毁造成的消耗. 提高响应速度.当任务到达时,任务可以不需要等到线程创 ...
Java学习笔记6（集合类）
集合类集合按照其存储结构可以分为两大类,即单列集合Collection和双列集合Map. Collection:单列集合类的根接口,用于存储一系列符合某种规则的元素,有List和Set两个重要子接口 ...
连接 mongodb 数据库：
mongodb 数据库: 安装 mongodb 数据库: 安装 mongodb 数据库网址: https://www.mongodb.com/download-center#community 检 ...
ZooKeeper开机启动的俩种方式
两种方式可以实现开机自启动第一种:直接修改/etc/rc.d/rc.local文件在/etc/rc.d/rc.local文件中需要输入两行, 其中export JAVA_HOME=/usr/jav ...
入门大数据---Map/Reduce，Yarn是什么？
简单概括:Map/Reduce是分布式离线处理的一个框架. Yarn是Map/Reduce中的一个资源管理器. 一.图形说明下Map/Reduce结构: 官方示意图: 另外还可以参考这个: 流程介绍: ...
vue 生命周期钩子路由钩子动画钩子执行顺序
进入首页的钩子们 1 路由钩子路由跳转前beforeEach 2 路由钩子 home组件内部:守卫执行前beforeRouteEnter 3.路由钩子路由跳转后afterEach 4 生命周期 h ...
《UNIX环境高级编程》(APUE) 笔记第五章 - 标准I/O库
5 - 标准I/O库 Github 地址 1. 标准 I/O 库作用缓冲区分配以优化的块长度执行 I/O 等使用户不必担心如何选择使用正确的块长度标准 I/O 最终都要调用第三章中的 I/O ...

tensorflow实现lstm中遇到的函数记录

tensorflow实现lstm中遇到的函数记录的更多相关文章

随机推荐

热门专题