tensorflow sequence

sequence_loss是nlp算法中非常重要的一个函数.rnn,lstm,attention都要用到这个函数.看下面代码:

# coding: utf-8

import numpy as np

import tensorflow as tf

from tensorflow.contrib.seq2seq import sequence_loss

logits_np = np.array([

    [[0.5, 0.5, 0.5, 0.5], [0.5, 0.5, 0.5, 0.5], [0.5, 0.5, 0.5, 0.5]],

    [[0.5, 0.5, 0.5, 0.5], [0.5, 0.5, 0.5, 0.5], [0.5, 0.5, 0.5, 0.5]]

])

targets_np = np.array([

    [0, 0, 0],

    [0, 0, 0]

], dtype=np.int32)

logits = tf.convert_to_tensor(logits_np)

targets = tf.convert_to_tensor(targets_np)

cost = sequence_loss(logits=logits,

                     targets=targets,

                     weights=tf.ones_like(targets, dtype=tf.float64))

init = tf.global_variables_initializer()

with tf.Session() as sess:

    sess.run(init)

    r = sess.run(cost)

    print(r)

先对每个[0.5,0.5,0.5,0.5]取softmax. softmax([0.5,0.5,0.5,0.5])=(0.25,0.25,0.25,0.25)然后再计算-ln(0.25)*6/6=1.38629436112.

再看一个例子

# coding:utf-8

from __future__ import unicode_literals

from __future__ import print_function

from __future__ import division

from tensorflow.contrib.seq2seq import sequence_loss

import tensorflow as tf

import numpy as np

output_np = np.array(

    [

        [[0.6, 0.5, 0.3, 0.2], [0.9, 0.5, 0.3, 0.2], [1.0, 0.5, 0.3, 0.2]],

        [[0.2, 0.5, 0.3, 0.2], [0.3, 0.5, 0.3, 0.2], [0.4, 0.5, 0.3, 0.2]]

    ]

)

print(output_np.shape)

target_np = np.array([[0, 1, 2],

                      [3, 0, 1]],

                     dtype=np.int32)

print(target_np.shape)

output = tf.convert_to_tensor(output_np, np.float32)

target = tf.convert_to_tensor(target_np, np.int32)

cost = sequence_loss(output,

                     target,

                     tf.ones_like(target, dtype=np.float32))

init = tf.global_variables_initializer()

with tf.Session() as sess:

    sess.run(init)

    cost_r = sess.run(cost)

    print(cost_r)

这个代码作用和下面的tf.reduce_mean(softmax_cross_entropy_with_logits)作用一致.

# coding:utf-8

from __future__ import unicode_literals

from __future__ import print_function

from __future__ import division

import tensorflow as tf

import numpy as np

def to_onehot(a):

    max_index = np.max(a)

    b = np.zeros((a.shape[0], max_index + 1))

    b[np.arange(a.shape[0]), a] = 1

    return b

logits_ph = tf.placeholder(tf.float32, shape=(None, None))

labels_ph = tf.placeholder(tf.float32, shape=(None, None))

output_np = np.array([

    [0.6, 0.5, 0.3, 0.2],

    [0.9, 0.5, 0.3, 0.2],

    [1.0, 0.5, 0.3, 0.2],

    [0.2, 0.5, 0.3, 0.2],

    [0.3, 0.5, 0.3, 0.2],

    [0.4, 0.5, 0.3, 0.2]])

cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(labels=labels_ph, logits=logits_ph))

target_np = np.array([0, 1, 2, 3, 0, 1])

init = tf.global_variables_initializer()

with tf.Session() as sess:

    sess.run(init)

    cost_r = sess.run(cost, feed_dict={logits_ph: output_np, labels_ph: to_onehot(target_np)})

    print(cost_r)

再取交叉熵,再取平均.

tensorflow sequence_loss的更多相关文章

tf.contrib.seq2seq.sequence_loss example:seqence loss 实例代码
#!/usr/bin/env python # -*- coding: utf-8 -*- import tensorflow as tf import numpy as np params=np.r ...
学习笔记CB014:TensorFlow seq2seq模型步步进阶
神经网络.<Make Your Own Neural Network>,用非常通俗易懂描述讲解人工神经网络原理用代码实现,试验效果非常好. 循环神经网络和LSTM.Christopher ...
Tensorflow动态seq2seq使用总结（r1.3）
https://www.jianshu.com/p/c0c5f1bdbb88 动机其实差不多半年之前就想吐槽Tensorflow的seq2seq了(后面博主去干了些别的事情),官方的代码已经抛弃原来 ...
sequence_loss的解释
在做seq2seq的时候,经常需要使用sequence_loss这是损失函数. 现在分析一下sequence_loss这个函数到底在做什么 # coding: utf-8 import numpy a ...
吴裕雄--天生自然神经网络与深度学习实战Python+Keras+TensorFlow：使用TensorFlow和Keras开发高级自然语言处理系统——LSTM网络原理以及使用LSTM实现人机问答系统
!mkdir '/content/gdrive/My Drive/conversation' ''' 将文本句子分解成单词,并构建词库 ''' path = '/content/gdrive/My D ...
Tensorflow 官方版教程中文版
2015年11月9日,Google发布人工智能系统TensorFlow并宣布开源,同日,极客学院组织在线TensorFlow中文文档翻译.一个月后,30章文档全部翻译校对完成,上线并提供电子书下载,该 ...
tensorflow学习笔记二：入门基础
TensorFlow用张量这种数据结构来表示所有的数据.用一阶张量来表示向量,如:v = [1.2, 2.3, 3.5] ,如二阶张量表示矩阵,如:m = [[1, 2, 3], [4, 5, 6], ...
用Tensorflow让神经网络自动创造音乐
#————————————————————————本文禁止转载,禁止用于各类讲座及ppt中,违者必究————————————————————————# 前几天看到一个有意思的分享,大意是讲如何用Ten ...
tensorflow 一些好的blog链接和tensorflow gpu版本安装
pading :SAME,VALID 区别 http://blog.csdn.net/mao_xiao_feng/article/details/53444333 tensorflow实现的各种算法 ...

随机推荐

详细讲解 Redis 的两种安装部署方式
Redis 是一款比较常用的 NoSQL 数据库,我们通常使用 Redis 来做缓存,这是一篇关于 Redis 安装的文章,所以不会涉及到 Redis 的高级特性和使用场景,Redis 能够兼容绝大部 ...
web开发基本概念
一.什么是静态页面,什么是动态页面? 答:静态页面是不需要网络请求就可以看到的页面,保存在本地. 动态页面是需要网络请求才可以看到的页面,保存在服务器. 二.网页的运行环境? 答:浏览器客户端三. ...
【持续更新】【pat】pat刷题技巧记录
修改code completion快捷键位CTRL+ENTER,帮助提示函数名称修改命令行提示符的属性,开启快速编辑模式,方便调试添加c++11语言标准支持开启代码调试功能对输入的字符串进行切 ...
pat 1136 A Delayed Palindrome（20 分）
1136 A Delayed Palindrome(20 分) Consider a positive integer N written in standard notation with k+1 ...
力扣（LeetCode）二进制间距个人题解
输入:6 输出:1 解释: 6 的二进制是 0b110 . 示例 4: 输入:8 输出:0 解释: 8 的二进制是 0b1000 . 在 8 的二进制表示中没有连续的 1,所以返回 0 . 提示: 1 ...
HashMap的源码学习以及性能分析
HashMap的源码学习以及性能分析一).Map接口的实现类 HashTable.HashMap.LinkedHashMap.TreeMap 二).HashMap和HashTable的区别 1).H ...
PHP中Redis扩展无法加载问题
问题: 在重启php-fpm的过程中,发生了如下的错误,redis.so无法载入 1 2 3 4 [root@brand009 modules]# /usr/sbin/php-fpm /usr/sbi ...
Spring基于注解的配置1——@Required、@Autowired、@Qualifier示例及与传统注入方法的对比
@Required注释作用:用于属性的set方法,那么这个属性必须在xml文件的bean标签里面进行配置,否则就会抛出一个BeanInitializationException异常. 首先准备一个类 ...
20191107-3 beta week 2/2 Scrum立会报告+燃尽图 02
此作业要求参见[https://edu.cnblogs.com/campus/nenu/2019fall/homework/9955] 一.小组情况队名:扛把子组长:孙晓宇组员:宋晓丽梁梦瑶 ...
【POJ 2823】【Luogu P1886】Sliding Window 滑动窗口
POJ 2823 Luogu P1886 [解题思路] 这是一个单调队列算法的经典题目,几乎学习单调队列的人都接触过这题. 利用单调队列算法求出每一个固定区间内的最(大/小)值. 以下以最大值为例: ...

tensorflow sequence_loss

tensorflow sequence_loss的更多相关文章

随机推荐

热门专题