tf常见的损失函数（LOSS）汇总

　　损失函数在机器学习中用于表示预测值与真实值之间的差距。一般而言，大多数机器学习模型都会通过一定的优化器来减小损失函数从而达到优化预测机器学习模型参数的目的。

　　哦豁，损失函数这么必要，那都存在什么损失函数呢?

　　一般常用的损失函数是均方差函数和交叉熵函数。

　　运算公式

　　1 均方差函数

　　均方差函数主要用于评估回归模型的使用效果，其概念相对简单，就是真实值与预测值差值的平方的均值，具体运算公式可以表达如下：

　　其中f(xi)是预测值，yi是真实值。

　　其中f(x_{i})是预测值，y_{i}是真实值。

　　其中f(xi)是预测值，yi是真实值。在二维图像中，该函数代表每个散点到拟合曲线y轴距离的总和，非常直观。

　　2 交叉熵函数

　　出自信息论中的一个概念，原来的含义是用来估算平均编码长度的。在机器学习领域中，其常常作为分类问题的损失函数。

　　其中f(xi)是预测值，yi是真实值。

　　其中f(x_{i})是预测值，y_{i}是真实值。

　　其中f(xi)是预测值，yi是真实值。交叉熵函数是怎么工作的呢?假设在分类问题中，被预测的物体只有是或者不是，预测值常常不是1或者0这样绝对的预测结果，预测是常用的做法是将预测结果中大于0.5的当作1，小于0.5的当作0。

　　此时假设如果存在一个样本，预测值接近于0，实际值却是1，那么在交叉熵函数的前半部分：

　　其运算结果会远远小于0，取符号后会远远大于0，导致该模型的损失函数巨大。通过减小交叉熵函数可以使得模型的预测精度大大提升。

　　tensorflow中损失函数的表达

　　1 均方差函数

　　loss = tf.reduce_mean(tf.square(logits-labels))

　　loss = tf.reduce_mean(tf.square(tf.sub(logits, labels)))

　　loss = tf.losses.mean_squared_error(logits,labels)

　　2 交叉熵函数

　　loss = tf.nn.sigmoid_cross_entropy_with_logits(labels=y,logits=logits)

　　#计算方式：对输入的logits先通过sigmoid函数计算，再计算它们的交叉熵

　　#但是它对交叉熵的计算方式进行了优化，使得结果不至于溢出。

　　loss = tf.nn.softmax_cross_entropy_with_logits(labels=y,logits=logits)

　　#计算方式：对输入的logits先通过softmax函数计算，再计算它们的交叉熵，

　　#但是它对交叉熵的计算方式进行了优化，使得结果不至于溢出。

　　例子

　　1 均方差函数

　　这是一个一次函数拟合的例子。三个loss的意义相同。

　　import numpy as np

　　import tensorflow as tf

　　x_data = np.random.rand(100).astype(np.float32) #获取随机X值

　　y_data = x_data * 0.1 + 0.3 #计算对应y值

　　Weights = tf.Variable(tf.random_uniform([1],-1.0,1.0)) #random_uniform返回[m,n]大小的矩阵，产生于low和high之间，产生的值是均匀分布的。

　　Biaxs = tf.Variable(tf.zeros([1])) #生成0

　　y = Weights*x_data + Biaxs

　　loss = tf.losses.mean_squared_error(y_data,y) #计算平方差

　　#loss = tf.reduce_mean(tf.square(y_data-y))

　　#loss = tf.reduce_mean(tf.square(tf.sub(y_data,y)))

　　optimizer = tf.train.GradientDescentOptimizer(0.6) #梯度下降法

　　train = optimizer.minimize(loss)

　　init = tf.initialize_all_variables()

　　sess = tf.Session()

　　sess.run(init)

　　for i in range(200):

　　sess.run(train)

　　if i % 20 == 0:

　　print(sess.run(Weights),sess.run(Biaxs))

　　输出结果为：

　　[0.10045234] [0.29975605]

　　[0.10010818] [0.2999417]

　　[0.10002586] [0.29998606]

　　[0.10000619] [0.29999667]

　　[0.10000149] [0.2999992]

　　2 交叉熵函数

　　这是一个Mnist手写体识别的例子。两个loss函数都可以进行交叉熵运算，在计算loss函数的时候中间经过的函数不同。

　　import tensorflow as tf

　　import numpy as np

　　from tensorflow.examples.tutorials.mnist import input_data

　　mnist = input_data.read_data_sets("MNIST_data",one_hot = "true")

　　def add_layer(inputs,in_size,out_size,n_layer,activation_function = None):

　　layer_name = 'layer%s'%n_layer

　　with tf.name_scope(layer_name):

　　with tf.name_scope("Weights"):

　　Weights = tf.Variable(tf.random_normal([in_size,out_size]),name = "Weights")

　　tf.summary.histogram(layer_name+"/weights",Weights)

　　with tf.name_scope("biases"):

　　biases = tf.Variable(tf.zeros([1,out_size]) + 0.1,name = "biases")

　　tf.summary.histogram(layer_name+"/biases",biases)

　　with tf.name_scope("Wx_plus_b"):

　　Wx_plus_b = tf.matmul(inputs,Weights) + biases

　　tf.summary.histogram(layer_name+"/Wx_plus_b",Wx_plus_b)

　　if activation_function == None :

　　outputs = Wx_plus_b

　　else:无锡人流费用 http://www.xasgfk120.com/

　　outputs = activation_function(Wx_plus_b)

　　tf.summary.histogram(layer_name+"/outputs",outputs)

　　return outputs

　　def compute_accuracy(x_data,y_data):

　　global prediction

　　y_pre = sess.run(prediction,feed_dict={xs:x_data})

　　correct_prediction = tf.equal(tf.arg_max(y_data,1),tf.arg_max(y_pre,1)) #判断是否相等

　　accuracy = tf.reduce_mean(tf.cast(correct_prediction,tf.float32)) #赋予float32数据类型，求平均。

　　result = sess.run(accuracy,feed_dict = {xs:batch_xs,ys:batch_ys}) #执行

　　return result

　　xs = tf.placeholder(tf.float32,[None,784])

　　ys = tf.placeholder(tf.float32,[None,10])

　　layer1 = add_layer(xs,784,150,"layer1",activation_function = tf.nn.tanh)

　　prediction = add_layer(layer1,150,10,"layer2")

　　#由于loss函数在运算的时候会自动进行softmax或者sigmoid函数的运算，所以不需要特殊激励函数。

　　with tf.name_scope("loss"):

　　loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(labels=ys,logits = prediction),name = 'loss')

　　#loss = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(labels=ys,logits = prediction),name = 'loss')

　　#label是标签，logits是预测值，交叉熵。

　　tf.summary.scalar("loss",loss)

　　train = tf.train.AdamOptimizer(4e-3).minimize(loss)

　　init = tf.initialize_all_variables()

　　merged = tf.summary.merge_all()

　　with tf.Session() as sess:

　　sess.run(init)

　　write = tf.summary.FileWriter("logs/",sess.graph)

　　for i in range(5001):

　　batch_xs,batch_ys = mnist.train.next_batch(100)

　　sess.run(train,feed_dict = {xs:batch_xs,ys:batch_ys})

　　if i % 1000 == 0:

　　print("训练%d次的识别率为：%f。"%((i+1),compute_accuracy(mnist.test.images,mnist.test.labels)))

　　result = sess.run(merged,feed_dict={xs:batch_xs,ys:batch_ys})

　　write.add_summary(result,i)

　　输出结果为

　　训练1次的识别率为：0.103100。

　　训练1001次的识别率为：0.900700。

　　训练2001次的识别率为：0.928100。

　　训练3001次的识别率为：0.938900。

　　训练4001次的识别率为：0.945600。

　　训练5001次的识别率为：0.952100。

tf常见的损失函数（LOSS）汇总的更多相关文章

损失函数(loss function)
通常而言,损失函数由损失项(loss term)和正则项(regularization term)组成.发现一份不错的介绍资料: http://www.ics.uci.edu/~dramanan/te ...
常见.NET功能代码汇总（2）
常见.NET功能代码汇总 23,获取和设置分级缓存获取缓存:首先从本地缓存获取,如果没有,再去读取分布式缓存写缓存:同时写本地缓存和分布式缓存 private static T GetGradeCa ...
IE6 浏览器常见兼容问题大汇总（23个）
IE6以及各个浏览器常见兼容问题大汇总综述:虽然说IE6在2014年4月将被停止支持,但是不得不说的是,IE6的市场并不会随着支持的停止而立刻消散下去,对于WEB前端开发工程师来说,兼容IE6 兼 ...
机器学习损失函数(Loss/Error Function)、代价函数(Cost Function)和目标函数(Objective function)
损失函数(Loss/Error Function): 计算单个训练集的误差,例如:欧氏距离,交叉熵,对比损失,合页损失代价函数(Cost Function): 计算整个训练集所有损失之和的平均值至 ...
损失函数(Loss function) 和代价函数(Cost function)
1损失函数和代价函数的区别: 损失函数(Loss function):指单个训练样本进行预测的结果与实际结果的误差. 代价函数(Cost function):整个训练集,所有样本误差总和(所有损失函数 ...
IE6 浏览器常见兼容问题大汇总（23个）[转载]
IE6以及各个浏览器常见兼容问题大汇总综述:虽然说IE6在2014年4月将被停止支持,但是不得不说的是,IE6的市场并不会随着支持的停止而立刻消散下去,对于WEB前端开发工程师来说,兼容IE6 兼 ...
损失函数(Loss Function) -1
http://www.ics.uci.edu/~dramanan/teaching/ics273a_winter08/lectures/lecture14.pdf Loss Function 损失函数 ...
损失函数(loss function) 转
原文:http://luowei828.blog.163.com/blog/static/310312042013101401524824 通常而言,损失函数由损失项(loss term)和正则项(r ...
leetcode常见算法与数据结构汇总
leetcode刷题之后,很多问题老是记忆不深刻,因此特意开此帖: 一.对做过题目的总结: 二.对一些方法精妙未能领会透彻的代码汇总,进行时常学习: 三.总结面试笔试常见题目,并讨论最优解法及各种解法 ...

随机推荐

让Mac终端保持(SSH)与远程的连接状态
编辑 /etc/ssh/ssh_config 添加以下设置可解决这个问题: # 断开时重试连接的次数 ServerAliveCountMax 5 # 每隔5秒自动发送一个空的请求以保持连接 Serve ...
docker run启动的容器挂掉了，数据怎么办
情景描述在某个系统中,功能性的服务使用 docker stack deploy xxx 启动,某个国产数据库的服务单独使用 docker run xxx 启动,数据库服务没有将存储的位置挂载出来: ...
MSSQL Server 及 MSSQL Express版本自动备份
一.SQL Server Management Studio(SMSS) 维护计划 [参考]SQL SERVER如何定期自动备份数据库二.Windows 级任务计划程序( MSSQL Expres ...
Flask 上传下载文件
上传文件示例代码 #encoding:utf8 from werkzeug.utils import secure_filename from flask import Flask,render_te ...
oracle 统计成绩
set serveroutput on; declare cursor c1 is select dno,dname from dep; pdno dep.dno%TYPE; pdname dep.d ...
java 迭代的陷阱
/** * 关于迭代器,有一种常见的误用,就是在迭代的中间调用容器的删除方法. * 但运行时会抛出异常:java.util.ConcurrentModificationException * * 发生 ...
关于aardio修改注册表默认键值的问题(转)
今天用aardio做注册表练习遇到一个问题. 就是不知道怎么用aardio修改已存在的默认的注册表键的值.. 导出注册信息看了一下默认的和普通的键值不太一样形式是 @="要写入 ...
Python - Django - 中间件 process_template_response
process_template_response(self, request, response) 有两个参数,response 是 TemplateResponse 对象(由视图函数或者中间件产生 ...
Doker容器部署Tomcat服务器
1.拉取tomcat服务镜像文件 root@ubuntu:~# docker pull registry.cn-hangzhou.aliyuncs.com/xxxx/xxxxx:web web: Pu ...
Linux CentOS7 下无图形界面安装Oracle11G R2版本
01,系统 Centos7 数据库版本 Oracle_11gR2 ,以及硬件要求内存不能小于 1G,可用硬盘不小于8G Swap分区空间不小于2G grep MemTotal /proc/memin ...

tf常见的损失函数（LOSS）汇总

tf常见的损失函数（LOSS）汇总的更多相关文章

随机推荐

热门专题