Pytorch常用的交叉熵损失函数CrossEntropyLoss()详解

本篇借鉴了这篇文章，如果有兴趣，大家可以看看：https://blog.csdn.net/geter_CS/article/details/84857220

1、交叉熵：交叉熵主要是用来判定实际的输出与期望的输出的接近程度

2、CrossEntropyLoss()损失函数结合了nn.LogSoftmax()和nn.NLLLoss()两个函数。它在做分类（具体几类）训练的时候是非常有用的。

3、softmax用于多分类过程中，它将多个神经元的输出，映射到（0,1）区间内，可以看成概率来理解，从而来进行多分类！

其公式如下：

numpy计算代码：

import numpy as np

z = np.array([1.0, 2.0, 3.0, 4.0, 1.0, 2.0, 3.0])

print(np.exp(z)/sum(np.exp(z)))

4、LogSoftmax能够解决函数上溢和下溢的问题,加快运算速度,提高数据稳定性。

其计算公式：

M是max(x_i),这样可以解决上溢下溢的问题.(但这样输出概率和就不是1了)

代码：

import torch

x = torch.Tensor([-4, 2, -3.2, 0, 7])

softmax = torch.exp(x)/torch.sum(torch.exp(x))

print("softmax\n",softmax)

print("sum:",torch.sum(softmax))

LogSoftmax = torch.log(softmax)

print("LogSoftmax\n",LogSoftmax)

print("sum:",torch.sum(LogSoftmax))

结果：

5、NllLoss:即负对数似然损失函数(Negtive Log Likehood)。

公式：

其中 y_i是one_hot编码后的数据标签,NLLLoss()得到的结果即是 y_i与logsoftmax()激活后的结果相乘再求均值再取反。（实际在用封装好的函数时,传入的标签无需进行one_hot编码）

代码：

import torch

import torch.nn.functional as F

import torch.nn as nn

x = torch.randn(5,5)

print("x:\n",x)

target = torch.tensor([0,2,3,1,4])

one_hot = F.one_hot(target).float()

print("one_hot:\n", one_hot)

softmax = torch.exp(x)/torch.sum(torch.exp(x), dim=1).reshape(-1,1)

print("soft_max:\n",softmax)

LogSoftmax = torch.log(softmax)

nllloss = -torch.sum(one_hot*LogSoftmax)/target.shape[0]

print("nllLoss:",nllloss)

#利用torch.nn.funcation实现

logsoftmax = F.log_softmax(x, dim=1)

nllloss = F.nll_loss(logsoftmax, target)

print("torch_nllLoss:",nllloss)

#直接用torch.nn.CrossEntropyLoss验证

cross_entropy = F.cross_entropy(x, target)

print("cross_entropy:",cross_entropy)

结果：

5、没有权重的损失函数的计算如下：

有权重的损失函数的计算如下：

注意这里的标签值class，并不参与直接计算，而是作为一个索引,索引对象为实际类别

6、交叉熵损失（CE）和负对数极大似然估计（NLL）的关系：交叉熵是定义在两个one-hot向量之间的，更具体地说是定义在两个概率向量之间nll是定义在一个模型上的，取决于模型本身可以取不同的形式。

似然函数：都是指某种事件发生的可能性，但是在统计学中，“似然性”和“概率”（或然性）有明确的区分：概率，用于在已知一些参数的情况下，预测接下来在观测上所得到的结果；似然性，则是用于在已知某些观测所得到的结果时，对有关事物之性质的参数进行估值，也就是说已观察到某事件后，对相关参数进行猜测。

下图出处：

举个栗子，我们一共有三种类别，批量大小为1（为了好计算），那么输入size为（1,3），具体值为torch.Tensor([[-0.7715, -0.6205,-0.2562]])。标签值为target = torch.tensor([0])，这里标签值为0，表示属于第0类。loss计算如下：

import torch

import torch.nn as nn

import numpy as np

entroy = nn.CrossEntropyLoss()

input = torch.Tensor([[-0.7715,-0.6205,-0.2562]])

target = torch.tensor([0])

output = entroy(input,target)

print(output) #采用CrossEntropyLoss计算的结果。

myselfout = -(input[:,0])+np.log(np.exp(input[:,0])+np.exp(input[:,1])+np.exp(input[:,2])) #自己带公式计算的结果

print(myselfout)

lsf = nn.LogSoftmax()

loss = nn.NLLLoss()

lsfout = lsf(input)

lsfnout = loss(lsfout,target)

print(lsfnout)

结果:

tensor(1.3447)

tensor([1.3447])

tensor(1.3447)

softmax

SoftMax

Pytorch常用的交叉熵损失函数CrossEntropyLoss()详解的更多相关文章

交叉熵损失CrossEntropyLoss
在各种深度学习框架中,我们最常用的损失函数就是交叉熵,熵是用来描述一个系统的混乱程度,通过交叉熵我们就能够确定预测数据与真实数据的相近程度.交叉熵越小,表示数据越接近真实样本. 1 分类任务的损失计算 ...
[ch03-02] 交叉熵损失函数
系列博客,原文在笔者所维护的github上:https://aka.ms/beginnerAI, 点击star加星不要吝啬,星越多笔者越努力. 3.2 交叉熵损失函数交叉熵(Cross Entrop ...
【转载】深度学习中softmax交叉熵损失函数的理解
深度学习中softmax交叉熵损失函数的理解 2018-08-11 23:49:43 lilong117194 阅读数 5198更多分类专栏: Deep learning 版权声明:本文为博主原 ...
深度学习基础5:交叉熵损失函数、MSE、CTC损失适用于字识别语音等序列问题、Balanced L1 Loss适用于目标检测
深度学习基础5:交叉熵损失函数.MSE.CTC损失适用于字识别语音等序列问题.Balanced L1 Loss适用于目标检测 1.交叉熵损失函数在物理学中,"熵"被用来表示热力学 ...
深度学习原理与框架-神经网络结构与原理 1.得分函数 2.SVM损失函数 3.正则化惩罚项 4.softmax交叉熵损失函数 5. 最优化问题(前向传播) 6.batch_size(批量更新权重参数) 7.反向传播
神经网络由各个部分组成 1.得分函数:在进行输出时,对于每一个类别都会输入一个得分值,使用这些得分值可以用来构造出每一个类别的概率值,也可以使用softmax构造类别的概率值,从而构造出loss值, ...
关于交叉熵损失函数Cross Entropy Loss
1.说在前面最近在学习object detection的论文,又遇到交叉熵.高斯混合模型等之类的知识,发现自己没有搞明白这些概念,也从来没有认真总结归纳过,所以觉得自己应该沉下心,对以前的知识做一个 ...
softmax交叉熵损失函数求导
来源:https://www.jianshu.com/p/c02a1fbffad6 简单易懂的softmax交叉熵损失函数求导来写一个softmax求导的推导过程,不仅可以给自己理清思路,还可以造福 ...
最强常用开发库总结 - JSON库详解
最强常用开发库总结 - JSON库详解 JSON应用非常广泛,对于Java常用的JSON库要完全掌握.@pdai JSON简介 JSON是什么 JSON 指的是 JavaScript 对象表示法(Ja ...
常用开发库 - MapStruct工具库详解
常用开发库 - MapStruct工具库详解 MapStruct是一款非常实用Java工具,主要用于解决对象之间的拷贝问题,比如PO/DTO/VO/QueryParam之间的转换问题.区别于BeanU ...
Pytorch里的CrossEntropyLoss详解
在使用Pytorch时经常碰见这些函数cross_entropy,CrossEntropyLoss, log_softmax, softmax.看得我头大,所以整理本文以备日后查阅. 首先要知道上面提 ...

随机推荐

【Java】Applet开发
一.Applet开发环境准备 IDEA在2018版本默认提供了Applet启动配置创建一个Applet应用配置: 在IDEA2019版本之后,这个应用配置选项被移除了,改为Java Applet S ...
【Project】原生JavaWeb工程 03 单表的业务功能
年级表效果图样例: 可以看到主要分为以下这些功能: 功能一:展示年级列表功能二:每个年级都具备修改和删除功能三:添加一个年级功能四:对多个年级选中删除,也可以全选删除,或者反选删除功能五:根据 ...
【Linux】真机安装CentOS8
先制作启动U盘 https://www.cnblogs.com/mindzone/p/12961506.html 插入电脑,开机[这里我是把电脑硬盘格式化了,不会在电脑磁盘上找到任何系统,直接跳到启动 ...
JavaWeb入门到实战学习笔记
了解,讲得并不是很好,很展开. 概念动态web Web服务器 web服务器这节也是蜻蜓点水,引出tomcat而已 ASP(C#语言,微软) JSP PHP Java bootstrapclasslo ...
在python项目的docker镜像里使用pdm管理依赖
前言在 DjangoStarter 项目中,我已经使用 pdm 作为默认的包管理器,不再直接使用 pip 所以部署的时候 dockerfile 和 docker-compose 配置也得修改一下. ...
比对xls文件
使用bat运行diff-xls.js文件 bat代码 @echo off Cscript "路径\diff-xls.js" %1 %2 JS代码 // extensions: xl ...
kafka 运维
查看kafka topic列表 #集群需要先执行unset JMX_PORT ./kafka-topics.sh --zookeeper gitee-zookeeper:2181 --list 查看t ...
快手内推码：TYORVzmsw 秋招应届生/实习生真正本人内推已有多人在我内推之后，接连顺利通过了HR筛选、用人部门筛选、面试！
内推码:TYORVzmsw 校园招聘岗位列表:https://campus.kuaishou.cn/#/campus/jobs?code=TYORVzmsw 真正的本人内部推荐! 已有多人在我内推之后 ...
elementui 修改合计行样式
<style scoped> /deep/.el-table .el-table__footer-wrapper .cell { text-align: right } </styl ...
连续因子一个正整数 N
一个正整数 N 的因子中可能存在若干连续的数字.例如 630 可以分解为 3×5×6×7,其中 5.6.7 就是 3 个连续的数字.给定任一正整数 N,要求编写程序求出最长连续因子的个数,并输出最小的 ...

Pytorch常用的交叉熵损失函数CrossEntropyLoss()详解

注意这里的标签值class，并不参与直接计算，而是作为一个索引,索引对象为实际类别

Pytorch常用的交叉熵损失函数CrossEntropyLoss()详解的更多相关文章

随机推荐

热门专题