pytorch 损失函数（nn.BCELoss 和 nn.CrossEntropyLoss）（思考多标签分类问题）

一、BCELoss 二分类损失函数

输入维度为（n, ），输出维度为(n, )

如果说要预测二分类值为1的概率，则建议用该函数！

输入比如是3维，则每一个应该是在0——1区间内（随意通常配合sigmoid函数使用），举例如下：

import torch
import torch.nn as nn

m = nn.Sigmoid()

loss = nn.BCELoss()

input = torch.randn(3,requires_grad=True)

target = torch.empty(3).random_(2)

output = loss(m(input), target)

output.backward()

input,target,output

返回值：

(tensor([-0.8728,  0.3632, -0.0547], requires_grad=True),

 tensor([1., 0., 0.]),

 tensor(0.9264, grad_fn=<BinaryCrossEntropyBackward>))

m(input)结果为：

tensor([0.2947, 0.5898, 0.4863])

计算output = (1 * ln 0.2947+(1-1)*ln(1-0.2947) + 0*ln0.5898 + (1-0)*ln(1-0.5898) + 0*ln0.4863 + (1-0)*ln(1-0.4863)) / 3 = 0.9264

二、nn.CrossEntropyLoss 交叉熵损失函数

输入维度（batch_size, feature_dim）

输出维度 (batch_size, 1)

X_input = torch.tensor[ [2.8883, 0.1760, 1.0774],

　　　　　　　　　　[1.1216, -0.0562, 0.0660],

　　　　　　　　　　[-1.3939, -0.0967, 0.5853]]

y_target = torch.tensor([1,2,0])

loss_func = nn.CrossEntropyLoss()

loss = loss_func(X_input, y_target)

计算流程：第一，x先softmax再log，得到x_hat 第二，y转0-1编码[1,2,0] 转[[0,1,0], [0,0,1], [1,0,0]] 再与x_hat相乘，取负取平均值

思考问题：多标签的分类任务中，怎么使用损失函数呢，是拆分是多个二分类问题呢，还是不用拆分直接用BCE呢（https://blog.csdn.net/rosefun96/article/details/88058708，参考：BCE 可以应用到多标签的分类任务中）？有什么区别呢？

pytorch 损失函数（nn.BCELoss 和 nn.CrossEntropyLoss）（思考多标签分类问题）的更多相关文章

pytorch中文文档-torch.nn常用函数-待添加-明天继续
https://pytorch.org/docs/stable/nn.html 1)卷积层 class torch.nn.Conv2d(in_channels, out_channels, kerne ...
[pytorch笔记] torch.nn vs torch.nn.functional; model.eval() vs torch.no_grad(); nn.Sequential() vs nn.moduleList
1. torch.nn与torch.nn.functional之间的区别和联系 https://blog.csdn.net/GZHermit/article/details/78730856 nn和n ...
pytorch中文文档-torch.nn.init常用函数-待添加
参考:https://pytorch.org/docs/stable/nn.html torch.nn.init.constant_(tensor, val) 使用参数val的值填满输入tensor ...
小白学习之pytorch框架(2)-动手学深度学习(begin-random.shuffle()、torch.index_select()、nn.Module、nn.Sequential())
在这向大家推荐一本书-花书-动手学深度学习pytorch版,原书用的深度学习框架是MXNet,这个框架经过Gluon重新再封装,使用风格非常接近pytorch,但是由于pytorch越来越火,个人又比 ...
Pytorch本人疑问(1) torch.nn和torch.nn.functional之间的区别
在写代码时发现我们在定义Model时,有两种定义方法: torch.nn.Conv2d()和torch.nn.functional.conv2d() 那么这两种方法到底有什么区别呢,我们通过下述代码看 ...
从 relu 的多种实现来看 torch.nn 与 torch.nn.functional 的区别与联系
从 relu 的多种实现来看 torch.nn 与 torch.nn.functional 的区别与联系 relu多种实现之间的关系 relu 函数在 pytorch 中总共有 3 次出现: torc ...
pytorch 损失函数
pytorch损失函数: http://blog.csdn.net/zhangxb35/article/details/72464152?utm_source=itdadao&utm_medi ...
Multi label 多标签分类问题（Pytorch，TensorFlow，Caffe）
适用场景:一个输入对应多个label,或输入类别间不互斥调用函数: 1. Pytorch使用torch.nn.BCEloss 2. Tensorflow使用tf.losses.sigmoid_cro ...
Pytorch的默认初始化分布 nn.Embedding.weight初始化分布
一.nn.Embedding.weight初始化分布 nn.Embedding.weight随机初始化方式是标准正态分布 ,即均值$\mu=0$,方差$\sigma=1$的正态分布. 论据1——查看 ...

随机推荐

S5830 android 2.3.4和2.3.7
12年元旦买的手机S5830,原机自带2.3.4的系统. 看到人家的机子2.3.6的效果稍微绚一点,动了想刷机的念头. 前两天刷了2.3.7,效果还满意,用的还舒服,感觉就是有些费电, 本来就对智能手 ...
JS中的Array之方法(3) -之迭代
colors=["red", "橘色", "瓜皮色", "古铜色", "#aaa", "# ...
hi-nginx-java并发性能一窥
欲知hi-nginx-java的并发性能,用jmeter进行测试便知一二. 设定用户数为100000,循环次数为100,ramp-up perio为2: 请求地址为http://localhost/t ...
手把手教你使用Vuex（三）
2.mutation属性了解: mutation是更改Vuex的store中的状态的唯一方法.非常类似于事件,官网说的"每个mutation都有一个字符串的事件类型和一个回调函数" ...
php socket 编程问题总结
1. PHP declare(ticks=N); 的作用 https://blog.csdn.net/udefined/article/details/24333333 2. pack &&a ...
Go语言实现excel导入无限级菜单结构
目录需求实现测试简单例子复杂例子需求最近有一个需求,要实现一个无限级结构的树型菜单,差不多长下面这个样子我们知道无限级实现思路都是用一个parent_id将各种层级串联起来,顶级的pa ...
MathType如何输入微分上的点
作为被老师们青睐的公式编辑器,MathType可以帮助插入各种数学符号和编辑数学公式,从而提高数学试卷的编写效率.但是作为新手,在编辑公式的时候难免有困难,比如就有人问:如何输入微分上的点?其实也是有 ...
吉他自学用Guitar Pro好不好？
很多人心中都有一个吉他梦,可苦于没有坚持下来.其实一个人自学吉他过程是非常枯燥的.经常手上被磨得都是茧,但是也不清楚自己弹的到底对不对. 如果不跟着老师练习,那很有可能就走了歪路或者是无法长期坚持.所 ...
MathType中余弦函数的输入
余弦函数是三角函数中十分重要的一个知识点,余弦函数的俩种形式分别为a2=b2+c2-2bccosA和cosA=(b2+c2-a2)/2bc,接下来我们分别介绍一下这俩种形式的输入. 具体步骤如下: 步 ...
如何使用ABBYY FineReader 识别竖排或反转文本？
ABBYY FineReader 15(Windows系统)OCR文字识别软件拥有强大的OCR识别功能,能够对这些竖排排版的文档进行准确的识别,另外对于一些具有反转颜色(白色字符和黑暗背景的图像)的文 ...

pytorch 损失函数（nn.BCELoss 和 nn.CrossEntropyLoss）（思考多标签分类问题）

pytorch 损失函数（nn.BCELoss 和 nn.CrossEntropyLoss）（思考多标签分类问题）的更多相关文章

随机推荐

热门专题