1.Focal Loss

focal loss是最初由何恺明提出的，最初用于图像领域解决数据不平衡造成的模型性能问题。本文试图从交叉熵损失函数出发，分析数据不平衡问题，focal loss与交叉熵损失函数的对比，给出focal loss有效性的解释。

Focal Loss的引入主要是为了解决难易样本数量不平衡（注意，有区别于正负样本数量不平衡）的问题，实际可以使用的范围非常广泛。
该损失函数来源于论文Focal Loss for Dense Object Detection，作者利用它改善了图像物体检测的效果。不过Focal Loss完全是一个通用性的Loss，因为在 NLP中，也存在大量的类别不平衡的任务。
最经典的就是序列标注任务中类别是严重不平衡的，比如在命名实体识别中，显然一句话里边实体是比非实体要少得多，这就是一个类别严重不平衡的情况。

参考链接：
https://blog.csdn.net/fly_time2012/article/details/123428695

https://zhuanlan.zhihu.com/p/266023273

2.Circle Loss

深度特征学习有两种基本范式，分别是使用类标签和使用正负样本对标签进行学习。使用类标签时一般需要用分类损失函数（比如 softmax + cross entropy）优化样本和权重向量之间的相似度；使用样对标签时，通常用度量损失函数（比如 triplet损失）来优化样本之间的相似度。然而这两种方式均存在优化缺乏灵活性和收敛状态不明确的缺点。
因此，Circle Loss 设计了一个更灵活的优化途径，通向一个更明确的优化目标。该方法来源于论文Circle Loss: A
Unified Perspective of Pair Similarity Optimization

常用优化方法和新提出的优化方法之间的对比图示如下。

Circle Loss 非常简单，而它对深度特征学习的意义却非常本质，表现为以下三个方面：

统一的（广义）损失函数。从统一的相似度配对优化角度出发，它为两种基本学习范式（即使用类别标签和使用样本对标签的学习）提出了一种统一的损失函数；
梯度反向传播会根据权重来调整幅度大小。那些优化状态不佳的相似度分数，会被分配更大的权重因子，并因此获得更大的更新梯度。如上图所示，在Circle Loss 中，A、B、C 三个状态对应的优化各有不同；
明确的收敛状态。在这个圆形的决策边界上，Circle Loss 更偏爱特定的收敛状态（如图中的
T）。这种明确的优化目标有利于提高特征鉴别力。

参考链接：
https://blog.csdn.net/cxx654/article/details/122158148

样本数量不平衡问题方案（Focal Loss & Circle Loss）的更多相关文章

PCA样本数量少于矩阵维数
%test pcaA=[3,7,1,4,1;5,5,2,1,3;4,2,4,5,3];S=cov(A);T=cov(A');[ds,vs]=eig(S)[dt,vt]=eig(T) 样本数量少于矩阵维 ...
L1 loss, L2 loss以及Smooth L1 Loss的对比
总结对比下\(L_1\) 损失函数,\(L_2\) 损失函数以及\(\text{Smooth} L_1\) 损失函数的优缺点. 均方误差MSE (\(L_2\) Loss) 均方误差(Mean Squ ...
R语言-选择样本数量
功效分析:可以帮助在给定置信度的情况下,判断检测到给定效应值时所需的样本量,也可以在给定置信水平的情况下,计算某样本量内可以检测到的给定效应值的概率 1.t检验案例:使用手机和司机反应时间的实验 l ...
[loss]Triphard loss优雅的写法
之前一直自己手写各种triphard,triplet损失函数, 写的比较暴力,然后今天一个学长给我在github上看了一个别人的triphard的写法,一开始没看懂,用的pytorch函数没怎么见过, ...
L1 loss L2 loss
https://www.letslearnai.com/2018/03/10/what-are-l1-and-l2-loss-functions.html http://rishy.github.io ...
【深度学习】Focal Loss 与 GHM——解决样本不平衡问题
Focal Loss 与 GHM Focal Loss Focal Loss 的提出主要是为了解决难易样本数量不平衡(注意:这有别于正负样本数量不均衡问题)问题.下面以目标检测应用场景来说明. 一些 ...
Deep Learning 9_深度学习UFLDL教程：linear decoder_exercise（斯坦福大学深度学习教程）
前言实验内容:Exercise:Learning color features with Sparse Autoencoders.即:利用线性解码器,从100000张8*8的RGB图像块中提取颜色特 ...
ROC，AUC，Precision，Recall，F1的介绍与计算（转）
1. 基本概念 1.1 ROC与AUC ROC曲线和AUC常被用来评价一个二值分类器(binary classifier)的优劣,ROC曲线称为受试者工作特征曲线 (receiver operatin ...
ROC，AUC，Precision，Recall，F1的介绍与计算
1. 基本概念 1.1 ROC与AUC ROC曲线和AUC常被用来评价一个二值分类器(binary classifier)的优劣,ROC曲线称为受试者工作特征曲线 (receiver operatin ...
How Do Vision Transformers Work?[2202.06709] - 论文研读系列(2) 个人笔记
[论文简析]How Do Vision Transformers Work?[2202.06709] 论文题目:How Do Vision Transformers Work? 论文地址:http:/ ...

随机推荐

Profile Config 多环境不同配置
应用场景如:我们可以在开发.测试环境中,启用 Swagger,在生产环境中不启用 package com.vipsoft.web.boot.config; import springfox.docum ...
Java的非法反射警告illegal reflective access operation
反射是一项相当强大的特性,不仅在各类框架中被广泛应用,即使是在日常开发中我们也隔三差五得要和它打交道.然而在JDK9中JDK对反射加上了一些限制,需要注意. 考虑有如下的代码: import java ...
"error LNK2019: 无法解析的外部符号"原因分析
1.工程属性选择错误问题: 分析: 新建的是控制台程序,但编译器和链接器却用的是windows子系统解决办法: WINDOWS和CONSOLE选择右键工程名, 打开属性,依次找到以下路径: 然后 ...
[kuangbin带你飞]专题十二基础DP1 题解+总结
kuangbin带你飞:点击进入新世界文章目录目录文章目录 1.Max Sum Plus Plus 2.Ignatius and the Princess IV 3.Monkey and Ban ...
SetFitABSA: 基于 SetFit 的少样本、方面级情感分析
SetFitABSA 是一种可以有效从文本中检测方面级情感的技术. 方面级情感分析 (Aspect-Based Sentiment Analysis,ABSA) 是一种检测文本中特定方面的情感的任务. ...
使用element-plus的el-scrollbar时滚动条没有显示出来但是页面可以滚动的解决办法
如果使用 Element UI 的 el-scrollbar 组件时,滚动条没有显示出来但页面可以滚动,可以尝试调用其 update 方法来更新滚动条. 在适当的时机(例如在数据加载完成后或组件更新后 ...
vue实现word或pdf文档导出的功能
https://www.jianshu.com/p/73915ef6ac89 Vue - element-ui 中预览 word .exce.ppt以及pdf文件 https://blog.csdn. ...
shell 脚本之 disk_monitor
编写脚本实现监测指定文件夹的磁盘空间. =========================================================== ## 脚本逻辑介绍用户通过 --p ...
碎碎念 | 20230326 · 与 SEU & 南传跆协共进晚餐
(碎碎念)今天晚上跟社团一起吃饭,南传的跆协来交流了.南传的人说他们基本散养,没人正经自习图书馆基本废弃,校园里有一个大舞台每天表演,大家每天写剧本 / 演绎 / 拍摄剪辑,天天喝庆功酒()然 ...
citespace 文献计量工具初探
先放几个教程: 知乎 - CiteSpace 使用教程 - 312 赞同知乎 - CiteSpace 入门教程 - 949 赞同简书 - 研究方法 | 用 CiteSpace 进行科学文献可视化分 ...

样本数量不平衡问题方案（Focal Loss & Circle Loss）

1.Focal Loss

2.Circle Loss

样本数量不平衡问题方案（Focal Loss & Circle Loss）的更多相关文章

随机推荐

热门专题