论文基本情况

发表时间及刊物/会议：2022 CVPR

发表单位：西安电子科技大学，香港中文大学，重庆邮电大学

问题背景

在大部分半监督学习方法中，一般而言，只有部分置信度高于提前设置的阈值的无标签数据被利用。由此说明，大部分半监督方法没有充分利用已有数据进行训练。

论文创新点

设置了Adaptive Confidence Margin（自适应阈值）根据训练规律动态调整阈值，充分利用所有的无标签数据。

网络结构

具体的训练步骤如下：

初始基本设定：

设置初始阈值，本文中，对于每个类别，阈值初始值为0.8。
本模型借鉴Mean Teacher的思想，引入老师模型（ema_model）。
训练时有标签和无标签数据按1：1的比例输入网络
模型backbone采用resent18，输出最后一层类别概率分布以及倒数第二层512维特征向量。

学生网络：

对于有标签数据：

有标签图片经过弱数据增强（WA）后进入模型，输出结果和真值对比，利用交叉熵函数作为损失函数，计算有标签损失\(L^s_{CE}\)。

对于无标签数据：

无标签图片复制三份（a图, b图, c图），其中两份（a图，b图）经过弱数据增强（WA）后输入模型，再将输出的两个概率分布平均后得到最终的概率分布。记所得概率分布中的最大概率为\(f_{max}\)，对应类别记作\(c\)。如果\(f_{max}\)大于此类别\(c\)对应阈值，则将\(c\)作为此类别的真实标签，并将此类数据归为子集I(含“真实标签”)；否则，将此类数据归为子集II（无真实标签）。

如果此图片属于子集I，则将c图经过强数据增强（SA）后送入网络，和标签\(c\)计算交叉熵损失\(L^u\)。

若此图片属于子集II，则\(L^u=0\)。并拼接a图，b图输入模型后得到的两个512特征向量，首先根据公式8 计算两个特征向量的相似度，再根据公式9计算SupConLoss \(L^c\) (具体计算方法见论文Supervised Contrastive Learning)。

总损失函数为:

实验中\(\lambda_1 = 0.5,\lambda_2=1,\lambda_3=0.1\)。

老师网络

学生模型根据损失函数更新模型参数后，老师网络在学生网络的基础上使用指数平均移动的方式更新参数。之后，将有标签数据输入老师网络，得到概率分布。

对于一个batch的数据，记最大概率对应标签类别和真实类别相同的图片为集合\(N_{st}\),记\(N^c_{st}\)为最大概率对应标签类别和真实类别相同，且真实类别为\(c\)的图片张数，记\(s_i\)为最大概率, \(\hat{y_i}\)为预测类别，按照以下公式计算一个类别的平均最大概率，记为\(T_c\)。

之后，考虑到置信值会随着epoch数逐步提高，再根据以下公式计算当前epoch各个类别的阈值。

至此，一个iteration结束。

实验

表1 固定阈值和我们方法的比较，在RAF-DB， SFEW数据集上的结果，其中FT 表示使用FixMatch方法时取固定阈值的具体值，

表2 RAF-DB, SFEW 和AffectNet三个数据集上我们的方法和其他优秀的半监督方法对比

图3 自适应阈值调整方法，公式5中关于两个参数的值的消融实验

表3 使用WideResNet-28-2作为backbone在RAFDB上实验结果

图4 使用2D t-SNE 可视化方法可视化得到的特征，从图中可以看出，我们的方法对各类表情提取特征的效果最好（不同类别的特征重合度最小）。

表4 各个不同类别的数据集交叉验证结果。以下结果为在RAF-DB上训练，CK+数据集上进行测试所得结果

[论文][表情识别]Towards Semi-Supervised Deep Facial Expression Recognition with An Adaptive Confidence Margin的更多相关文章

Paper-[acmi 2015]Image based Static Facial Expression Recognition with Multiple Deep Network Learning
[acmi 2015]Image based Static Facial Expression Recognition with Multiple Deep Network Learning ABST ...
CVPR 2020几篇论文内容点评：目标检测跟踪，人脸表情识别，姿态估计，实例分割等
CVPR 2020几篇论文内容点评:目标检测跟踪,人脸表情识别,姿态估计,实例分割等 CVPR 2020中选论文放榜后,最新开源项目合集也来了. 本届CPVR共接收6656篇论文,中选1470篇,&q ...
[CVPR 2016] Weakly Supervised Deep Detection Networks论文笔记
p.p1 { margin: 0.0px 0.0px 0.0px 0.0px; font: 13.0px "Helvetica Neue"; color: #323333 } p. ...
Deep Learning论文笔记之（八）Deep Learning最新综述
Deep Learning论文笔记之(八)Deep Learning最新综述 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文,但老感觉看完 ...
【Gabor】基于多尺度多方向Gabor融合+分块直方图的表情识别
Topic:表情识别Env: win10 + Pycharm2018 + Python3.6.8Date: 2019/6/23~25 by hw_Chen2018 ...
Deep Learning 17：DBN的学习_读论文“A fast learning algorithm for deep belief nets”的总结
1.论文“A fast learning algorithm for deep belief nets”的“explaining away”现象的解释: 见:Explaining Away的简单理解 ...
【论文笔记】Malware Detection with Deep Neural Network Using Process Behavior
[论文笔记]Malware Detection with Deep Neural Network Using Process Behavior 论文基本信息会议: IEEE(2016 IEEE 40 ...
机器学习： Tensor Flow with CNN 做表情识别
我们利用 TensorFlow 构造 CNN 做表情识别,我们用的是FER-2013 这个数据库, 这个数据库一共有 35887 张人脸图像,这里只是做一个简单到仿真实验,为了计算方便,我们用其中到 ...
42 在Raspberry Pi上安装dlib表情识别
https://www.jianshu.com/p/848014d8dea9 https://www.pyimagesearch.com/2017/05/01/install-dlib-raspber ...

随机推荐

详解 CSS 属性 - position
postion 属性定义了一个元素在页面布局中的位置以及对周围元素的影响.该属性共有5个值: position: absolute position: relative position: fixed ...
Android开发之理解Handler、Looper、MessageQueue、Thread关系
本文转自博客:http://blog.csdn.net/he90227/article/details/43567073 一. 图解与概述首先Android中的每一个线程都会对应一个Message ...
CommonsCollection7反序列化链学习
CommonsCollections7 1.前置知识 Hashtable Hashtable实现了Map接口和Serializable接口,因此,Hashtable现在集成到了集合框架中.它和Hash ...
LeetCode刷题知识点总结——二叉树
二叉树一.二叉树理论基础 1.满二叉树:如果一棵二叉树只有度为0的结点和度为2的结点,并且度为0的结点在同一层上,则这棵二叉树为满二叉树.通俗话理解:从底层开始到顶部的所有节点都全部填满的二叉树.深 ...
python函数基础算法简介
一.多层语法糖本质 """ 语法糖会将紧挨着的被装饰对象名字当参数自动传入装饰器函数中""" def outter(func_name): ...
mysql4与mysql5的区别_MySQL 4.1/5.0/5.1/5.5/5.6各版本的主要区别
MySQL 4.1/5.0/5.1/5.5/5.6各版本的主要区别一.5.0 增加了Stored procedures.Views.Cursors.Triggers.XA transactions的 ...
Ubu18.0-NVIDIA显卡驱动重装
//图片仅供参考,请勿代入问题情况:电脑装了双系统,WIN10+Ubu,Ubu分辨率不稳定,经常发生变化显卡型号:打开设备管理器进行查看解决方法:重装NVIDIA显卡驱动 1.去英伟达官网下载自 ...
论文解读（S^3-CL）《Structural and Semantic Contrastive Learning for Self-supervised Node Representation Learning》
论文信息论文标题:Structural and Semantic Contrastive Learning for Self-supervised Node Representation Learn ...
cookie,sessionStorage,localStorage
本文转 sessionStorage 和 localStorage 是HTML5 Web Storage API 提供的,可以方便的在web请求之间保存数据.有了本地数据,就可以避免数据在浏览器和服务 ...
SSM阶段学习-mybatis第一天
首先今天我尝试了使用IDEA软件链接数据库,创建数据库,创建表. 在pom文件下导入maven坐标 [<?xml version="1.0" encoding="U ...

[论文][表情识别]Towards Semi-Supervised Deep Facial Expression Recognition with An Adaptive Confidence Margin