（原）Ring loss Convex Feature Normalization for Face Recognition

转载请注明出处：

http://www.cnblogs.com/darkknightzh/p/8858998.html

论文：

Ring loss: Convex Feature Normalization for Face Recognition

理解的不对的地方请见谅

Ring loss将特征限制到缩放后的单位圆上，同时能保持凸性，来得到更稳健的特征。

该损失函数作为辅助的损失，结合Softmax或者A-softmax等损失函数，来学习到特征的模，因而唯一的超参数就是ring loss的权重。论文中在权重为0.01时效果最好。

论文中指出，arcface，cosface等在训练时，损失函数之前将特征进行了归一化，但网络实际上并未学习到归一化的特征。如下图所示，a为训练样本的特征分布，b为测试样本的特征分布，训练样本特征均集中在一定的夹角范围内。但是对于测试样本中模比较小的，其变化范围比较大。

令F为深度模型，x为输入图像，则F(x)为特征。可优化下面的损失函数：

$\min {{L}_{s}}(F(x))\text{ s}\text{.t}\text{. }{{\left\| F(x) \right\|}_{2}}=R$

R为归一化后特征的模。由于模的等式限制，导致实际上该损失函数是非凸的（这句话不太确定怎么翻译，反正是非凸）。

因而Ring loss定义如下：

${{L}_{R}}=\frac{\lambda }{2m}\sum\limits_{i=1}^{m}{{{({{\left\| F({{x}_{i}}) \right\|}_{2}}-R)}^{2}}}$

相应的梯度计算如下：

$\frac{\partial {{L}_{R}}}{\partial R}=-\frac{\lambda }{m}\sum\limits_{i=1}^{m}{({{\left\| F({{x}_{i}}) \right\|}_{2}}-R)}$

$\frac{\partial {{L}_{R}}}{\partial F({{x}_{i}})}=\frac{\lambda }{m}(1-\frac{R}{{{\left\| F({{x}_{i}}) \right\|}_{2}}})F({{x}_{i}})$

上式中R为特征模的长度，类似于cosface及arcface中使用到的s，只不过s是提前设定的（将特征的模归一化，并放大到该值），如30，而此处的R是通过训练学到的。m为batchsize，为Ring loss的权重。实际使用时，可以结合softmax loss/A-softmax loss。Softmax/A-softmax loss为主损失函数，Ring loss为辅助损失函数。论文中为0.01时，训练效果最好。

下图是一个简单的例子，其中绿色点为初始化的点，蓝色的为目标类别，红色的为经过20次训练后，特征的分布。a为使用softmax的结果；b为使用ring loss，权重为1；c为使用ring loss，权重为10。可见，使用softmax后，特征收敛到比较大的范围。由于使用ring loss时，设置的特征模长为1，因而b能收敛到比较合理的位置（特征较集中）。当权重太大时，softmax起的作用很小，导致特征收敛到单位圆上，如c所示。因而需要合理的权重来平衡辅助损失函数ring loss和主损失函数。

论文中在MsCeleb1M（31000人，3.5M图像）上训练64层的resnet网络，性能比较好。

我这边在pytorch中进行了实现，初始化时R为0-30之间的随机数，在casia上训练resnet20的网络，效果稍微好于直接使用softmax训练后的模型（softmax的dir78%，ring loss的dir：不到80%。这两个模型均使用了batchnorm，否则dir没有这么高。。。）。

（原）Ring loss Convex Feature Normalization for Face Recognition的更多相关文章

深度挖坑：从数据角度看人脸识别中Feature Normalization,Weight Normalization以及Triplet的作用
深度挖坑:从数据角度看人脸识别中Feature Normalization,Weight Normalization以及Triplet的作用周翼南北京大学工学硕士 373 人赞同了该文章基于深 ...
A Theoretical Analysis of Feature Pooling in Visual Recognition
这篇是10年ICML的论文,但是它是从原理上来分析池化的原因,因为池化的好坏的确会影响到结果,比如有除了最大池化和均值池化,还有随机池化等等,在eccv14中海油在顶层加个空间金字塔池化的方法.可谓多 ...
【CV论文阅读】+【搬运工】LocNet: Improving Localization Accuracy for Object Detection + A Theoretical analysis of feature pooling in Visual Recognition
论文的关注点在于如何提高bounding box的定位,使用的是概率的预测形式,模型的基础是region proposal.论文提出一个locNet的深度网络,不在依赖于回归方程.论文中提到locne ...
Paper reading: High-Fidelity Pose and Expression Normalization for Face Recognition in the Wild（HPEN）
1. Introduction 人脸识别受到各种因素影响,其中最重要的两个影响是 pose 和 expression, 这两个因素会对 intra-person 变化产生极大的影响, 有时候甚至会超过 ...
Large Margin Softmax Loss for Speaker Verification
[INTERSPEECH 2019接收] 链接:https://arxiv.org/pdf/1904.03479.pdf 这篇文章在会议的speaker session中.本文主要讨论了说话人验证中的 ...
（转载）人脸识别中Softmax-based Loss的演化史
人脸识别中Softmax-based Loss的演化史旷视科技近期,人脸识别研究领域的主要进展之一集中在了 Softmax Loss 的改进之上:在本文中,旷视研究院(上海)(MEGVII Re ...
人脸识别的LOSS（上）
超多分类的Softmax 2014年CVPR两篇超多分类的人脸识别论文:DeepFace和DeepID Taigman Y, Yang M, Ranzato M A, et al. Deepface: ...
【原】Coursera—Andrew Ng机器学习—编程作业 Programming Exercise 1 线性回归
作业说明 Exercise 1,Week 2,使用Octave实现线性回归模型.数据集 ex1data1.txt ,ex1data2.txt 单变量线性回归必须实现,实现代价函数计算Computin ...
[论文理解]Focal Loss for Dense Object Detection（Retina Net）
Focal Loss for Dense Object Detection Intro 这又是一篇与何凯明大神有关的作品,文章主要解决了one-stage网络识别率普遍低于two-stage网络的问题 ...

随机推荐

安卓在代码中设置TextView的drawableLeft、drawableRight、drawableTop、drawableBottom
Drawable rightDrawable = getResources().getDrawable(R.drawable.icon_new); //调用setCompoundDrawables时, ...
[九省联考2018]一双木棋chess
题解: 水题吧首先很显然的是状压或者搜索考虑一下能不能状压吧这个东西一定是长成三角形的样子的所以是可以状压的相邻两位之间有几个0代表他们差几这样最多会有2n 然后就可以转移了由于之前对博 ...
CSS3实现整屏切换效果
页面结构实现思路与大众方法类似,如图每个section就是一页内容,它的大小充满了屏幕(红色区域),一个Container由多个section构成,我们通过改变container的位置,来达到页面 ...
C++对文本文件的读取和输出
本文转载自xmh_free 自己浏览了上方的博客,主要整理了一下关于C++对文件的输入输出方法,如果想看C语言的输入输出方法,可浏览上述链接的博客 C++读写函数在C++中,对文件的操作是通过str ...
Java内存管理-JVM内存模型以及JDK7和JDK8内存模型对比总结（三）
勿在流沙住高台,出来混迟早要还的. 做一个积极的人编码.改bug.提升自己我有一个乐园,面向编程,春暖花开! 上一篇分享了JVM及其启动流程,今天介绍一下JVM内部的一些区域,以及具体的区域在运行 ...
C# 运行中 Lua 语言脚本
这里就不介绍Lua语言了,使用挺广的一种脚本语言.自行百度. 第一步使用 Nuget 安装引用 VikingErik.LuaInterface. 第二步添加 Using using LuaInte ...
[POI2018]Pionek
[POI2018]Pionek 题目大意: 在无限大的二维平面的原点放置着一个棋子.你有$n(n\le2\times10^5)$条可用的移动指令,每条指令可以用一个二维整数向量表示.请你选取若干条 ...
Flask的使用
一.路由系统 1.子域名的配置 """ 可传入的参数: @app.route('/user/<username>') @app.route('/post/&l ...
MySQL数据命令
一.数据库操作创建数据库 create database db1 charset utf8; 查看数据库 show database; show create database db1; selec ...
设置Sublime Text 3的光标样式
升级了Sublime Text 3,结果光标变成了这个样子,非常不习惯: 查了文档http://www.sublimetext.com/3 ,Build 3059中得描述: Added setting ...

（原）Ring loss Convex Feature Normalization for Face Recognition

（原）Ring loss Convex Feature Normalization for Face Recognition的更多相关文章

随机推荐

热门专题