DeepID_V2解读

港中文汤晓鸥团队在DeepID_v1基础上提出的新版本架构，发表于NIPS2014

一、Architecture

网络架构基本上与DeepId_v1一致。

二、Pipeline

图片被分成20regions，每个region有5scales，2RGB&Gray共10种模式，共生成200个pathes，进行水平翻转，分别送入200个网络中。

以1个55 * 47的RGB 模式patch为例，过程和DeepID_v1相似，最后生成1个160维的向量。

用前后向贪心算法，从400个DeepID中，筛选出25个有效且互补的DeepID2向量，缩减计算规模，得到160*25 = 4000的特征值。

再利用PCA对此向量进行降维，得到1* 180的向量，以此向量为依据，做cls和verif，cls用交叉熵，verif用join Bayesian。

三、相比于DeepID_V1的改动

网络结构没有多大改动，重点是在loss计算上。众所周知，表征人脸的特征最好能使不同的人脸之间的差异尽可能大，使相同人脸的不同照片人脸之间差异尽可能小。我们希望得到一个网路，这个网络计算出来的特征vector尽可能满足上述条件。设计loss函数如下：

（一）分类loss

F是特征向量，θid是softmax层参数，t是label的分类结果。

（二）Verification loss

1.类内loss

当，input image和标签数据是同一个分类，此时训练网络，使之与label中的特征，尽可能的相近。

2.类间loss

当，input image和标签数据属于不同分类。

m为超参数，事先指定好。由上图知，当输入的图片的特征vector，和label的vector差异很大，其L2距离超过m时，loss值为0，网络倾向于学习，使类间距离尽可能的大的vector。

总Verification loss为类间loss和类内loss的加权和，权重各为0.5。

之前业界普遍采用的方法是L1/L2范式和余弦相似度，文中采用一种基于L2 Norm的损失函数。paper中作者测试了其他几种距离算法对准确率的影响，L2距离的性能最好。

（三）cls和verif的组合

选取合适的λ，调整verif loss在总loss中的系数,当λ=0时，不计算verfi的loss，文中选取λ=0.5

四、网络成绩

LFW共有5749个人的数据，共13233张脸。数据集太小，paper中引入外部数据集CelebFace+，有10177个人的数据，共202599张脸。

为充分利用从大量图像块中提取到的特征，作者重复使用7次前项后向贪婪算法选取特征，每次的选择是从之前的选择中未被留下的部分中进行选取。然后在每次选择的特征上，训练联合贝叶斯模型。再将这七个联合贝叶斯模型使用SVM进行融合，得到最佳的效果在LFW上为99.15%。

五、小结

DeeoID_V2印象最深的就是loss函数的创新，之前听师兄说发paper的3点分别是数据集，网络架构和loss函数，这次又验证了这一个观点。

DeepID_V2解读的更多相关文章

SDWebImage源码解读之SDWebImageDownloaderOperation
第七篇前言本篇文章主要讲解下载操作的相关知识,SDWebImageDownloaderOperation的主要任务是把一张图片从服务器下载到内存中.下载数据并不难,如何对下载这一系列的任务进行设计 ...
SDWebImage源码解读之 NSData+ImageContentType
第一篇前言从今天开始,我将开启一段源码解读的旅途了.在这里先暂时不透露具体解读的源码到底是哪些?因为也可能随着解读的进行会更改计划.但能够肯定的是,这一系列之中肯定会有Swift版本的代码. 说说 ...
SDWebImage源码解读之 UIImage+GIF
第二篇前言本篇是和GIF相关的一个UIImage的分类.主要提供了三个方法: + (UIImage *)sd_animatedGIFNamed:(NSString *)name ----- 根据名 ...
SDWebImage源码解读之 SDWebImageCompat
第三篇前言本篇主要解读SDWebImage的配置文件.正如compat的定义,该配置文件主要是兼容Apple的其他设备.也许我们真实的开发平台只有一个,但考虑各个平台的兼容性,对于框架有着很重要的 ...
SDWebImage源码解读_之SDWebImageDecoder
第四篇前言首先,我们要弄明白一个问题? 为什么要对UIImage进行解码呢?难道不能直接使用吗? 其实不解码也是可以使用的,假如说我们通过imageNamed:来加载image,系统默认会在主线程 ...
SDWebImage源码解读之SDWebImageCache(上)
第五篇前言本篇主要讲解图片缓存类的知识,虽然只涉及了图片方面的缓存的设计,但思想同样适用于别的方面的设计.在架构上来说,缓存算是存储设计的一部分.我们把各种不同的存储内容按照功能进行切割后,图片缓 ...
SDWebImage源码解读之SDWebImageCache(下)
第六篇前言我们在SDWebImageCache(上)中了解了这个缓存类大概的功能是什么?那么接下来就要看看这些功能是如何实现的? 再次强调,不管是图片的缓存还是其他各种不同形式的缓存,在原理上都极 ...
AFNetworking 3.0 源码解读总结（干货）（下）
承接上一篇AFNetworking 3.0 源码解读总结(干货)(上) 21.网络服务类型NSURLRequestNetworkServiceType 示例代码: typedef NS_ENUM(N ...
AFNetworking 3.0 源码解读总结（干货）（上）
养成记笔记的习惯,对于一个软件工程师来说,我觉得很重要.记得在知乎上看到过一个问题,说是人类最大的缺点是什么?我个人觉得记忆算是一个缺点.它就像时间一样,会自己消散. 前言终于写完了 AFNetwo ...

随机推荐

网关 apache APISIX
网关 apache - 国内版 Binghttps://cn.bing.com/search?q=%E7%BD%91%E5%85%B3+apache&qs=n&form=QBRE&am ...
Tomcat redis session manager connect redis show： ERR Client sent AUTH, but no password is set
解决问题redis问题:ERR Client sent AUTH, but no password is set - 东篱煮酒 - 博客园https://www.cnblogs.com/niepeis ...
esxi上为基于LVM的centos7的根目录扩容
概念:据说默认centos都是基于LVM的 LVM:LVM是逻辑盘卷管理(Logical Volume Manager)的简称,它是Linux环境下对磁盘分区进行管理的一种机制. LVM 更加详细的说 ...
Flutter之BLOC
flutter_bloc 是一个bloc第三方库,这个库很方便的让你集成bloc模式,这个库结合了RXDart,先了解一下bloc 的模式吧 1,widget 触发event 事件 2,bloc 接收 ...
ISO/IEC 9899:2011 条款6.8——语句和语句块
6.8 语句和语句块语法 1.statement: labeled-statement compound-statement expression-statement ...
深度学习：21天实战caffe学习资源-4-环境安装
使用anaconda3环境下的python2.7, 机器macos mojave 10.14 1.安装Xcode 首先现在app store中安装Xcode: 不然会有” framework not ...
Spring cloud微服务安全实战-6-6jwt改造之日志及错误处理（2）
第一次请求失败了打印出了403,第二次更新成功现在只处理了403这种情况,还有一种情况就是401,就是当前用户需要做身份认证,你没有做身份认证. 401的处理与403类似,也是在这里配置.Ent ...
Egret中图片颜色的改变，颜色矩阵
参考: 图片处理:颜色矩阵和坐标变换矩阵 Egret-滤镜之前面试有问到如何改变图片的颜色.貌似之前做Flash的时候做过,做Egret后没有此类需求,所以一直没有研究过. 现在来弄一弄如何改变图片 ...
Egret的第三方库制作，以及在大型项目中的应用
目录: 一创建第三方库二 TypeScript库三 JavaScript库四第三方库制作在大型RPG中的实际应用参考: 第三方库的使用方法目标: 本文目的是将现有游戏的框架制作成第三方库 ...
条件概率和链式法则 conditional probability & chain rule
顾名思义, 条件概率指的是某个事件在给定其他条件时发生的概率, 这个非常符合人的认知:我们通常就是在已知一定的信息(条件)情况下, 去估计某个事件可能发生的概率. 概率论中,用 | 表示条件, 条件概 ...

DeepID_V2解读

DeepID_V2解读的更多相关文章

随机推荐

热门专题