FaceNet---深度学习与人脸识别的二次结合

今天我给大家带来一篇来自谷歌的文章，众所周知，谷歌是全世界最有情怀，最讲究技术的公司，比我们天朝的莆田广告商良心多了。还有就是前段时间的最强大脑，莆田广告商的那个小机器，也就忽悠忽悠行外人了，懂的人深深知道。感觉自己就是黑子，当然，最强大脑节目组本身就是演员。

传统的进行人脸识别的模型一般都是这样：

但是现在我们要换个思路了，facenet直接学习图像到欧式空间上的映射，那么如果两张图片在欧式空间的距离很近，是不是说明就是很相似？如果离得远就不相似，也就不是同一个人？

下面的图详细的说明了，具体过程。

你看如果是一个人的照片，他们的距离就会低于这个阀值，此处应该是1.05左右。这个有点类似于LDA的思想了。类内的距离就小，类间的距离就大，其实本质上并没有什么差别。

Facenet的结构如下图：

前面就是一个传统的卷积神经网络，然后在求L₂范数之前进行归一化，就建立了这个嵌入空间，最后的损失函数，就是本文的最大亮点。

Triplet loss三重损失函数：以前我们的损失函数一般都是一个的，或者是两个的。这里弄三个，结构图如下：

我来带大家理解这个结构图。现在我们有一个样本名字叫anchor，还有两个样本名字叫positive,另外一个叫Negative。一开始啊，我们都以为这个三个人是亲兄弟，但是呢Negative一个是隔壁老王的，而且这个人和我们的Anchor关系很好，这不行，这是仇人的孩子，我们得让这两个人远离，于是我们就让神经网络学习，让positive和anchor近一点，让Negative滚蛋。（当然例子可能取的不恰当，还请见谅，哈哈）

课外补充：在高维或者无穷维中，距离的度量没有意义的，因为他们都在一个超球面上，你又如何度量他们的远近呢（这就是为什么不能直接用KNN分类的原因，他在处理高维数据就玩不转了），所以我们才要用深度卷积神经网络进行训练啊，至于其中的原理，神经网络就是一个黑匣子，我不懂啊，鬼知道他是怎么玩的。

记住下面的所有数据都是经过归一化的，没有经过归一化求距离就是胡扯！

，和分别代表三个不同的样本，我们一定想要：

这个是我们前面所说的参数。

那么我们的优化函数就出来了：

优化问题解决：

但是呢，知道这些还不够，为什么呢，一个算法的优劣，还要通过他的时间复杂度来判断，这里一定要确保他的收敛速度。

那么我们怎做呢，其实也很简单，假设给你一个anchor，我们找一个positive就要在这一类中找到一个最难分类的，什么样叫最难分类呢，就是在欧式空间距离最远的那个，但是属于一类，这叫hard_positive,另外找nepositive那就找最近的，这样不就完美解决了么。当然在找nepositive很容易产生局部最优，所以我们要满足：。这叫semi-hard，防止找到他一类里了。

本文的CNN结构：

一种是来自M. D. Zeiler and R. Fergus. Visualizing and understanding convolutional networks. CoRR, abs/1311.2901, 2013. 2, 4, 6。

结构：

另一种来自：C. Szegedy, W. Liu, Y. Jia, P. Sermanet, S. Reed,D. Anguelov, D. Erhan, V. Vanhoucke,and A. Rabinovich.Going deeper with convolutions. CoRR, abs/1409.4842,2014. 2, 4, 5, 6, 9

结构：

结果在LFW上正确率很高，在这里我就不说了。

论文：FaceNet: A Unified Embedding for Face Recognition and Clustering

FaceNet---深度学习与人脸识别的二次结合的更多相关文章

基于深度学习的人脸识别系统（Caffe+OpenCV+Dlib）【二】人脸预处理
前言基于深度学习的人脸识别系统,一共用到了5个开源库:OpenCV(计算机视觉库).Caffe(深度学习库).Dlib(机器学习库).libfacedetection(人脸检测库).cudnn(gp ...
基于深度学习的人脸识别系统（Caffe+OpenCV+Dlib）【一】如何配置caffe属性表
前言基于深度学习的人脸识别系统,一共用到了5个开源库:OpenCV(计算机视觉库).Caffe(深度学习库).Dlib(机器学习库).libfacedetection(人脸检测库).cudnn(gp ...
基于深度学习的人脸识别系统（Caffe+OpenCV+Dlib）【三】VGG网络进行特征提取
前言基于深度学习的人脸识别系统,一共用到了5个开源库:OpenCV(计算机视觉库).Caffe(深度学习库).Dlib(机器学习库).libfacedetection(人脸检测库).cudnn(gp ...
基于深度学习的人脸识别系统系列（Caffe+OpenCV+Dlib）——【四】使用CUBLAS加速计算人脸向量的余弦距离
前言基于深度学习的人脸识别系统,一共用到了5个开源库:OpenCV(计算机视觉库).Caffe(深度学习库).Dlib(机器学习库).libfacedetection(人脸检测库).cudnn(gp ...
基于深度学习的人脸识别系统Win10 环境安装与配置（python+opencv+tensorflow）
一.需要下载的软件.环境及文件 (由于之前见识短浅,对Anaconda这个工具不了解,所以需要对安装过程做出改变:就是Python3.7.2的下载安装是可选的,因为Anaconda已经为我们解决Pyt ...
基于深度学习的人脸性别识别系统（含UI界面，Python代码）
摘要:人脸性别识别是人脸识别领域的一个热门方向,本文详细介绍基于深度学习的人脸性别识别系统,在介绍算法原理的同时,给出Python的实现代码以及PyQt的UI界面.在界面中可以选择人脸图片.视频进行检 ...
face recognition[翻译][深度学习理解人脸]
本文译自<Deep learning for understanding faces: Machines may be just as good, or better, than humans& ...
深度学习课程笔记（十二） Matrix Capsule
深度学习课程笔记(十二) Matrix Capsule with EM Routing 2018-02-02 21:21:09 Paper: https://openreview.net/pdf ...
【OCR技术系列之四】基于深度学习的文字识别（3755个汉字）
上一篇提到文字数据集的合成,现在我们手头上已经得到了3755个汉字(一级字库)的印刷体图像数据集,我们可以利用它们进行接下来的3755个汉字的识别系统的搭建.用深度学习做文字识别,用的网络当然是CNN ...

随机推荐

nmon在线安装及使用
安装 mkdir /usr/local/nmon cd /usr/local/nmon wget http://sourceforge.net/projects/nmon/files/nmon_lin ...
Strut、Spring、Hibernate如何实现资源整合（SSH）呢？
Strut.Spring.Hibernate如何实现资源整合(SSH)呢? 其实很简单,我们从Spring与Hibernate的整合中可以看出来,由Spring的配置文件来管理Hiberbate的配置 ...
JavaScript 扯几句单线程相关
JavaScript 扯几句单线程相关众所周知,Javascript是单线程执行的,这也就是说:JavaScript在同一个时间上只能处理一件事.他不像C,Java等这些多线程的,可以开不同的线程 ...
Web项目或WCF发布IIS后，如何通过VS2010调试
在做项目的时候,例如WCF服务一般都会将WCF服务承载于控制台应用程序,或者WinForm窗体应用程序,因为这样可以直接在服务代码上打断点,然后就可以调试了.但是项目已经发布了,当然这里我用的本机进行 ...
Ninja介绍
什么是Ninja 在Unix/Linux下通常使用Makefile来控制代码的编译,但是Makefile对于比较大的项目有时候会比较慢,看看上面那副漫画,代码在编译都变成了程序员放松的借口了.所以这个 ...
黑客常用的windows注册表大全
目录使系统没有"运行"选项 1让操作系统无"关闭系统" 选项 2让操作系统 ...
ssh配置文件及问题解决
一 ssh的配置文鉴模板 Host AAA User gitolite3 HostName IP地址 IdentityFile ~/.ssh/key 二下载代码的方法 1 ssh git2 git ...
Linux如何创建一个进程
关于准备知识: 每个进程都有以下属性: 1 地址空间每个进程都有自己的进程地址空间,格式大概是这个样子: 栈(Stack)以帧为单位,当程序调用函数(假如该函数名为fun01)时,stack会向下 ...
AngularJs中ng-controller下的函数在调用时为什么会执行两次？
最近在学习AngularJs的过程中,自己做了个demo,但程序运行后却发现有个地方运行不对劲,纠结了半天,也问了,也查了,但是没有一个满意的答案,所以特地贴出来,请教各位大神(先说声谢谢了!).为了 ...
Eclipse / Intellij Idea配置Git+Maven+Jetty开发环境
作者:鹿丸不会多项式出处:http://www.cnblogs.com/hechao123 转载请先与我联系. 最近公司给加配了Mac,本想着花一个小时的时间搭好开发环境,最后全部弄好却用了一上午 ...

FaceNet---深度学习与人脸识别的二次结合

FaceNet---深度学习与人脸识别的二次结合的更多相关文章

随机推荐

热门专题