"Regressing Robust and Discriminative 3D Morphable Models with a very Deep Neural Network" 解读

简介：这是一篇17年的CVPR,作者提出使用现有的人脸识别深度神经网络Resnet101来得到一个具有鲁棒性的人脸模型。

原文链接：https://www.researchgate.net/publication/311668561_Regressing_Robust_and_Discriminative_3D_Morphable_Models_with_a_very_Deep_Neural_Network

摘要

　　主要说了两个部分：第一部分，三维人脸模型还没有广泛应用到人脸识别等领域，主要原因是同一个对象的不同照片生成的人脸模型差异较大，也就是不够鲁棒；或者不同对象生成的人脸模型又太接近，也就是人脸模型太泛化，没有区分度。第二部分，就是作者的主要贡献，其一是解决了训练数据匮乏的问题，其二，用CNN做三维人脸重建，提高了人脸识别的准确率。

介绍

　　主要还是围绕前面提到的两个问题，一是人脸模型没有区分度，二是人脸模型不够鲁棒。

　　如图所示，3DDFA得到的就是一张大众脸，没有特色，作者的方法就比较接近潘大大了。

　　针对上述问题，作者就说了，我们能解决上面的两个问题。我们用一个深度卷积神经网络去回归3DMM形状参数(Note:只是形状!),然后就可以得到3维人脸形状了，至于纹理参数是直接从照片中得来的，这不是作者关注的重点。另外，作者还解决了训练数据集不够的问题，用多张照片去生成3维人脸模型，作为Ground Truth，这个后面会提到。

相关工作

　　此处略去n个字~，论文里阐述了以往做3维人脸建模的一些方法。一句话总结：俱往矣~。

Regressing 3DMM parameters with a CNN

　　作者认为，之前没有将CNN用在三维人脸建模方面，主要是因为从二维图像重建三维人脸模型，我们需要回归高维的形状参数，这就要求非常深的网络，而训练非常深的网络又需要大量的训练数据，很尴尬，已知的三维人脸模型的训练集小的可怜。那怎么办呢？追古溯今，作者淘到了一个好方法，利用一个对象的多姿态人脸图片可以生成准确率相当高的三维人脸形状[30]，然后把生成的模型作为训练集，ko一个问题；那鲁棒性和区别性的人脸形状怎么解决呢？借鉴二维空间中的深度卷积神经网络模型，而且模型还是现成的~。

Generating training data

　　首先，利用中科院的CASIA WebFace dataset，借鉴[30]的方法。500k的单张图片，每一个都估计一个3DMM,后续还会继续进行处理。估计方法如下：

利用BFM，使用Vetter等人的三维人脸重建公式:

　　参数说明请看原文，我们要求的其实就是α和β。对[8][33]的方法做了一点改变，给定一张图片，用他们的方法可以得到一个近似的形状参数α^*和纹理参数β^*，这里作者用了CLNF来做人脸检测，得到68个人脸关键点，求得该张图片的置信度(后面会用到)，将得到的关键点用来初始化估计人脸模型的姿态，该姿态用六个自由度表示：

　　然后再优化3DMM的形状，纹理，姿态，光照和颜色，利用[33]的方法解决定位误差。一旦损失函数收敛，就得到的形状参数和纹理参数，这就是图像I得到的3DMM估计，虽然这个过程计算量大，但它只是用在生成数据中，不会影响算法效率。

　　根据最近的工作[30]，我们将每个对象的多个3DMM(包含形状和纹理)估计进行池化，也就是每个对象的多张照片对应得到的3DMM估计，进行加权求和，最后一个对象只有一个3DMM估计，池化公式如下：

ω_i是前面CLNF求到的置信度。

Learning to regress pooled 3DMM

　　上一个步骤结束之后，一个对象会有多个不同角度的照片，但只有一个3DMM估计。现在我们要用这些数据去学习一个函数，使同一个对象的不同照片得到的3DMM特征向量是相同的。为此，我们引入了一个深度神经网络ResNet,修改了它的最后一层全连接层，使输出为198维的3DMM特征向量γ，用池化的3DMM估计作为真实标注，让网络去学习。

The asymmetric Euclidean loss

　　由构造函数可知，3DMM向量属于多元高斯分布，均值在原点处，代表了均值人脸，就是那个人脸形状和纹理重建公式，因此，在训练期间，如果使用标准的欧拉损失函数来最小化距离，会使得到的人脸模型太泛化，没有区别性。

　　作者就提出了一个非对称欧拉损失，使模型学习到更多的细节特征，使三维人脸模型具有更多的区别性，公式如下：

效果还不错：

Network hyperparameters

　　就是介绍一下训练的时候，一些超参数的设置，具体参看原文。下面这个图是对整个流程的总结，分三个部分，每一部分，上面都已经做了解释：

Discussion: Render-free 3DMM estimator

　　3DMM参数直接通过对输入图像的回归得到，没有进行纹理渲染的优化，我们主要是得到准确的形状，因此在估计3DMM时也更快。

Parameter based 3D-3D recognition

　　对得到的3维人脸模型进行评价，看它是否是属于同一个对象。

3D-3D recognition with a single image(???)

　　用3DMM参数γ_p作为人脸特征的描述子。因为不同的关键点常常表示不同的人脸外观，应用PCA方法，从上面的训练数据集(得到68个关键点的那个)中学习，使估计的参数接近人脸关键点。最后用余弦相似度量判断两个人脸三维模型是否相似。（没搞懂，还望指教。。。）

3D-3D recognition with multiple-image

　　对于多图像，首先使用上面的等式2对3DMM参数进行池化，此时权重都是相等的。对于每个对象的视频，我们会池化得到一个3DMM,然后他们的多张图像，也是池化得到一个3DMM,再对这些3DMM进行一次池化，反正最后一个对象，一个3DMM。

Face alignment

　　作者说了，我们就用了二维图像的人脸标准框，其他的特征点检测，人脸对齐都没用。但我们方法对未对齐的人脸也很鲁棒？？，也很省时。。。

Experimental results

　　自由发挥了，溜了~~~

初来乍到，还望各位大佬多多指教！

参考：

知乎：https://zhuanlan.zhihu.com/p/24316690

[30]M. Piotraschke and V. Blanz. Automated 3D face reconstruction from multiple images using quality measures. In Proc. Conf. Comput. Vision Pattern Recognition, June 2016.

[33]S. Romdhani and T. Vetter. Estimating 3D shape and texture using pixel intensity, edges, specular highlights, texture constraints and a prior. In Proc. Conf. Comput. Vision Pattern Recognition, volume 2, pages 986–993, 2005.

[8]V. Blanz and T. Vetter. Face recognition based on fitting a 3d morphable model. Trans. Pattern Anal. Mach. Intell., 25(9):1063–1074, Sept 2003.

"Regressing Robust and Discriminative 3D Morphable Models with a very Deep Neural Network" 解读的更多相关文章

PP: Robust Anomaly Detection for Multivariate Time Series through Stochastic Recurrent Neural Network
PROBLEM: OmniAnomaly multivariate time series anomaly detection + unsupervised 主体思想: input: multivar ...
A Bayesian Approach to Deep Neural Network Adaptation with Applications to Robust Automatic Speech Recognition
基于贝叶斯的深度神经网络自适应及其在鲁棒自动语音识别中的应用直接贝叶斯DNN自适应使用高斯先验对DNN进行MAP自适应为何贝叶斯在模型自适应中很有用? 因为自适应问题可以视为后验估计问题 ...
论文阅读笔记六十四: Architectures for deep neural network based acoustic models defined over windowed speech waveforms(INTERSPEECH 2015)
论文原址:https://pdfs.semanticscholar.org/eeb7/c037e6685923c76cafc0a14c5e4b00bcf475.pdf 摘要本文研究了利用深度神经网络 ...
论文阅读 | Towards a Robust Deep Neural Network in Text Domain A Survey
摘要这篇文章主要总结文本中的对抗样本,包括器中的攻击方法和防御方法,比较它们的优缺点. 最后给出这个领域的挑战和发展方向. 1 介绍对抗样本有两个核心:一是扰动足够小:二是可以成功欺骗网络. 所有 ...
泡泡一分钟：Robust and Fast 3D Scan Alignment Using Mutual Information
Robust and Fast 3D Scan Alignment Using Mutual Information 使用互信息进行稳健快速的三维扫描对准 https://arxiv.org/pdf/ ...
【NLP】Recurrent Neural Network and Language Models
0. Overview What is language models? A time series prediction problem. It assigns a probility to a s ...
Exploring Architectural Ingredients of Adversarially Robust Deep Neural Networks
目录概主要内容深度宽度代码 Huang H., Wang Y., Erfani S., Gu Q., Bailey J. and Ma X. Exploring architectural ...
[Box] Robust Training and Initialization of Deep Neural Networks: An Adaptive Basis Viewpoint
目录概主要内容 LSGD Box 初始化 Box for Resnet 代码 Cyr E C, Gulian M, Patel R G, et al. Robust Training and In ...
IRGAN：A Minimax Game for Unifying Generative and Discriminative Information Retrieval Models
https://arxiv.org/pdf/1705.10513.pdf 论文阅读笔记: https://www.cnblogs.com/liaohuiqiang/p/9694277.html htt ...

随机推荐

怎样使用 virt-viewer 远程访问 qemu 虚拟机 - 转载
How to connect to a VM hosted on QEMU remotely using virt-viewer I couldn’t find comprehensive artic ...
struct与class区别联系（转）
传送门:struct与class区别联系注意C中的struct和C++中的struct是不一样的,c中的struct比较原生,仅仅是将一些属性封装起来构成一个整体,没有OO的相关特性.而c++中的s ...
json 压缩中文不转码
$testJSON=array('name'=>'中文字符串','value'=>'test'); echo json_encode($testJSON, JSON_UNESCAPED_U ...
WorldWind源码剖析系列：下载请求类DownloadRequest
下载请求类DownloadRequest是各种下载请求的抽象基类,先派生出网络下载请求类WebDownloadRequest,再派生出地理空间下载请求类GeoSpatialDownloadReques ...
JAVA框架 Spring 和Mybatis整合（传统dao）
一:我们使用spring处理service,mybaits处理dao层. 二:导入jar包 pom.xml文件内容: <?xml version="1.0" encoding ...
使用Tortoise结合Git比较两个版本的差异
1.右键项目,TortoiseGit -------> Diff with previous version 2.单击出分支选择弹窗,进行选择要比较的两个分支 3.比较同个分支的两个不同的版本 ...
nodeSelector + deamonset
DaemonSet 配置文件的语法和结构与 Deployment 几乎完全一样,只是将 kind 设为 DaemonSet. 选择运行节点:当指定.spec.template.spec.nodeSel ...
[HEOI2012]采花 BZOJ2743
分析: 听说主席树和莫队可以做,前者不想写,后者我不会... 我们考虑将询问离线,按照左端点排序,之后先处理好从1开始选的答案,之后枚举从1到n,之后依次删除nxt[i],添加nxt[nxt[i]], ...
线程池原理及python实现
为什么需要线程池目前的大多数网络服务器,包括Web服务器.Email服务器以及数据库服务器等都具有一个共同点,就是单位时间内必须处理数目巨大的连接请求,但处理时间却相对较短. 传统多线程方案中我们采 ...
20155234 昝昕明《网络对抗技术》实验一 PC平台逆向破解
实践内容: 手工修改可执行文件,改变程序执行流程,直接跳转到getShell函数. 利用foo函数的Bof漏洞,构造一个攻击输入字符串,覆盖返回地址,触发getShell函数. 注入一个自己制作的sh ...

"Regressing Robust and Discriminative 3D Morphable Models with a very Deep Neural Network" 解读

"Regressing Robust and Discriminative 3D Morphable Models with a very Deep Neural Network" 解读的更多相关文章

随机推荐

热门专题