1. Abstract

现实世界中的人脸很多时候都存在遮挡以及大的形状变化,而目前的人脸关键点检测方法在这种情况下表现欠佳,
因为它们未能提供一种系统的方法来处理异常。因而authors提出一种新的方法--稳健级联姿态回归(RCPR),这
是基于姿态级联回归(CPR)方法的改进。此方法在数据集LFW、LFPW、HELEN以及COFW(作者引入的数据集)
上表现比state-of-the-art 方法要好。大约能够降低一半的错误率;在检测人脸遮挡部分的precision/recall 为80/40%。

2. Introduction

CPR方法在人脸关键点检测中表现高效,但在遮挡以及较大形状变化的情况下有所欠缺。RCPR方法在现实世界中
表现稳健,在估计关键点位置的同时能够检测出人脸的遮挡区域。因为遮挡信息在学习选择未遮挡区特征期间能够
起到作用,并且可以被动态地利用(通过稳健统计量)从而在级联中减小误差,

主要contributions

(1) 提出RCPR方法,对差的初始值、大的形状变化和遮挡稳健。第一个方法既能检测遮挡又能同时估计关键位置

(2) 引入新的数据集COFW,数据集中的人脸包含遮挡以及大的形状变化,比较接近现实情况。

3. Related work

shape 估计模型:

(1)ASM、AAM :泛化能力差、训练慢,现实条件下表现差
(2)modern 方法:先检测出目标,再估计位置 ;准确率较低
(3)回归方法(RCP):直接预测目标的shape;boosted regression + random fern regressors

4. Method

4.1 CPR

在CPR的基础上进行改进,从而使得RCPR对遮挡以及大的形状变化稳健。
用CPR估计shape:$ S_p = [x_p,y_p],p = 1,2,...,P;$ 表示P个关键点的位置坐标
CPR由T个回归器 \(R^{1...T}\) 级联组成。先初始化 \(S^0\) ,然后逐步估计,最后输出 \(S^T\) 。


输入:Image I, initial guess \(S^0\) , regressors $ R^{1...T}$ ,shape-indexed features $ h^{1...T}$
for t = 1 to T do
//compute shape-indexed features(提取特征)
$x^t = h^t(S^{t-1},I) $
// evaluate regressor(用回归器估计update $ \delta $S)
$ \delta $S = $ S^{t-1} $ + $ \delta $S
end
输出:final estimation $ S^T$


回归器$ R^t$ 的训练使得真实的shape与当前估计值\(S^{t-1}\)之间的差异最小
CPR具体的想法可以参考https://pdollar.github.io/files/papers/DollarCVPR10pose.pdf

RCPR

对遮挡稳健

ground-truth 标记

把数据集中人脸的关键点标记成0-1,分别表示遮挡与未遮挡(训练过程中当作连续变量,最后利用PR曲线选取阈值二值化)

occlusion-centered approach

这个方法对$\delta $S 的估计稳健
把人脸分成3x3 一共9个区域,每个小区域具有特定的遮挡比例。然后训练 \(S_{tot}\)个回归器,保证它们"visually different",
最后根据遮挡比例对回归器进行加权估计Shape的更新量

对形状变化稳健

Interpolated shape-indexed features

在进行shape 估计时对遮挡形状变化比较稳健,并且速度快.

smart restarts

CPR是依赖初值的选取。 给定原始图像和不同的初始值,先用10%的级联回归器回归,然后比较差异性,若小于阈值,
再继续用剩下的90%回归器估计。否则重新初始化。实验 证明如此效果高效,通过交叉验证设置阈值为0.15

5. Experiments & results

在三个数据集(LFW、LFPW、HELEN)上比较实验结果。RCPR只用feature + restart
在引入数据集(COFW)上测试效果。

结果图如下:

6. Conclusion

RCPR能够检测遮挡的同时估计关键点的位置。并且在有遮挡、形状有较大变化的情况下稳健。

7. References

[1] Xavier P. Burgos-Artizzu,Pietro Perona,and Piotr Dollar .Robust face landmark estimation under occlusion.In ICCV,2013
https://ieeexplore.ieee.org/document/6751298/

论文笔记 Robust face landmark estimation under occlusion的更多相关文章

  1. [论文笔记] Fine-Grained Head Pose Estimation Without Keypoints

    Fine-Grained Head Pose Estimation Without Keypoints 简介 head pose estimation 经典论文,使用CNN预测三个角度值,pitch, ...

  2. [论文笔记] Improving Head Pose Estimation with a Combined Loss and Bounding Box Margin Adjustment

    Improving Head Pose Estimation with a Combined Loss and Bounding Box Margin Adjustment 简介 本文提出了一种网络结 ...

  3. 【论文阅读】Wing Loss for Robust Facial Landmark Localisation with Convolutional Neural Networks

    Wing Loss for Robust Facial Landmark Localisation with Convolutional Neural Networks 参考 1. 人脸关键点: 2. ...

  4. 论文笔记系列-Neural Network Search :A Survey

    论文笔记系列-Neural Network Search :A Survey 论文 笔记 NAS automl survey review reinforcement learning Bayesia ...

  5. Video Frame Synthesis using Deep Voxel Flow 论文笔记

    Video Frame Synthesis using Deep Voxel Flow 论文笔记 arXiv 摘要:本文解决了模拟新的视频帧的问题,要么是现有视频帧之间的插值,要么是紧跟着他们的探索. ...

  6. Deep Reinforcement Learning for Visual Object Tracking in Videos 论文笔记

    Deep Reinforcement Learning for Visual Object Tracking in Videos 论文笔记 arXiv 摘要:本文提出了一种 DRL 算法进行单目标跟踪 ...

  7. 【论文笔记系列】AutoML:A Survey of State-of-the-art (下)

    [论文笔记系列]AutoML:A Survey of State-of-the-art (上) 上一篇文章介绍了Data preparation,Feature Engineering,Model S ...

  8. Deep Learning论文笔记之(四)CNN卷积神经网络推导和实现(转)

    Deep Learning论文笔记之(四)CNN卷积神经网络推导和实现 zouxy09@qq.com http://blog.csdn.net/zouxy09          自己平时看了一些论文, ...

  9. 论文笔记之:Visual Tracking with Fully Convolutional Networks

    论文笔记之:Visual Tracking with Fully Convolutional Networks ICCV 2015  CUHK 本文利用 FCN 来做跟踪问题,但开篇就提到并非将其看做 ...

随机推荐

  1. span与a元素的键盘聚焦性以及键盘点击性研究——张鑫旭

    一.众所周知的与不为所知的 我们平时涉及点击交互事件的时候,都是使用的a元素或者button元素,原因是可以相应键盘focus效果以及回车触发点击事件,这是众所周知的. 但是,可能存在一些特殊情况,我 ...

  2. 小tip: base64:URL背景图片与web页面性能优化——张鑫旭

    一.base64百科 Base64是网络上最常见的用于传输8Bit字节代码的编码方式之一,可用于在HTTP环境下传递较长的标识信息. 某人: 唉,我彻底废柴了,为何上面明明是中文,洒家却看不懂嘞,为什 ...

  3. git push远程仓库时报错:fatal: remote origin already exists. (已解决)

    在做远程仓库调试阶段,突然发现修改后的项目无法push了: 如果输入$ git remote add origin git@github.com:djqiang(github帐号名)/gitdemo( ...

  4. ASP.NET SignalR-B.S/C.S 相互打通DEMO

    ASP .NET SignalR 是一个ASP .NET 下的类库,可以在ASP .NET 的Web项目中实现实时通信.   什么是实时通信的Web呢?就是让客户端(Web页面)和服务器端可以互相通知 ...

  5. Ubuntu-16.04-Desktop +Hadoop2.7.5+Eclipse-Neon的云计算开发环境的搭建(伪分布式方式)

    主控终端 主机名 ubuntuhadoop.smartmap.com IP 192.168.1.60 Subnet mask 255.255.255.0 Gateway 192.168.1.1 DNS ...

  6. the cause of StringBuild class

    如果我们对字符串进行拼接操作,每次拼接,都会创建一个新的String对象,既耗时,又浪费空间,而StringBuild类可以解决这个问题. 那么StringBuild类是如果解决的呢? 因为Strin ...

  7. angularjs初识ng-app、ng-model、ng-repeat指令

    ng-app属性是angular.js的标志语句,它标记了angular.js的作用域.ng-app可以添加在很多地方,像上面那样添加到html标签上,说明angular脚本对整个页面都起作用.也可以 ...

  8. 转 Js窗体window大小设置

    网页可见区域宽:document.body.clientWidth  网页可见区域高:document.body.clientHeight  网页可见区域宽:document.body.offsetW ...

  9. react实例:理解dva构建项目的原理

    请点击相应的步骤查看详情 我们首先搭建一个 dva Demo  项目(请参考react快速构建一个应用项目),然后逐步完成以下内容: 结构划分 设计 Model 组件设计方法 组件设计实践 添加 Re ...

  10. JavaScript运行机制的学习

    今天在偶然在网上看到一个JavaScript的面试题,尝试着看了一下,很正常的就做错了,然后给我们前端做,哈哈,他居然也顺理成章做的错了,代码大概是这样的 /*1 下面代码会怎样执行?执行结果是什么* ...