Fine-Grained Head Pose Estimation Without Keypoints

简介

head pose estimation 经典论文，使用CNN预测三个角度值，pitch,yaw,roll,本文提出一种combined classification and regression方法，并且用了HopeNet，在BIWI、300W-LP和AFLW2000数据集上训练和测试，比使用landmark方法得到了提升，模型大小也不是特别大，能够实时。

网络结构

使用resnet作为backbone，分别全连接三个fc层，每个层单独预测。其中，fc层的全连接数是bin数，也就是将全部-99到+99一共199个数值每三个数分为一组，fc连接数就是66（实际上数据在超过这个范围的都剔除了，等于的剔除）。这个想法是借鉴了年龄识别的网络模型，先做分类，然后将分类的结果map到一个范围，这样精度会有大的提升。而且是multi-loss，分类的loss占比会影响梯度方向，从而会起到一个导向作用，引导回归往一个合适的方向，这是梯度方向上的引导。

对fc的结果做softmax，就把fc的值映射成了概率值，所有类别数据相加为1，映射成了概率就很方便能求出期望了，所以网络的输出又被映射到[0,99]这个区间范围内，然后乘以3减去99，这个区间范围就被映射到了[-99,+99]这个区间范围，也就是我们需要的回归。然后就是计算回归的loss，用的是mse loss。

与前面分类的loss（BCE LOSS）按照一定权重加权求和，然后对最终的loss梯度反向，就完成了整个过程。

他这个网络两个好处，一来是利用multi-loss来引导回归，而是利用分类的结果去映射到一个可以回归的区间范围，这样就把原本是回归问题的问题转化为了分类 + 回归的问题，后来也看了其他几篇文章，基本都是转化为分类 + 回归问题来解决的，感觉这篇算是鼻祖了吧。解决思路很有效果。

数据集和实验

数据集用的是BIWI和AFLW2000，300W-LP作者只探究了高低分辨率对结果的影响。

在BIWI数据集上，划分了训练集和测试集，使用MAE作为评估标准，对比了自己的方法、FAN和直接Dlib，以及3DFFA，自己的方法在不适用深度信息的使用是SOTA的，然后去AFLW2000数据集上划分训练集和测试集去评估，只跟Gu et al.使用了CNN和RNN训练的结果做了对比，也是SOTA。

我个人感觉这个结果说服力不是很强，我自己实验的时候发现其实很难训练，想要收敛很难，网络总是会朝着局部极小值点去逼近，很难训练到一个全局极小值，即网络总是输出一个类似均值值，使得局部最小。后面也试了很多方法，训练感觉都是挺难的。网络和方法看起来很简单，但是其实挺难拟合的。

[论文笔记] Fine-Grained Head Pose Estimation Without Keypoints的更多相关文章

论文笔记之：Optical Flow Estimation using a Spatial Pyramid Network
Optical Flow Estimation using a Spatial Pyramid Network spynet 本文将经典的 spatial-pyramid formulation ...
论文笔记: Mutual Learning to Adapt for Joint Human Parsing and Pose Estimation
Mutual Learning to Adapt for Joint Human Parsing and Pose Estimation 2018-11-03 09:58:58 Paper: http ...
论文笔记 Stacked Hourglass Networks for Human Pose Estimation
Stacked Hourglass Networks for Human Pose Estimation key words:人体姿态估计 Human Pose Estimation 给定单张RGB ...
[论文笔记] Improving Head Pose Estimation with a Combined Loss and Bounding Box Margin Adjustment
Improving Head Pose Estimation with a Combined Loss and Bounding Box Margin Adjustment 简介本文提出了一种网络结 ...
Towards Accurate Multi-person Pose Estimation in the Wild 论文阅读
论文概况论文名:Towards Accurate Multi-person Pose Estimation in the Wild 作者(第一作者)及单位:George Papandreou, 谷歌 ...
论文解读：3D Hand Shape and Pose Estimation from a Singl RGB Image
本文链接:https://blog.csdn.net/williamyi96/article/details/89207640由于最近做到了一些 3D Hand Pose Estimation 相关的 ...
论文阅读理解 - Stacked Hourglass Networks for Human Pose Estimation
http://blog.csdn.net/zziahgf/article/details/72732220 keywords 人体姿态估计 Human Pose Estimation 给定单张RGB图 ...
手势估计- Hand Pose Estimation
http://blog.csdn.net/myarrow/article/details/51933651 1. 目前进展 1.1 相关资料 1)HANDS CVPR 2016 2 ...
human pose estimation
2D Pose estimation主要面临的困难:遮挡.复杂背景.光照.真实世界的复杂姿态.人的尺度不一.拍摄角度不固定等. 单人姿态估计传统方法:基于Pictorial Structures, ...

随机推荐

学会这些 pycharm 编程小技巧，编程效率提升 10 倍
PyCharm 是一款非常强大的编写 python 代码的工具.掌握一些小技巧能成倍的提升写代码的效率,本篇介绍几个经常使用的小技巧. 一.分屏展示当你想同时看到多个文件的时候: 1.右击标签页: ...
Java中遍历Set集合的方法
对 set 的遍历 1.迭代遍历: Set<String> set = new HashSet<String>(); Iterator<String> it = s ...
Linux系统Tomcat进程使用shutdown无法关闭进程
问题场景: 若在应用中启动了用户线程,在Linux系统Tomcat进程使用shutdown无法关闭进程. 解决方案: #1.在catalina.sh文件中添加CATALINA_PID [root@lo ...
Django的MTV模型
MTV模型 Django框架的设计模式借鉴了MVC框架的思想,也是分成三部分,来降低各个部分之间的耦合性. MTV框架是Django的框架,三部分为: Model Template(模板) View ...
索尼展示基于MicroLED技术的16K显示屏：约780吋
尽管 8K 彩电刚刚在消费级市场崭露头角,更极致的 16K 却已不慌不忙地登场了. 在日前于拉斯维加斯举办的 NAB 2019 展会上,索尼就秀出了旗下的 16K 显示设备,它目前正在日本横滨的资生堂 ...
FPGA开发时钟资源评估需要考虑的问题
在第一个独立开发的FPGA项目中,使用了Altera平台的三速以太网IP,工作在100M模式下,外部输入的PHY时钟频率为25MHz. 由于在前期没有注意这个外部输入的时钟,导致最后不得不在板子上飞线 ...
索引介绍，转载自：https://tech.meituan.com/2014/06/30/mysql-index.html
索引原理除了词典,生活中随处可见索引的例子,如火车站的车次表.图书的目录等.它们的原理都是一样的,通过不断的缩小想要获得数据的范围来筛选出最终想要的结果,同时把随机的事件变成顺序的事件,也就是我们总 ...
第05课：GDB常用命令详解（中）
本科核心内容: info和thread命令 next.step.util.finish和return命令 5.1info和thread命令在前面使用info break命令查看当前断点时介绍过,in ...
java高并发核心要点|系列3|锁的底层实现原理|ABA问题
继续讲CAS算法,上篇文章我们知道,CAS算法底层实现,是通过CPU的原子指令来实现. 那么这里又有一个情景: 话说,有一个线程one从内存位置V中取出A,这时候另一个线程two也从内存中取出A,并且 ...
PHP三种字符串界定符的区别（单引号，双引号，<<<）
单引号,双引号,<<<的区别如下: 前续:今天突然遇到了<<<EOT,可在运行的时候出错了,所以就度娘了下. 1.单引号:’a string’ \’是唯一的转 ...

[论文笔记] Fine-Grained Head Pose Estimation Without Keypoints

Fine-Grained Head Pose Estimation Without Keypoints

简介

网络结构

数据集和实验

[论文笔记] Fine-Grained Head Pose Estimation Without Keypoints的更多相关文章

随机推荐

热门专题