对Joint Training of Cascaded CNN for Face Detection一文的几点疑惑

最近读了Joint Training of Cascaded CNN for Face Detection这篇论文，论文中把之前人脸检测使用到的cascade cnn，从分开训练的模式，改为了联合训练，并且声称得到了更好的结果。

但是在我读论文的过程中，产生了下面几点疑惑：

1.论文4.2节的Training procedure这部分最后提到，To make it converge easily, we train seperate networks and initialize the joint network with trained weights. 说明联合网络利用了分别训练的模型作为初始权重。这相当于把之前的cascade cnn又训练了一遍，然后再初始化joint network，训练步骤其实比之前的cascade cnn更复杂了，而且在分别训练各个网络时，采用了怎样的配置参数，以及训练的目标，均未提及。

2.论文6.3节中提及该方法在FDDB上测试结果，在false positives=1000 时recall是88.2%，而之前的cascade cnn是85.7%。但是我在FDDB网站上查阅到的CascadeCNN的结果是，false positives=167时recall是0.856701，CascadeCNN提供的测试结果，并没有false positives=1000的数据。不知道这个85.7%是如何获得的。

3.2016年上半年有一篇论文Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks，也是利用了类似于CascadeCNN的结构，在FDDB上性能比CascadeCNN好很多（论文的方法是检测和对齐同时做，但是也提供了只做检测不做对齐的ROC曲线），而且比这批论文的结果还要好，不知道为何选择性忽视这篇论文。

4.在网上看到一篇报道，该论文中的算法在单核cpu上可以跑到几百fps，但是论文里面还仅仅是10fps，一下提高了几十倍的速度，真的是很神奇，不知道是如何在这么短时间内做到的。

上面就是我的几点疑问，还希望各位高手不吝赐教。

参考文献和网站：

1.http://www.thinkface.cn/thread-4651-1-1.html

2.http://vis-www.cs.umass.edu/fddb/results.html

3.http://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Qin_Joint_Training_of_CVPR_2016_paper.pdf

4.http://arxiv.org/pdf/1604.02878

对Joint Training of Cascaded CNN for Face Detection一文的几点疑惑的更多相关文章

利用CNN进行多分类的文档分类
# coding: utf-8 import tensorflow as tf class TCNNConfig(object): """CNN配置参数"&qu ...
2016CVPR论文集
http://www.cv-foundation.org/openaccess/CVPR2016.py ORAL SESSION Image Captioning and Question Answe ...
CVPR2016 Paper list
CVPR2016 Paper list ORAL SESSIONImage Captioning and Question Answering Monday, June 27th, 9:00AM - ...
目标检测（六）YOLOv2__YOLO9000: Better, Faster, Stronger
项目链接 Abstract 在该论文中,作者首先介绍了对YOLOv1检测系统的各种改进措施.改进后得到的模型被称为YOLOv2,它使用了一种新颖的多尺度训练方法,使得模型可以在不同尺寸的输入上运行,并 ...
Faster R-CNN改进篇（一）： ION ● HyperNet ● MS CNN
一. 源起于Faster 深度学习于目标检测的里程碑成果,来自于这篇论文: Ren, Shaoqing, et al. "Faster R-CNN: Towards real-time ob ...
[转] Implementing a CNN for Text Classification in TensorFlow
Github上的一个开源项目,文档讲得极清晰 Github - https://github.com/dennybritz/cnn-text-classification-tf 原文- http:// ...
CNN autoencoder 进行异常检测——TODO，使用keras进行测试
https://sefiks.com/2018/03/23/convolutional-autoencoder-clustering-images-with-neural-networks/ http ...
face recognition[MobiFace]
本文来自<MobiFace: A Lightweight Deep Learning Face Recognition on Mobile Devices>,时间线为2018年11月.是作 ...
cvpr2015papers
@http://www-cs-faculty.stanford.edu/people/karpathy/cvpr2015papers/ CVPR 2015 papers (in nicer forma ...

随机推荐

转：C# DataGridView控件清空数据出错解决方法
C# DataGridView控件绑定数据后清空数据在清除DataGridview的数据时: 1.DataSource为NULL(DataGridView.DataSource= null;)这样会将 ...
VR设备
我本来想亲自介绍下我最近特别感兴趣的VR(虚拟现实)设备,但我发现我不会插入图片,所以我只好特意去找了一篇介绍虚拟现实现状设备的文章. 虚拟现实现状设备篇:http://www.cnblogs.com ...
03-Vue入门系列之Vue列表渲染及条件渲染实战
3.1. 条件渲染有时候我们要根据数据的情况,决定标签是否进行显示或者有其他动作.最常见的就是,表格渲染的时候,如果表格没有数据,就显示无数据.如果有数据就显示表格数据. Vue帮我们提供了一个v- ...
JUnit 测试
Junit 使用 1.忽略测试方法.在使用@Test的方法上使用@Ignore,将不会对此方法进行测试 2.测试套件解决的问题: 1.对测试类进行统一测试,而不必在单独测试类上一个一个进行测试. 使 ...
SharePoint 2013 REST 以及 OData 基础
这篇文章会介绍: 简单的介绍REST,OData OData实现细节 OData在SharePoint 2013中的实现为什么REST很重要过去几年基于REST的webservice在IT企业越来 ...
atitit.web 推送实现方案集合
atitit.web 推送实现方案集合 1. 俩中模式 Push/Pull 1 2. 需要实现的特性 2 2.1. 推送消息广播. 2 2.2. 推送定向消息. 2 2.3. 提供连接上线前.上线.下 ...
iOS开发-UITableView顶部图片下拉放大
关于顶部图片下拉放大,在用户展示的个人中心显示用户个人头像信息,设置UITableView的headerView实现,UITableView继承自UIScrollView,同样的设置UIScrollV ...
iOS-网络请求-AFN升级至AFN3.0
AFNetworking是一款在OS X和iOS下都令人喜爱的网络库.为了迎合iOS新版本的升级, AFNetworking在3.0版本中删除了基于 NSURLConnection API的所有支持. ...
python Request库
命令行查看版本:python --version pip --version pip常用命令// 安装包pip install xxx// 升级包pip install -U xxx// 卸载包pip ...
HTML5 <a>标签的ping属性用法
随着移动互联网用户井喷式的增长,web前端开发中的HTML5在近几年备受瞩目,越来越多的人从事html5开发相关工作.今天小编也来凑个热闹,和大家一起来谈谈HTML5中<a>标签的ping ...

对Joint Training of Cascaded CNN for Face Detection一文的几点疑惑

对Joint Training of Cascaded CNN for Face Detection一文的几点疑惑的更多相关文章

随机推荐

热门专题