对Joint Training of Cascaded CNN for Face Detection一文的几点疑惑

最近读了Joint Training of Cascaded CNN for Face Detection这篇论文，论文中把之前人脸检测使用到的cascade cnn，从分开训练的模式，改为了联合训练，并且声称得到了更好的结果。

但是在我读论文的过程中，产生了下面几点疑惑：

1.论文4.2节的Training procedure这部分最后提到，To make it converge easily, we train seperate networks and initialize the joint network with trained weights. 说明联合网络利用了分别训练的模型作为初始权重。这相当于把之前的cascade cnn又训练了一遍，然后再初始化joint network，训练步骤其实比之前的cascade cnn更复杂了，而且在分别训练各个网络时，采用了怎样的配置参数，以及训练的目标，均未提及。

2.论文6.3节中提及该方法在FDDB上测试结果，在false positives=1000 时recall是88.2%，而之前的cascade cnn是85.7%。但是我在FDDB网站上查阅到的CascadeCNN的结果是，false positives=167时recall是0.856701，CascadeCNN提供的测试结果，并没有false positives=1000的数据。不知道这个85.7%是如何获得的。

3.2016年上半年有一篇论文Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks，也是利用了类似于CascadeCNN的结构，在FDDB上性能比CascadeCNN好很多（论文的方法是检测和对齐同时做，但是也提供了只做检测不做对齐的ROC曲线），而且比这批论文的结果还要好，不知道为何选择性忽视这篇论文。

4.在网上看到一篇报道，该论文中的算法在单核cpu上可以跑到几百fps，但是论文里面还仅仅是10fps，一下提高了几十倍的速度，真的是很神奇，不知道是如何在这么短时间内做到的。

上面就是我的几点疑问，还希望各位高手不吝赐教。

参考文献和网站：

1.http://www.thinkface.cn/thread-4651-1-1.html

2.http://vis-www.cs.umass.edu/fddb/results.html

3.http://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Qin_Joint_Training_of_CVPR_2016_paper.pdf

4.http://arxiv.org/pdf/1604.02878

对Joint Training of Cascaded CNN for Face Detection一文的几点疑惑的更多相关文章

利用CNN进行多分类的文档分类
# coding: utf-8 import tensorflow as tf class TCNNConfig(object): """CNN配置参数"&qu ...
2016CVPR论文集
http://www.cv-foundation.org/openaccess/CVPR2016.py ORAL SESSION Image Captioning and Question Answe ...
CVPR2016 Paper list
CVPR2016 Paper list ORAL SESSIONImage Captioning and Question Answering Monday, June 27th, 9:00AM - ...
目标检测（六）YOLOv2__YOLO9000: Better, Faster, Stronger
项目链接 Abstract 在该论文中,作者首先介绍了对YOLOv1检测系统的各种改进措施.改进后得到的模型被称为YOLOv2,它使用了一种新颖的多尺度训练方法,使得模型可以在不同尺寸的输入上运行,并 ...
Faster R-CNN改进篇（一）： ION ● HyperNet ● MS CNN
一. 源起于Faster 深度学习于目标检测的里程碑成果,来自于这篇论文: Ren, Shaoqing, et al. "Faster R-CNN: Towards real-time ob ...
[转] Implementing a CNN for Text Classification in TensorFlow
Github上的一个开源项目,文档讲得极清晰 Github - https://github.com/dennybritz/cnn-text-classification-tf 原文- http:// ...
CNN autoencoder 进行异常检测——TODO，使用keras进行测试
https://sefiks.com/2018/03/23/convolutional-autoencoder-clustering-images-with-neural-networks/ http ...
face recognition[MobiFace]
本文来自<MobiFace: A Lightweight Deep Learning Face Recognition on Mobile Devices>,时间线为2018年11月.是作 ...
cvpr2015papers
@http://www-cs-faculty.stanford.edu/people/karpathy/cvpr2015papers/ CVPR 2015 papers (in nicer forma ...

随机推荐

使用SharePoint CSOM 编写高效的程序
上一篇文章中简单的介绍了使用CSOM进行编程.今天主要讲一下CSOM使用中一些小技巧,可以让你的程序运行的更快. 单独加载某些属性在上文中的例子,需要返回Web对象信息的时候,我们使用了如下的代码: ...
ftp 操作，支持断点续传或者继续下载。
1.ftpclient 类 public class FTPClient:IDisposable { public static object _obj = new object(); #region ...
web前端基础——补充
1 布局和事件布局效果如下(标题和内容都居中,两边留空白) 布局代码如下 <!DOCTYPE html> <html lang="en"> <he ...
Java中Atomic包的实现原理及应用
1. 同步问题的提出假设我们使用一个双核处理器执行A和B两个线程,核1执行A线程,而核2执行B线程,这两个线程现在都要对名为obj的对象的成员变量i进行加1操作,假设i的初始值为0,理论上两个线程运 ...
SDWebImage ReadMe.md文档简单说明
SDWebImage ReadMe.md 文档附:SDWebImage框架github下载地址:https://github.com/rs/SDWebImage 注1:该文章简单翻译了SDWebIm ...
android: 文件存储
数据持久化就是指将那些内存中的瞬时数据保存到存储设备中,保证即使在手机或电脑关机的情况下,这些数据仍然不会丢失.保存在内存中的数据是处于瞬时状态的,而保存在存储设备中的数据是处于持久状态的,持久化 ...
ES5 数组方法forEach
ES6已经到了非学不可的地步了,对于ES5都不太熟的我决定是时候学习ES5了. 1. js 数组循环遍历. 数组循环变量,最先想到的就是 for(var i=0;i<count;i++)这样的 ...
解决 01-Jul-2016 10:49:05.875 WARNING [localhost-startStop-2] org.apache.catalina.loader.WebappClassLoaderBase.clearReferencesJdbc The web application [ROOT] registered the JDBC driver [com.mysql.jdbc.D
01-Jul-2016 10:49:05.875 WARNING [localhost-startStop-2] org.apache.catalina.loader.WebappClassLoade ...
Open vSwitch实践——VLAN
# virt-clone --original=centos65 --name=vm2 --file=vm2.qcow2 正在克隆 centos65.qcow2 ...
j$(function() j$(document).ready 区别
$j(document).ready(function(){}); // 或者 $j(function(){}); 第一个是直接使用Jquery调用function,第二个是在文档加载完毕后才去调用 ...

对Joint Training of Cascaded CNN for Face Detection一文的几点疑惑

对Joint Training of Cascaded CNN for Face Detection一文的几点疑惑的更多相关文章

随机推荐

热门专题