目标检测方法总结(R-CNN系列)
目标检测方法系列——R-CNN, SPP, Fast R-CNN, Faster R-CNN, YOLO, SSD
目录
相关背景
从传统方法到R-CNN
从R-CNN到SPP
Fast R-CNN
Faster R-CNN
YOLO
SSD
总结
参考文献
推荐链接
相关背景
14年以来的目标检测方法(以R-CNN框架为基础或对其改进)

各方法性能对比

分类,定位,检测三种视觉任务的简单对比

一般的目标检测方法

从传统方法到R-CNN
R-CNN的三大步骤:得到候选区域,用cnn提取特征,训练分类器(后两步放在一个网络中,用softmax做分类器也可以)

从R-CNN到SPP
R-CNN必须限制输入图像大小(全连接层要求)

SPP的两大优势:可变输入大小 + 各patch块之间卷积计算是共享的

SPP的缺陷:multi-stage,训练和测试都比较慢

Fast R-CNN
Fast R-CNN通过ROI pooling(一层的SPP),multi-task等改进大大提高速度

Fast R-CNN的优势与弱势

Faster R-CNN
Faster R-CNN对于Fast R-CNN的改进在于把region proposal的步骤换成一个CNN网络(RPN)

Faster R-CNN的两个base model: ZF,VGG16 (base model的中间conv输出即为要输入到RPN的那个feature map)


Faster R-CNN的锚点anchor box

Faster R-CNN的损失函数


Faster R-CNN的四步训练

YOLO
从Faster R-CNN到YOLO

YOLO的pipeline

YOLO的网络结构

YOLO的模型(最右图为网络输出的tensor)

YOLO的损失函数

YOLO的优势和劣势

SSD
SSD的pipeline和关键技术

SSD的网络结构

SSD的多尺度特征图

SSD的default box

SSD的default box与faster r-cnn的anchor box的对比

SSD的训练样本与groundTruth的匹配策略 + 损失函数

SSD的default box和尺度选择

总结
从R-CNN → SPP → Fast R-CNN → Faster R-CNN → YOLO → SSD整体在准确率和速度上都在提高

参考文献
R-CNN
- Girshick, R., Donahue, J., Darrell, T., Malik, J.: Rich feature hierarchies for accurate object detection and semantic segmentation. In: CVPR. (2014)
SPP
- He, K., Zhang, X., Ren, S., Sun, J.: Spatial pyramid pooling in deep convolutional networks for visual recognition. In: ECCV. (2014)
Fast R-CNN
- Girshick, R.: Fast R-CNN. In: ICCV. (2015)
Faster R-CNN
- Ren, S., He, K., Girshick, R., Sun, J.: Faster R-CNN: Towards real-time object detection with region proposal networks. In: NIPS. (2015)
YOLO
- Redmon, J., Divvala, S., Girshick, R., Farhadi, A.: You only look once: Unified, real-time object detection. In: CVPR. (2016)
SSD
- W. Liu, D. Anguelov, D. Erhan, C. Szegedy, and S. Reed. SSD: Single shot multibox detector. arXiv:1512.02325v2, 2015
推荐链接
Object detection methods (codes)
- https://handong1587.github.io/deep_learning/2015/10/09/object-detection.html#r-cnn
所有目标检测方法的中文总结(博客)
- http://46aae4d1e2371e4aa769798941cef698.devproxy.yunshipei.com/cosmosshadow/article/details/50244715
- http://www.cnblogs.com/venus024/p/5717766.html
Faster RCNN的论文阅读
- http://www.voidcn.com/blog/sloanqin/article/p-5994844.html
YOLO的论文阅读
- http://blog.csdn.net/tangwei2014/article/details/50915317
- http://blog.csdn.net/cv_family_z/article/details/46803421
R-FCN的论文阅读
- http://blog.csdn.net/u011534057/article/details/52733823
SSD的论文阅读
- http://www.aichengxu.com/view/24600342
- http://m.2cto.com/kf/201609/549802.html
- http://www.itdadao.com/articles/c15a476096p0.html
- http://blog.csdn.net/u011534057/article/details/52733686
目标检测方法总结(R-CNN系列)的更多相关文章
- CVPR2019目标检测方法进展综述
CVPR2019目标检测方法进展综述 置顶 2019年03月20日 14:14:04 SIGAI_csdn 阅读数 5869更多 分类专栏: 机器学习 人工智能 AI SIGAI 版权声明:本文为 ...
- 目标检测方法——R-FCN
R-FCN论文阅读(R-FCN: Object Detection via Region-based Fully Convolutional Networks ) 目录 作者及相关链接 方法概括 方法 ...
- 目标检测复习之Anchor Free系列
目标检测之Anchor Free系列 CenterNet(Object as point) 见之前的过的博客 CenterNet笔记 YOLOX 见之前目标检测复习之YOLO系列总结 YOLOX笔记 ...
- 目标检测方法——SSD
SSD论文阅读(Wei Liu--[ECCV2016]SSD Single Shot MultiBox Detector) 目录 作者及相关链接 文章的选择原因 方法概括 方法细节 相关背景补充 实验 ...
- 【目标检测】基于传统算法的目标检测方法总结概述 Viola-Jones | HOG+SVM | DPM | NMS
"目标检测"是当前计算机视觉和机器学习领域的研究热点.从Viola-Jones Detector.DPM等冷兵器时代的智慧到当今RCNN.YOLO等深度学习土壤孕育下的GPU暴力美 ...
- 目标检测复习之Faster RCNN系列
目标检测之faster rcnn系列 paper blogs1: 一文读懂Faster RCNN Faster RCNN理论合集 code: mmdetection Faster rcnn总结: 网络 ...
- 深度学习笔记之目标检测算法系列(包括RCNN、Fast RCNN、Faster RCNN和SSD)
不多说,直接上干货! 本文一系列目标检测算法:RCNN, Fast RCNN, Faster RCNN代表当下目标检测的前沿水平,在github都给出了基于Caffe的源码. • RCNN RCN ...
- R-CNN,SPP-NET, Fast-R-CNN,Faster-R-CNN, YOLO, SSD, R-FCN系列深度学习检测方法梳理
1. R-CNN:Rich feature hierarchies for accurate object detection and semantic segmentation 技术路线:selec ...
- R-CNN,SPP-NET, Fast-R-CNN,Faster-R-CNN, YOLO, SSD系列深度学习检测方法梳理
1. R-CNN:Rich feature hierarchies for accurate object detection and semantic segmentation 技术路线:selec ...
随机推荐
- 如何用inno setup打包activex
需要解决三个问题,运行环境检测与安装,按顺序执行安装,activex注册. 运行环境检测与安装 最开始的方法,百度之后,根据网上的搜索的结果,使用了RegQueryDWordValue(HKLM, ' ...
- 非递归创建二叉树( C++队列 )
非递归按照 层序 创建二叉树,利用 队列(即可先进先出特点)存放已访问的结点元素的地址. 初始化:front=rear= -1: 每储存一个结点元素 rear+1 ,利用 rear%2==0 来使 f ...
- 《我爱背单词》 Alpha版 发布说明
——发布地址(baidu网盘) http://pan.baidu.com/s/15omtB ——简介 <我爱背单词>是一款英语单词记忆和管理辅助软件,旨在帮助广大考生在短期内攻克GRE. ...
- bug2--工程性错误
1问题场景:图片上传失败,打印log.http header 有数据.不报错,通过流写入文件后,文件被创建,但是大小为0kb. 执行:df -h 发现linux的磁盘 used 100%. 原来是没有 ...
- PHP基础知识之函数
定义: <?phpclass foo-----定义类{ function do_foo()---类的方法 { echo "Doing foo."; ...
- Unity -- EventSystem完全掌握
Event System 组成 系统生成的Event System里面主要有两个Components,分别是Event System和Standalone Input Module. 其中Standa ...
- Java Service Wrapper简介与使用
在实际开发过程中很多模块需要独立运行,他们并不会以web形式发布,传统的做法是将其压缩为jar包独立运行,这种形式简单易行也比较利于维护,但是一旦服务器重启或出现异常时,程序往往无法自行修复或重启.解 ...
- pict(Pairwise Independent Combinatorial Testing)工具使用
PICT工具就是在微软公司内部使用的一款成对组合的命令行生成工具,现在已经对外提供,可以在互联网上下载到. 要把输入类型和其对应的参数输入到一个CSV格式(CSV: 以逗号分割的纯文本文件,不带有任何 ...
- Java-开源工具类
一.集合 org.springframework.util.CollectionUtils: 二.字符串 com.google.common.base.Strings: org.apache.comm ...
- 利用JavaScript生成随机数字!
<!DOCTYPE html> <html> <head> <title>1-99的随机数字</title> <script type ...