目标检测方法系列——R-CNN, SPP, Fast R-CNN, Faster R-CNN, YOLO, SSD


目录

  • 相关背景

  • 从传统方法到R-CNN

  • 从R-CNN到SPP

  • Fast R-CNN

  • Faster R-CNN

  • YOLO

  • SSD

  • 总结

  • 参考文献

  • 推荐链接


相关背景

  • 14年以来的目标检测方法(以R-CNN框架为基础或对其改进)

  • 各方法性能对比

  • 分类,定位,检测三种视觉任务的简单对比

  • 一般的目标检测方法

从传统方法到R-CNN

  • R-CNN的三大步骤:得到候选区域,用cnn提取特征,训练分类器(后两步放在一个网络中,用softmax做分类器也可以)

从R-CNN到SPP

  • R-CNN必须限制输入图像大小(全连接层要求)

  • SPP的两大优势:可变输入大小 + 各patch块之间卷积计算是共享的

  • SPP的缺陷:multi-stage,训练和测试都比较慢

Fast R-CNN

  • Fast R-CNN通过ROI pooling(一层的SPP),multi-task等改进大大提高速度

  • Fast R-CNN的优势与弱势

Faster R-CNN

  • Faster R-CNN对于Fast R-CNN的改进在于把region proposal的步骤换成一个CNN网络(RPN)

  • Faster R-CNN的两个base model: ZF,VGG16 (base model的中间conv输出即为要输入到RPN的那个feature map)

  • Faster R-CNN的锚点anchor box

  • Faster R-CNN的损失函数

  • Faster R-CNN的四步训练

YOLO

  • 从Faster R-CNN到YOLO

  • YOLO的pipeline

  • YOLO的网络结构

  • YOLO的模型(最右图为网络输出的tensor)

  • YOLO的损失函数

  • YOLO的优势和劣势

SSD

  • SSD的pipeline和关键技术

  • SSD的网络结构

  • SSD的多尺度特征图

  • SSD的default box

  • SSD的default box与faster r-cnn的anchor box的对比

  • SSD的训练样本与groundTruth的匹配策略 + 损失函数

  • SSD的default box和尺度选择

总结

  • 从R-CNN → SPP → Fast R-CNN → Faster R-CNN → YOLO → SSD整体在准确率和速度上都在提高


参考文献

  • R-CNN

      • Girshick, R., Donahue, J., Darrell, T., Malik, J.: Rich feature hierarchies for accurate object detection and semantic segmentation. In: CVPR. (2014)
  • SPP

      • He, K., Zhang, X., Ren, S., Sun, J.: Spatial pyramid pooling in deep convolutional networks for visual recognition. In: ECCV. (2014)
  • Fast R-CNN

      • Girshick, R.: Fast R-CNN. In: ICCV. (2015)
  • Faster R-CNN

      • Ren, S., He, K., Girshick, R., Sun, J.: Faster R-CNN: Towards real-time object detection with region proposal networks. In: NIPS. (2015)
  • YOLO

      • Redmon, J., Divvala, S., Girshick, R., Farhadi, A.: You only look once: Unified, real-time object detection. In: CVPR. (2016)
  • SSD

      • W. Liu, D. Anguelov, D. Erhan, C. Szegedy, and S. Reed. SSD: Single shot multibox detector. arXiv:1512.02325v2, 2015

推荐链接

  • Object detection methods (codes)

      • https://handong1587.github.io/deep_learning/2015/10/09/object-detection.html#r-cnn
  • 所有目标检测方法的中文总结(博客)

      • http://46aae4d1e2371e4aa769798941cef698.devproxy.yunshipei.com/cosmosshadow/article/details/50244715
      • http://www.cnblogs.com/venus024/p/5717766.html
  • Faster RCNN的论文阅读

      • http://www.voidcn.com/blog/sloanqin/article/p-5994844.html
  • YOLO的论文阅读

      • http://blog.csdn.net/tangwei2014/article/details/50915317
      • http://blog.csdn.net/cv_family_z/article/details/46803421
  • R-FCN的论文阅读

      • http://blog.csdn.net/u011534057/article/details/52733823
  • SSD的论文阅读

      • http://www.aichengxu.com/view/24600342
      • http://m.2cto.com/kf/201609/549802.html
      • http://www.itdadao.com/articles/c15a476096p0.html
      • http://blog.csdn.net/u011534057/article/details/52733686

目标检测方法总结(R-CNN系列)的更多相关文章

  1. CVPR2019目标检测方法进展综述

    CVPR2019目标检测方法进展综述 置顶 2019年03月20日 14:14:04 SIGAI_csdn 阅读数 5869更多 分类专栏: 机器学习 人工智能 AI SIGAI   版权声明:本文为 ...

  2. 目标检测方法——R-FCN

    R-FCN论文阅读(R-FCN: Object Detection via Region-based Fully Convolutional Networks ) 目录 作者及相关链接 方法概括 方法 ...

  3. 目标检测复习之Anchor Free系列

    目标检测之Anchor Free系列 CenterNet(Object as point) 见之前的过的博客 CenterNet笔记 YOLOX 见之前目标检测复习之YOLO系列总结 YOLOX笔记 ...

  4. 目标检测方法——SSD

    SSD论文阅读(Wei Liu--[ECCV2016]SSD Single Shot MultiBox Detector) 目录 作者及相关链接 文章的选择原因 方法概括 方法细节 相关背景补充 实验 ...

  5. 【目标检测】基于传统算法的目标检测方法总结概述 Viola-Jones | HOG+SVM | DPM | NMS

    "目标检测"是当前计算机视觉和机器学习领域的研究热点.从Viola-Jones Detector.DPM等冷兵器时代的智慧到当今RCNN.YOLO等深度学习土壤孕育下的GPU暴力美 ...

  6. 目标检测复习之Faster RCNN系列

    目标检测之faster rcnn系列 paper blogs1: 一文读懂Faster RCNN Faster RCNN理论合集 code: mmdetection Faster rcnn总结: 网络 ...

  7. 深度学习笔记之目标检测算法系列(包括RCNN、Fast RCNN、Faster RCNN和SSD)

    不多说,直接上干货! 本文一系列目标检测算法:RCNN, Fast RCNN, Faster RCNN代表当下目标检测的前沿水平,在github都给出了基于Caffe的源码. •   RCNN RCN ...

  8. R-CNN,SPP-NET, Fast-R-CNN,Faster-R-CNN, YOLO, SSD, R-FCN系列深度学习检测方法梳理

    1. R-CNN:Rich feature hierarchies for accurate object detection and semantic segmentation 技术路线:selec ...

  9. R-CNN,SPP-NET, Fast-R-CNN,Faster-R-CNN, YOLO, SSD系列深度学习检测方法梳理

    1. R-CNN:Rich feature hierarchies for accurate object detection and semantic segmentation 技术路线:selec ...

随机推荐

  1. 【WPF】绑定数据

    WPF绑定数据 模型类(继承 INotifyPropertyChanged,实现属性的变更通知)

  2. webform 复合控件

    RadioButtonList  单选按钮列表 属性:RepeatColumns 用于布局项的列数(每一行的个数) RepeatDirection 选择Vertical,纵向排列:选择Horizont ...

  3. php 获取域名等Url

    <?php //获取域名或主机地址 echo $_SERVER['HTTP_HOST']."<br />"; //获取网页地址 echo $_SERVER['PH ...

  4. Jingle 相关问题

    1. //page模板默认的相对位置,主要用于开发hybrid应用,实现page的自动装载 basePagePath : 'html/'. 所以所有的section 要放在html文件下面才行

  5. quick-3.5 eclipse android

    quick-3.5 eclipse android  上遇到的 问题 首先是已经安装了SDK NDK ADT 环境变量都已经配置好了 直接打开项目然后运行 却出现这个鸟问题如图: NDK_ROOT = ...

  6. 返回数据方法DeaCacheCommand,由CRL自动实现

    越来越多的人学起了前端,或许部分的初衷仅是它简单易上手以及好找工作,毕竟几年前只会个html和css就能有工作,悄悄告诉泥萌,这也是博主一年前的初衷 还好numpy, scikit-learn都提供了 ...

  7. 【iCore3应用开发平台】发布 iCore3 应用开发平台PID控制代码

    说明:1.本代码包包含FPGA和STM32F407两部分内容2.FPGA工程为出厂代码FPGA工程,版本为REV43.STM32F407为只含PID控制的ARM工程4.在使用风扇过程中,请勿将手伸入扇 ...

  8. (四)G1 garbage collector

    g1专为大内存,多内核机型设计.可以兼顾高吞吐量和低暂停时间. g1将堆分为多个相同大小内存块,并发的标记线程,使得g1掌握了各个内存块的活对象数量, 内存回收阶段,g1根据用户指定的暂停时间,选择部 ...

  9. Python强化训练笔记(五)——找出多个字典中的公共键

    在这个问题中,我们期望得到的结果是找到这三轮比赛中,每轮都进球的球员都有谁.下面用python来模拟一下,先生成一批数据: >>> from random import randin ...

  10. MVC5 视图 不显示 Styles.Render Scripts.Render 问题解决

    第一步:安装 WebGrease 使用 nuget 安装 WebGrease 安装依赖 第二步:修改配置文件 <configSections> <!-- For more infor ...