本文转载自:

http://www.cnblogs.com/lillylin/p/6207292.html

SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)


目录

  • 作者及相关链接
  • 文章的选择原因
  • 方法概括
  • 方法细节
  • 相关背景补充
  • 实验结果
  • 与相关文章的对比
  • 总结

作者

文章的选择原因

  • 性能好,single stage

方法概括

  1. 文章的方法介绍

    • SSD主要用来解决目标检测的问题(定位+分类),即输入一张待测图像,输出多个box的位置信息和类别信息
    • 测试时,输入一张图像到SSD中,网络输出一个下图最右边的tensor(多维矩阵),对该矩阵进行非极大值抑制(NMS)就能得到每个目标的位置和label信息
    • Figure2的最右图的1th-20th Channel表示类别,每一个Channel上的map对应原图,last 4 channel的每一个map分别对应x,y,w,h的偏移量。最后4个通道可以确定一个box的位置信息,前20个通道确定类别信息。

  2. 方法的pipeline和关键点

方法细节

  • 模型结构

  • 多尺度特征图

  • 用来预测的卷积滤波器

  • defaul box

  • groundTruth的标定,损失函数

  • default box和尺度的选择

  • SSD的训练——Hard negative mining

  • SSD的训练——数据扩增

相关背景补充

  • Atrous算法(hole算法)

  • FPS/SPF, Jaccard overlap

  • 二类分类/检测常用的评价标准 (recall, precision, f-measure, accuracy, error, PR曲线和ROC曲线,AP,AUC)

  • ImageNet多类分类的评价标准

  • ImageNet单目标检测的评价标准

  • ImageNet(多)目标检测的评价标准

实验结果

  • PASCAL VOC2007 test detection结果

  • 使用数据扩增、多尺度default box、atrous算法的对比效果

  • SSD512在某类Ianimals)上的检测性能可视化

  • SSD对于目标大小的敏感性实验

  • SSD使用的feature map的个数对结果的影响

  • 示例结果

  • 时间和速度

与相关文章的对比

  • 原始R-CNN方法的变形

  • Faster R-CNN和SSD对比

  • YOLO和SSD对比

总结

  • 文章贡献

    • SSD, a single-shot detector for multiple categories (faster than YOLO, accurate as Faster R-CNN)
    • The
      core of SSD is predicting category scores and box offsets for a fixed set of default
      bounding boxes using small convolutional filters applied to multiple
      feature maps from different layers
    • Experimental evidence: high
      accuracy, high speed, simple end-to-end training (single shot)
  • SSD对于其他方法的改进的关键点

    • Using a small convolutional filter to predict object categories and offsets in bounding box locations
    • Using separate predictors (filters) for different aspect ratio detections
    • Using multiple layers for prediction at different scales (apply these
      filters to multiple feature maps to perform detection at multiple stages)

【计算机视觉】目标检测之ECCV2016 - SSD Single Shot MultiBox Detector的更多相关文章

  1. 目标检测--SSD: Single Shot MultiBox Detector(2015)

    SSD: Single Shot MultiBox Detector 作者: Wei Liu, Dragomir Anguelov, Dumitru Erhan, Christian Szegedy, ...

  2. 深度学习论文翻译解析(十四):SSD: Single Shot MultiBox Detector

    论文标题:SSD: Single Shot MultiBox Detector 论文作者:Wei Liu, Dragomir Anguelov, Dumitru Erhan, Christian Sz ...

  3. SSD(Single Shot MultiBox Detector)的安装配置和运行

    下文图文介绍转自watersink的博文SSD(Single Shot MultiBox Detector)不得不说的那些事. 该方法出自2016年的一篇ECCV的oral paper,SSD: Si ...

  4. SSD: Single Shot MultiBox Detector

    By Wei Liu, Dragomir Anguelov, Dumitru Erhan, Christian Szegedy, Scott Reed, Cheng-Yang Fu, Alexande ...

  5. 机器视觉:SSD Single Shot MultiBox Detector

    今天介绍目标检测中非常著名的一个框架 SSD,与之前的 R-CNN 系列的不同,而且速度比 YOLO 更快. SSD 的核心思想是将不同尺度的 feature map 分成很多固定大小的 box,然后 ...

  6. 论文笔记 SSD: Single Shot MultiBox Detector

    转载自:https://zhuanlan.zhihu.com/p/33544892 前言 目标检测近年来已经取得了很重要的进展,主流的算法主要分为两个类型(参考RefineDet):(1)two-st ...

  7. SSD: Single Shot MultiBox Detector 编译方法总结

    SSD是一个基于单网络的目标检测框架,它是基于caffe实现的,所以下面的教程是基于已经编译好的caffe进行编译的. caffe的编译可以参考官网 caffe Installation Instal ...

  8. [论文理解]SSD:Single Shot MultiBox Detector

    SSD:Single Shot MultiBox Detector Intro SSD是一套one-stage算法实现目标检测的框架,速度很快,在当时速度超过了yolo,精度也可以达到two-stag ...

  9. 论文阅读笔记二十九:SSD: Single Shot MultiBox Detector(ECCV2016)

    论文源址:https://arxiv.org/abs/1512.02325 tensorflow代码:https://github.com/balancap/SSD-Tensorflow 摘要 SSD ...

随机推荐

  1. Poj 1743 Musical Theme(后缀数组+二分答案)

    Musical Theme Time Limit: 1000MS Memory Limit: 30000K Total Submissions: 28435 Accepted: 9604 Descri ...

  2. linux shell下面的几种proxy方式

    设置ALL_PROXY环境变量 export ALL_PROXY=socks5://127.0.0.1:1080 支持socks5 http https 取消 export ALL_PROXY=&qu ...

  3. java如何实现多线程?线程的状态有哪些?

    java实现多线程有两种方法    1.继承Thread类    2.实现Runnable接口    这两种方法的共同点:    不论用哪种方法,都必须用Thread(如果是Thead子类就用它本身) ...

  4. HTML meta pragma no-cache 页面缓存

    HTML meta pragma no-cache 页面缓存不缓存页面(为了提高速度一些浏览器会缓存浏览者浏览过的页面,通过下面的定义,浏览器一般不会缓存页面,而且浏览器无法脱机浏览.) <me ...

  5. return关键字

    注意:如果一个函数的返回值类型是具体的数据类型,那么该函数就必须要保证在任意情况下都保证有返回值(除了返回值类型是void)     return  关键字的作用: 1   返回数据给函数的调用者. ...

  6. HTTP Referrer和Referrer Policy 设置

    referrer是HTTP请求header的报文头,用于指明当前流量的来源参考页面.通过这个信息,我们可以知道访客是怎么来到当前页面的.这对于Web Analytics非常重要,可以用于分析不同渠道流 ...

  7. 深拷贝(deep clone)与浅拷贝(shallow clone)

    一.浅复制和深复制概念 浅复制(浅克隆): 被复制对象的所有变量都含有与原来对象相同的值,而所有的对其他对象的引用仍然指向原来的对象.换言之,浅复制仅仅复制所考虑的对象,而不是复制它所引用的对象. 深 ...

  8. 部署gerrit环境完整记录【转】

    开发同事提议在线上部署一套gerrit代码审核环境,废话不多说,部署gerrit的操作记录如下:提前安装好java环境,mysql环境,nginx环境测试系统:centos6.5下载下面三个包,放到/ ...

  9. TreeFrog Framework : High-speed C++ MVC Framework for Web Application http://www.treefrogframework.org

    TreeFrog Framework : High-speed C++ MVC Framework for Web Application http://www.treefrogframework.o ...

  10. IMDB-WIKI – 500k+ face images with age and gender labels论文学习

    DEX: Deep EXpectation of apparent age from a single image 这个论文我们使用深度学习解决了在静态人脸图像中面部年龄的估计.我们的卷积神经网络使用 ...