目标检测论文解读4—

背景

　　Fast R-CNN中的region proposal阶段所采用的SS算法成为了检测网络的速度瓶颈，本文是在Fast R-CNN基础上采用RPN(Region Proposal Networks)代替SS。

方法

　　从图中我们可以看到，RPN的输入为最后一个Conv层输出的feature map，输出为一系列ROI，后面的过程就跟Fast R-CNN一样了。

　　所以在这里我们只需要了解RPN是如何工作的。

　　论文里有这样一张图，讲解了RPN的过程(注意后面的k不是千，而是代表每个特征点要预测的anchors个数)。但我觉得可能很多人看到这张图都难以理解，本人也是结合模型的网络结构才理解的，所以我在这里更通俗地解释一下。

　　论文上的图有点抽象，屏蔽了很多细节部分，初学者看的话可能会似懂非懂，从网络结构上看的话那么RPN的原理就非常清晰了。

　　假设每个点预测9个Anchor，即k=9

　　(1)首先，原图片经过一系列卷积，会得到一个feature map，即左下角的256*h*w的FM，作为ROI pooling和RPN的输入；

　　(2)RPN网络中，256*h*w的FM，先经过256*3*3 Conv+Relu，得到一个新的256*h*w的FM(注意：这里pad=1，所以h和w不变)，这个步骤对应论文图中的3*3的sliding window；

　　(3)新的256*h*w的FM经两个分支，一个是18*1*1 Conv，代表前背景分类分支，输出一个18*h*w的FM，用来预测特征图的每个点所对应的Anchors是为前景还是背景；

　　(4)另一个是36*1*1 Conv，代表坐标回归分支，输出一个36*h*w的FM，用来预测特征图的每个点所对应的9个Anchors坐标需要调整的大小；

　　(5)把上面两种预测综合一下，就能得到预测的候选框了，后面的步骤就跟Fast R-CNN一样了。

总结

　　Faster R-CNN = RPN + Fast R-CNN

目标检测论文解读4——Faster R-CNN的更多相关文章

AAAI2019 | 基于区域分解集成的目标检测论文解读
Object Detection based on Region Decomposition and Assembly AAAI2019 | 基于区域分解集成的目标检测论文解读作者 | 文永亮学 ...
目标检测论文解读3——Fast R-CNN
背景 deep ConvNet兴起,VGG16应用在图像分类任务上表现良好,本文用VGG16来解决检测任务.SPP NET存在CNN层不能fine tuning的缺点,且之前的方法训练都是分为多个阶段 ...
目标检测论文解读5——YOLO v1
背景之前热门的目标检测方法都是two stage的,即分为region proposal和classification两个阶段,本文是对one stage方法的初次探索. 方法首先看一下模型的网络 ...
目标检测论文解读1——Rich feature hierarchies for accurate object detection and semantic segmentation
背景在2012 Imagenet LSVRC比赛中,Alexnet以15.3%的top-5 错误率轻松拔得头筹(第二名top-5错误率为26.2%).由此,ConvNet的潜力受到广泛认可,一炮而红 ...
目标检测论文解读10——DSSD
背景 SSD算法在检测小目标时精度并不高,本文是在在SSD的基础上做出一些改进,引入卷积层,能综合上下文信息,提高模型性能. 理解 Q1:DSSD和SSD的区别有哪些? (1)SSD是一层一层下采样, ...
目标检测论文解读13——FPN
引言对于小目标通常需要用到多尺度检测,作者提出的FPN是一种快速且效果好的多尺度检测方法. 方法 a,b,c是之前的方法,其中a,c用到了多尺度检测的思想,但他们都存在明显的缺点. a方法:把每图片 ...
目标检测论文解读12——RetinaNet
引言这篇论文深刻分析了one-stage的模型精度比two-stage更差的原因,并提出Focal Loss提高精度. 思路在论文中,作者指出,造成one-stage模型精度差的原因主要是:正负样 ...
目标检测论文解读9——R-FCN
背景基于ResNet 101的Faster RCNN速度很慢,本文通过提出Position-sensitive score maps(位置敏感分值图)来给模型加速. 方法首先分析一下,为什么基于R ...
目标检测论文解读6——SSD
背景 R-CNN系列算法检测速度不够快,YOLO v1检测准确率较低,而且无法检测到密集目标. 方法 SSD算法跟YOLO类似,都属于one stage的算法,即通过回归算法直接从原图得到预测结果,为 ...

随机推荐

java 中 public default protected private 的区别
对于继承自己的class,父类可以认为他们都是自己的子女,而对于和自己都在同一个目录下的class,可以认为都是自己的朋友. public:对所有用户开发,所有用户都可以直接调用 private:自己 ...
ping-pong buffer
1 什么是pingpong? pingpong是一种数据缓存的手段,通过pingpong操作可以提高数据传输的效率. 2 什么时候需要pingpong? 在两个模块间交换数据时,上一级处理的结果不能马 ...
【Gamma】Scrum Meeting 10
目录写在前面任务进度表燃尽图照片写在前面例会时间:6.8 22:30-23.00 例会地点:微信群语音通话代码进度记录github在这里任务进度表注:点击链接跳转至相应的issue ...
【译】RAID的概念和RAID对于SQL性能的影响
简介我们都听说过RAID,也经常作为SQL DBA.开发人员或构架师在工作中讨论RAID.但是,其实我们很多人都对RAID的原理,等级,以及RAID是如何影响SQL Server性能并不甚了解. 本 ...
HUT 排序训练赛 G - Clock
Clock Time Limit: 1000MS Memory Limit: 32768KB 64bit IO Format: %I64d & %I64u [Submit] [Go ...
Feign实现自定义错误处理
关键操作实现ErrorDecoder接口问题和背景最近项目中在大量使用Feign和OkHttp作为http客户端使用,开发效率得到显著的提升.但也面临一些问题,比如每个下游系统的异常返回方式不同 ...
Django 安装使用
Django 安装使用 Django 介绍: Django是一个开放源代码的Web应用框架,由Python写成.采用了MVT的框架模式,即模型M,视图V和模版T.它最初是被开发来用于管理劳伦斯出版集团 ...
另一个角度的redis--redis 可以看做是c/s架构的软件
Redis 通信协议简单研究 redis 可以看做是c/s架构的软件,再打开一个终端输入下面的指令 https://www.cnblogs.com/nele/p/8908298.html redis ...
Linux学习笔记之CentOS 7系统使用firewalld管理防火墙端口
0x00 firewalld的基本使用 # 启动: systemctl start firewalld # 查看状态: systemctl status firewalld # 停止: systemc ...
Entity Framework Core今日所得：避免 IEnumerable 以及 IQueryable 陷阱
避免 IEnumerable 以及 IQueryable 陷阱: IEnumerable示用Linq会先去数据库查询所有记录,然后再条件查询. IQueryable接口派生自IEnumerable,但 ...

目标检测论文解读4——Faster R-CNN

目标检测论文解读4——Faster R-CNN的更多相关文章

随机推荐

热门专题