对sppnet网络的理解

　前言：

　　　接着上一篇文章提到的RCNN网络物体检测，这个网络成功的引入了CNN卷积网络来进行特征提取，但是存在一个问题，就是对需要进行特征提取图片大小有严格的限制。当时面对这种问题，rg大神采用的是对分割出的2000多个候选区域，进行切割或者缩放形变处理到固定大小，这样虽然满足了CNN对图片大小的要求，确造成图片的信息缺失或者变形，会降低图片识别的正确率. 如下图所示：
　　　　　

　　正文：

　　何凯明大神在看到RCNN模型，分析了CNN模型的特点后：由卷积部分和全连接两部分构成，而对于卷积部分而言，比如任意图片大小(w,h),任意的卷积核size（a,b），默认步长为１，我们都会得到卷积之后的特征图F(w-a+1,h-b+1)，所以这部分对图片大小没有要求，有要求的地方在全连接层（如下图），全连接层的神经元设定之后是固定的（如图　Input layer 神经元个数），而每一个都对应者一个特征，rg大神在进入CNN前对图片进行warp处理，就是为了卷积之后的特征数，能够和了全连接层的神经元个数相等.

　但是何大神觉得，事情还可以更有趣，他提出将特征数据（特征图）进一步处理，然后拼凑成和神经元个数相同的特征数，这样就可以不用warp图片大小也可以获得相同数量的特征，那么他是咋样处理这特征图的呢？

论文中提到，比如我们有一张图片为例子：

我们对这种图进行卷积处理（我们以zf为例，最后一个卷积之后得到这样的特征图）

这张图显示的是一个60*40*256的特征图,到这儿之后，如果要得到固定的神经元个数，论文中提到的是21，我们就需要将60*40的特征图，我们暂且称这个特征图为feature A,进行处理，怎么处理呢？

我们先贴个图：

如上图所示：

　　　　我们使用三层的金字塔池化层pooling，分别设置图片切分成多少块，论文中设置的分别是(1,4,16),然后按照层次对这个特征图feature A进行分别

处理（用代码实现就是for(1,2,3层)），也就是在第一层对这个特征图feature A整个特征图进行池化（池化又分为：最大池化，平均池化，随机池化），论文中使用的是最大池化，

得到１个特征。

　　第二层先将这个特征图feature A切分为4个(20,30)的小的特征图，然后使用对应的大小的池化核对其进行池化得到４个特征，

　　第三层先将这个特征图feature A切分为16个(10,15)的小的特征图，然后使用对应大小的池化核对其进行池化得到16个特征.

然后将这１＋４＋１６＝２１个特征输入到全连接层，进行权重计算.

　这就是sppnet的核心思想，当然在这个模型中，何大神还对RCNN进行了优化，上面介绍的金字塔池化代替warp最重要的一个，但是这个也很重要，是什么呢？

何大神觉得，如果对ss提供的2000多个候选区域都逐一进行卷积处理，势必会耗费大量的时间，所以他觉得，能不能我们先对一整张图进行卷积得到特征图，然后

再将ss算法提供的2000多个候选区域的位置记录下来，通过比例映射到整张图的feature map上提取出候选区域的特征图B,然后将B送入到金字塔池化层中，进行权重计算.

然后经过尝试，这种方法是可行的，于是在RCNN基础上，进行了这两个优化得到了这个新的网络sppnet.

　值得一提的是，sppnet提出的这种金字塔池化来实现任意图片大小进行CNN处理的这种思路，得到了大家的广泛认可，以后的许多模型，或多或少在这方面都是参考了这种思路，就连

rg大神，在后来提出的fast-rcnn上也是收益于这种思想的启发.

参考:

　　Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

对sppnet网络的理解的更多相关文章

Docker 网络之理解 bridge 驱动
笔者在前文<Docker 网络之进阶篇>中介绍了 CNM(Container Network Model),并演示了 bridge 驱动下的 CNM 使用方式.为了深入理解 CNM 及最常 ...
CapsNet胶囊网络（理解）
0 - 背景 Geoffrey Hinton是深度学习的开创者之一,反向传播等神经网络经典算法发明人,他在去年年底和他的团队发表了两篇论文,介绍了一种全新的神经网络,这种网络基于一种称为胶囊(caps ...
对eigrp默认网络的理解！
EIGRP 默认网络设置的个人总结 (了解即可) //该机制同rip和ospf的default-informationoriginate,原理相同,只是配置格式不同. //!!(唯一作用)该命令起到减 ...
残差网络resnet理解与pytorch代码实现
写在前面深度残差网络(Deep residual network, ResNet)自提出起,一次次刷新CNN模型在ImageNet中的成绩,解决了CNN模型难训练的问题.何凯明大神的工作令人佩服 ...
Docker网络详细理解-容器网络互通
这篇文章主要解决以下几个问题: 1.同一个网段的容器互相之间通过ip进行ping通 2.同一个网段的容器互相之间通过容器名,通过使用--link进行ping通,已放弃这种方法 3.同一个网段的容器互相 ...
AJPFX关于网络编程的理解
1:网络编程(理解) (1)网络编程:用Java语言实现计算机间数据的信息传递和资源共享 (2)网络编程模型 (3)网络编程的三要素 ...
理解OAuth 2.0 - 阮一峰的网络日志
原文:理解OAuth 2.0 - 阮一峰的网络日志理解OAuth 2.0 作者: 阮一峰日期: 2014年5月12日 OAuth是一个关于授权(authorization)的开放网络标准,在全世界 ...
【转】理解Docker容器网络之Linux Network Namespace
原文:理解Docker容器网络之Linux Network Namespace 由于2016年年中调换工作的原因,对容器网络的研究中断过一段时间.随着当前项目对Kubernetes应用的深入,我感觉之 ...
目标检测从入门到精通—SPP-Net详细解析（三）
SPP-Net网络结构分析 Author:Mr. Sun Date:2019.03.18 Loacation: DaLian university of technology 论文名称:<Spa ...

随机推荐

oracle创建用户四部曲
创建用户一般分四步: 第一步:创建临时表空间第二步:创建数据表空间第三步:创建用户并制定表空间第四步:给用户授予权限创建临时表空间 create temporary tablespace ho ...
浅谈java发射机制
目录什么是反射初探初始化类构造函数属性方法总结思考什么是反射 JAVA反射机制是在运行状态中,对于任意一个类,都能够知道这个类的所有属性和方法:对于任意一个对象,都能够调用它的任意 ...
2.Node.js access_token的获取、存储及更新
文章目录: 1.Node.js 接入微信公众平台开发 2.Node.js access_token的获取.存储及更新一.写在前面的话上一篇文章中,我们使用 No ...
java面试题之int和Integer的区别
int和Integer的区别 1.Integer是int的包装类,int则是java的一种基本数据类型 2.Integer变量必须实例化后才能使用,而int变量不需要 3.Integer实际是对象的引 ...
python之numpy库[1]
python-numpy python中的数据一维数据用列表和集合表示数组与列表的关系列表:数据类型可以不同数组:数据类型可以相同多维数据用列表表示高维数据用字典表示高维数据仅利用 ...
【数据库】Mean web开发 04-MongoDB在Linux上的安装及遇到的问题
简介 Mean是JavaScript的全栈开发框架.更多介绍用MongoDB实现持久数据的存储是Mean Web全栈开发中的一部分. MongoDB是一个介于关系数据库和非关系数据库之间的产品,是非 ...
idea live template
最近正在研究如何给idea添加注释模板. 此篇文章是记录在写(开发)注释模板的过程中遇到的坑. 1. methodParameters() 当函数的参数列表为空的时候返回的是: [] 当函数的参数列表 ...
AES加密解密算法---java
package com.BFGJ.AES; import java.util.Random; import java.util.StringTokenizer; import javax.crypto ...
Angular JS从入门基础 mvc三层架构常用指令
Angular JS从入门基础 mvc模型常用指令 ★ 最近一直在复习AngularJS,它是一款优秀的前端JS框架,已经被用于Google的多款产品当中.AngularJS有着诸多特性,最为核心 ...
thinkphp5.0学习笔记（四）数据库的操作
ThinkPHP内置了抽象数据库访问层,把不同的数据库操作封装起来,我们只需要使用公共的Db类进行操作,而无需针对不同的数据库写不同的代码和底层实现,Db类会自动调用相应的数据库驱动来处理.采用PDO ...

对sppnet网络的理解

前言：

正文：

参考:

对sppnet网络的理解的更多相关文章

随机推荐

热门专题

　前言：

　　正文：