rpn网络结构再分析

这是rpn网络train阶段的网络结构图

rpn_conv1之前的网络是特征提取层，也是和fast rcnn共享的层。rpn_conv1是一层1*1的卷积，这一层是单独为rpn网络多提取一层特征，这一层之后就接两个输出channel层不同的1*1的卷积（即分别进行score的预测和坐标补偿值的预测），这样保证feature map的大小不变。

rpn_cls_score：bach_size*18*width*height

rpn_cls_score_reshape：batch_size*2*(9*width)*height

rpn_bbox_pred：batch_size*36*width*height。每4个channel对应一种类型的anchor（即一个尺寸和一个ratio），因为有9种类型的anchor，所有一共也就有36个channel。以前4个channel为例，第一个channel的feature map每一个值是每个位置中心点x方向的补偿值dx，第二个channel的feature map每一个值是每个位置中心点y方向的补偿值dy，第三个channel的feature map每一个值是每个位置宽度的补偿值dw，第四个channel的feature map每一个值是每个位置长度的补偿值dh。再来说一下这前四个channel的每个feature map，这4个channel的feature map的相对应位置都是对应的一个anchor，比如4个channel的第一个值都是对应的第一种类型anchor的第一个anchor。每个feature map是width*height大小，也就有width*height个值，生成rpn本身就是在这个feature map上进行滑动生成（width*height*anchor类别数）个anchor，这样的话，第一个feature map的第一个值对应的应该是第一种类型的anchor在这个位置上dx补偿值。

为什么不直接从rpn_conv1生成rpn_cls_score_reshape？

channel变成2很好实现，但feature map的宽度是个问题。因为rpn_cls_score_reshape的feature map的宽度是9*width，而rpn_conv1是width，直接卷积变成宽度的9倍，我目前还没看到过，reshape成9倍就很好实现。并且对于后面的rpn生成也有帮助，这个后续还要写一些东西

那为什么又要转成rpn_cls_score_reshape的形状呢？

主要是为了分成两类，然后计算概率值，最开始只是一个score值

rpn网络结构再分析的更多相关文章

对HI3531的GPIO使用的再分析
在一个嵌入式系统中使用最多的莫过于通用输入输出 GPIO口.看到论坛中经常有朋友问海思为什么没有提供GPIO驱动.其实不然. 在海思SDK xxx/osdrv/tools/board_tools/ ...
Node.js开发入门—HelloWorld再分析
在Node.js开发入门(1)我们用http模块实现了一个简单的HelloWorld站点,这次我们再来细致分析下代码.了解很多其它的细节. 先看看http版本号的HelloWorld代码: 代码就是这 ...
HRNET网络结构简单分析
hrnet相关的两篇文章 CVPR2019 Deep High-Resolution Representation Learning for Human Pose Estimation High- ...
Permutations II 再分析
记得第一遍做这题的时候其实是没什么思路的,但是第二次的时候,我已经有"结果空间树"的概念了.这时候再看https://oj.leetcode.com/problems/permut ...
再分析返回值加引用&，const
本文主要分析,返回&,和返回值加const的作用. 返回& 定义一个数组模板: template<class T>class Array{ enum{size = 100} ...
SparkHiveContext和直接Spark读取hdfs上文件然后再分析效果区别
最近用spark在集群上验证一个算法的问题,数据量大概是一天P级的,使用hiveContext查询之后再调用算法进行读取效果很慢,大概需要二十多个小时,一个查询将近半个小时,代码大概如下: try: ...
CRM项目再分析建表
今天老师带着我们分析了一点项目的业务,我们就觉得有些地方呢有一些不妥额地方,然后呢我们就在原来表的基础上做了一些修改! 我们也把我们组的项目业务的工作分配了一下! 但是我们遇到了一个组员不和我们 ...
Deep Belief Network简介——本质上是在做逐层无监督学习，每次学习一层网络结构再逐步加深网络
from:http://www.cnblogs.com/kemaswill/p/3266026.html 1. 多层神经网络存在的问题常用的神经网络模型, 一般只包含输入层, 输出层和一个隐藏层: ...
ffmpeg tutorial01 再分析
如下图

随机推荐

Filezilla配置FTP中的坑以及出坑办法
做本科生助教,老板让配置一个FTP传资料交作业,找了一台Windows服务器捣鼓,开始按网上教程自己配置特别麻烦,何西西说用Filezilla比较方便,就去Filezilla官网下载了Filezill ...
jQuery获取table当前所在行
$("div tbody tr").click(function() { var rows = $(this).prevAll().length + 1;//行号 ...
HTML学习笔记（二）HTML格式化
很多标签都可以用来改变文本的外观,并为文本关联其隐藏的含义.总地来说,这些标签可以分成两类:基于内容的样式(content-based style)和物理样式(physical style). 一.基 ...
MySql用户配置
数据库:MySQL5.7 注意事项: MySQL5.7 mysql.user 表没有 password字段改 authentication_string: 一.前言我们在创建数据库和权限的时候才用 ...
C/C++内存检测工具Valgrind
内存检测Valgrind简介 Valgrind是运行在Linux上一套基于仿真技术的程序调试和分析工具,作者是获得过Google-O'Reilly开源大奖的Julian Seward, 它包含一个内核 ...
前端之CSS2
CSS盒子模型 CSS盒子模型介绍盒子模型解释元素在页面中显示成一个方块,类似一个盒子,CSS盒子模型就是使用现实中盒子来做比喻,帮助我们设置元素对应的样式. 盒子模型示意图如下: 把元素叫做盒子 ...
input输入框修改后自动跳到最后一个字符
<input class="m-form-control" onpaste="return false" placeholder="直播间名称& ...
Unity3D 性能优化
Unity3D 性能优化一.程序方面 01.务必删除脚本中为空或不需要的默认方法: 02.只在一个脚本中使用OnGUI方法: 03.避免在OnGUI中对变量.方法进行更新.赋值,输出变量建议在Upd ...
hoj2798 Globulous Gumdrops
Globulous Gumdrops My Tags (Edit) Source : 2008 Stanford Programming Contest Time limit : 1 se ...
HTTPS为什么更安全，请看这里
本文转载于https://foofish.net/https-story-1.html HTTPS 是建立在密码学基础之上的一种安全通信协议,严格来说是基于 HTTP 协议和 SSL/TLS 的组合. ...

rpn网络结构再分析

rpn网络结构再分析的更多相关文章

随机推荐

热门专题