faster rcnn源码阅读笔记1

自己保存的源码阅读笔记哈

　　faster rcnn 的主要识别过程（粗略）　（开始填坑了）：　

　一张３通道，1600*1600图像输入中,经过特征提取网络，得到100*100*512的feature map (设定stride = 16,这是坐标计算要用的)，基于这个，生成100 * 100 * scale * aspdio 的anchor box，然后，

这个feature map 通过使用两个卷积网络分别回归目标非目标和bbox_dealta,两个，分别是rpn_objectness_predictions_with_background：（score1,socre2）,rpn_box_encodings：(dx,dy,log(dh),log(dw))六个，size和anchor box 一一对应。　至此，first stage rpn net work 基本Ｏｋ。

　然后，进入second stage ,将(dx,dy,log(dh),log(dw))　和anchor box 结合，得到的proposals 进行非极大值抑制(tf.image.non_max_suppression)，并获得Ｎ个proposals（Ｎ可以设定）,然后，使用tf.image.crop_and_resize，将proposals对应的100*100*512的feature map (resnet101,中前block3作为first stage 的feature map,block4作为second stage

的feature map ,因为坐标是normolize归一化的，所以可以在不同size的feature map 上使用)上的对应目标crop and resize 出来进入bbox 的进一步refine和目标的类别分类，firs stage 中只有识别目标非目标，但是目标是什么类别（是人，还是自行车等等）还是在second stage 这里实现的。至此，inference过程结束，在training 阶段，还有正负样本输入（iou < 0.3,iou >0.7,和between）和loss计算的细节。

在loss 计算阶段：

　first stage loss 包含两部分localization_losses、objectness_losses，这时候，就需要计算anchor box 和ground truth bbox 的iou。以iou > 0.7的为正样本，小于0.3的为负样本。得到objectness_losses，并将iou > 0.7的正样本作为match 的，和ground truth bbox 进行做差，计算,rpn_box_encodings：(dx,dy,log(dh),log(dw))对应的ground truth (batch_reg_targets 框回归的目标）

计算loss,最后面得到：

loss_dict = {
'first_stage_localization_loss':
self._first_stage_loc_loss_weight * localization_loss,
'first_stage_objectness_loss':
self._first_stage_obj_loss_weight * objectness_loss,
}

second stage loss 计算和first stage 是一样的，不一样的就是，其分类变为多分类。同样也是设定iou 阈值

loss_dict = {
'second_stage_localization_loss':
(self._second_stage_loc_loss_weight * second_stage_loc_loss),
'second_stage_classification_loss':
(self._second_stage_cls_loss_weight * second_stage_cls_loss),
}

详细见　tensorflow models object detection 源代码：

https://github.com/tensorflow/models/tree/master/research/object_detection

总共对faster rcnn做了三次笔记，第一次

faster rcnn源码阅读笔记1的更多相关文章

faster rcnn源码阅读笔记3
faster rcnn源码阅读笔记2
faster rcnn 源码学习-------数据读入及RoIDataLayer相关模块解读
参考博客:::https://www.cnblogs.com/Dzhen/p/6845852.html 非常全面的解读参考:::https://blog.csdn.net/DaVinciL/artic ...
CI框架源码阅读笔记5 基准测试 BenchMark.php
上一篇博客(CI框架源码阅读笔记4 引导文件CodeIgniter.php)中,我们已经看到:CI中核心流程的核心功能都是由不同的组件来完成的.这些组件类似于一个一个单独的模块,不同的模块完成不同的功 ...
CI框架源码阅读笔记4 引导文件CodeIgniter.php
到了这里,终于进入CI框架的核心了.既然是“引导”文件,那么就是对用户的请求.参数等做相应的导向,让用户请求和数据流按照正确的线路各就各位.例如,用户的请求url: http://you.host.c ...
CI框架源码阅读笔记3 全局函数Common.php
从本篇开始,将深入CI框架的内部,一步步去探索这个框架的实现.结构和设计. Common.php文件定义了一系列的全局函数(一般来说,全局函数具有最高的加载优先权,因此大多数的框架中BootStrap ...
CI框架源码阅读笔记2 一切的入口 index.php
上一节(CI框架源码阅读笔记1 - 环境准备.基本术语和框架流程)中,我们提到了CI框架的基本流程,这里再次贴出流程图,以备参考: 作为CI框架的入口文件,源码阅读,自然由此开始.在源码阅读的过程中, ...
源码阅读笔记 - 1 MSVC2015中的std::sort
大约寒假开始的时候我就已经把std::sort的源码阅读完毕并理解其中的做法了,到了寒假结尾,姑且把它写出来这是我的第一篇源码阅读笔记,以后会发更多的,包括算法和库实现,源码会按照我自己的代码风格格 ...
Three.js源码阅读笔记-5
Core::Ray 该类用来表示空间中的“射线”,主要用来进行碰撞检测. THREE.Ray = function ( origin, direction ) { this.origin = ( or ...

随机推荐

[cf1038E][欧拉路]
http://codeforces.com/contest/1038/problem/E E. Maximum Matching time limit per test 2 seconds memor ...
python trie
Trie 库 https://github.com/pytries/marisa-trie/blob/master/docs/tutorial.rst http://marisa-trie.readt ...
c# android 全局捕获未处理异常
[Application] public class MyApp : Application { public MyApp(IntPtr javaReference, JniHandleOwnersh ...
谈谈 ServerFul 架构
我写了一篇文章 <自己实现一个线程池> https://www.cnblogs.com/KSongKing/p/9803935.html , 其实不仅仅是线程池, 中间件层的 ...
docker push到私有仓库
1.登录 docker login http://xxxxx.com 2.登录私有hub创建项目例如项目叫:abc-dev 2.给镜像打tag docker tag 2e25d8496557 xxx ...
Excel技巧--反向查询
当要从左侧的表格,查询某人所在的部门时,那么需要逆向查询.VLOOKUP函数只能正向查询.可以使用Match和index函数: Match函数:查询某个值在指定区域所在的位置: Index函数:查询指 ...
DevExpress破解和消除弹出框问题
在解决方案管理器列表中找到 license.licx 设置属性将[生成操作]选项改为[无]
bzoj5099: [POI2018]Pionek
Description 在无限大的二维平面的原点(0,0)放置着一个棋子.你有n条可用的移动指令,每条指令可以用一个二维整数向量表示.每条指令最多只能执行一次,但你可以随意更改它们的执行顺序.棋子可 ...
[UE4]Input Key Selector
一.Input Key Selector:按键设置二.On Key Selected:按键收集完毕后触发该事件. 三.点击On Key Selected控件后,会显示“...”,表示可以接受键盘输入 ...
源码：Java集合源码之：数组与链表（一）
数组和链表是数据结构中最基本的部分. 数组在java中,数组定义为一种基本类型,其可以通过下标获取到对应位置的数据.那么这种结构的数据,在内存中是怎么存放的呢? 数组在内存中是一段连续的存储单元,每 ...

faster rcnn源码阅读笔记1

faster rcnn源码阅读笔记1的更多相关文章

随机推荐

热门专题