论文笔记:Siamese Cascaded Region Proposal Networks for Real-Time Visual Tracking
Siamese Cascaded Region Proposal Networks for Real-Time Visual Tracking
2019-03-20 16:45:23
Paper:https://arxiv.org/pdf/1812.06148.pdf
Code:(尚无)
背景与动机:
本文提出一种级联的 RPN 网络结合到 Siamese RPN 网络中,然后取得了更好的跟踪效果。本文的动机如下:
1). 正负样本的比例,不一致,导致 Siamese Network 的训练不够有效;大部分的负样本都是简单样本,对最终的结果贡献很小,所以,在出现相似物体的时候,经常会出现跟踪混淆;
2). Low-level spatial features 并没有充分的被探索;
3). One-stage Siamese RPN 采用 单个回归器进行物体的定位,但是实际上并没有很好的处理跟踪中物体的尺寸变换的问题。利用预先定义好的 Coarse anchor Box 不能很好的进行精确的定位;
于是,根据上述动机,作者引入 多级的 RPN 网络,来解决定位问题;同时选择 hard negative samples 来改善网络的鲁棒性。此外,作者还引入了多层特征的融合,得到了更好的特征表达。

网络结构:
1. Siamese-RPN 的简介:

详见其原始 paper:High performance visual tracking with siamese region proposal network
2. Cascaded RPN:
前人的方法大部分都忽略了 class imbalance 的问题,导致在出现相似性物体的时候,效果不佳。此外,他们也仅用 high-level semantic features 来进行跟踪,而很少考虑 multi-level feature。为了解决上述这两个问题,本文提出多阶段的跟踪方法,细节如下:
对于每一个阶段的 RPN,其利用 FTB 模块来融合来自第 l 个 convolutional layer 的特征 以及 high-level feature,融合后的特征可以用下面的公式进行表达:

其中 FTB 代表如下图所示的多特征融合模块。主要是对较低分辨率的图像利用 Deconvlutional layer 进行升分辨率处理,得到的特征卷积后,与另外一支进行元素集相加(element-wise summarize)得到最终的结果,细节见图 6。

对于,RPN-1 来说,
所以,stage l 中每一个 anchor 的分类得分 和 回归的偏执,计算如下:

我们用 Al 表示在阶段 l 的 anchor set。根据分类的得分,我们可以过滤出该集合中的样本,当其 negative confidence 大于预先设定的阈值时。然后,剩下的那些样本就构成了新的 anchor 集合 Al+1,并且用于训练 RPNl+1。此外,为了提供更好的初始化,我们优化了 Al+1 中 anchor 的 center location 以及 size,所以,产生了更加准确的定位。作者也提供了一个案例,来表明 BBox 的准确性提升。

RPNl 的损失函数 $L_{RPN_l}$ 包含分类损失 $L_{cls}$ 以及 回归损失 $L_{loc}$,其定义如下:

其中,$r_i^{l*}$ 表示 anchor i 和 gt 之间的真实距离。服从前人工作,作者也将 $r_i^{l*}$ 设置为 4d 的向量,如下所示:

其中,x, y, w, h 是 BBox 的中心点 及其 宽高。与常规的固定 anchor 不同,C-RPN 的 anchors 可以进行微调:

对于第一个阶段的 anchor,$x_a^1, y_a^1, w_a^1, h_a^1$ 是预先设定的。
【注】此处关于损失函数讲的不是特别清晰,关于回归损失函数的定义,可以参考 Faster RCNN。
上述过程构成了所提出的级联 RPN。其最终的损失函数 $L_{CRPN}$ 就是各个 RPN 损失函数的和:


实验结果:




==
论文笔记:Siamese Cascaded Region Proposal Networks for Real-Time Visual Tracking的更多相关文章
- 论文笔记:目标追踪-CVPR2014-Adaptive Color Attributes for Real-time Visual Tracking
基于自适应颜色属性的目标追踪 Adaptive Color Attributes for Real-Time Visual Tracking 基于自适应颜色属性的实时视觉追踪 3月讲的第一篇论文,个人 ...
- 论文阅读笔记二十七:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks(CVPR 2016)
论文源址:https://arxiv.org/abs/1506.01497 tensorflow代码:https://github.com/endernewton/tf-faster-rcnn 室友对 ...
- [论文理解] Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 简介 Faster R-CNN是很经典的t ...
- 深度学习论文翻译解析(十三):Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
论文标题:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 标题翻译:基于区域提议(Regi ...
- Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks论文理解
一.创新点和解决的问题 创新点 设计Region Proposal Networks[RPN],利用CNN卷积操作后的特征图生成region proposals,代替了Selective Search ...
- 目标检测(四)Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
作者:Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun SPPnet.Fast R-CNN等目标检测算法已经大幅降低了目标检测网络的运行时间. ...
- 中文版 Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 摘要 最先进的目标检测网络依靠区域提出算法 ...
- Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks(理解)
0 - 背景 R-CNN中检测步骤分成很多步骤,fast-RCNN便基于此进行改进,将region proposals的特征提取融合成共享卷积层问题,但是,fast-RCNN仍然采用了selectiv ...
- Faster RCNN原理分析(二):Region Proposal Networks详解
Faster RCNN原理分析(二):Region Proposal Networks详解 http://lib.csdn.net/article/deeplearning/61641 0814: A ...
随机推荐
- windows android ndk的某些编译工具报错乱码0x5 或拒绝访问05
在IDEA或者AndroidStudio的快捷方式上右键属性 > 兼容性 > 以管理员身份运行 解决问题.
- 使用tortoisegit工具git地址中带号码密码的拉取,以及使用这种方式后中途重置密码报git remote: HTTP Basic: Access denied 错误解决办法
1. 在拉取git项目时可以在地址中直接指定号码密码如下就可以直接拉取下来 https://username:password@github.com 需要注意,因为在解析地址时是以@符号作为地址信 ...
- sessionStorage 前端HTML5会话管理
sessionStorage 是在HTML5中新增的一个会话存储对象,sessionStorage 用于临时保存同一窗口(或标签页)的数据,在关闭窗口或标签页之后将会删除这些数据.. 提示: 如果你想 ...
- Tomcat配置技巧
1. 配置系统管理(Admin Web Application) 大多数商业化的J2EE服务器都提供一个功能强大的管理界面,且大都采用易于理解的Web应用界面.Tomcat按照自己的方式,同样提供一个 ...
- 利用FPN构建Faster R-CNN检测
FPN就是所谓的金字塔结构的检测器,(Feature Pyramid Network) 把FPN融合到Faster rcnn中能够很大程度增加检测器对全图信息的认知, 步骤如图所示: 1.先将图像送入 ...
- 常用SQL语法
1.替換A表中B字段中第二个字符 ,), 2.根据 Score 字段 排序 并分页 * from (select row_number() over(order by Score DESC) as r ...
- SSM框架和SSH框架的区别
SSH和SSM定义 SSH 通常指的是 Struts2 做控制器(controller),spring 管理各层的组件,hibernate 负责持久化层. SSM 则指的是 SpringMVC 做控制 ...
- [小程序] 微信小程序 picker 中range-key中必须带单引号
原文地址:http://blog.csdn.net/u012329294/article/details/74906504 <view class="section"> ...
- 零门槛,包教会。让你在5分钟内使用以太坊ERC20智能合约发行属于自己的空气币
前言 目前区块链是互联网中最最火的风口,没有之一.我周围的很多朋友也加入了“炒币”行列,但很不幸,几乎都被“割韭菜”了.而经过我的几天研究,发现,如果自己要发行一种空气币,简直太简单了.只需要下面几个 ...
- Android-Gradle(三)
依赖管理是Gradle最闪耀的地方,最好的情景是,你仅仅只需添加一行代码在你的build文件,Gradle会自动从远程仓库为你下载相关的jar包,并且保证你能够正确使用它们.Gradle甚至可以为你做 ...