论文笔记:Learning regression and verification networks for long-term visual tracking
Learning regression and verification networks for long-term visual tracking
2019-02-18 22:12:25
Paper:https://arxiv.org/abs/1809.04320
Code:https://github.com/xiaobai1217/MBMD
一、文章动机:
本文是为了更好的处理长期跟踪问题,而提出一种结合 Regression 和 Classification Network 的跟踪方法。因为常规的视觉跟踪依赖于 Tracking-by-detection 框架,这种框架自带的局部搜索机制无法很好的处理快速运动,目标的完全消失等挑战性因素。所以,如何针对这些问题,设计基于全局的搜索机制是一个非常值得研究的问题。本文也采用了 Local 和 Global search 相结合的策略,来处理这一问题。
二、跟踪流程:

整体的流程图如上图所示, 主要包含 Regression Network 和 Verification Network。其中回归网络的作用主要是特征提取+候选框产生;而验证网络的作用是为了提供更好的打分依据(基于 MDNet 强大的判别能力)。
1. Regression Network:
该网络采用 SSD 检测框架以及 MobileNet 为特征提取器。两路网络共享相同的网络结构。由于 Search Region 和 Template 的大小并不一致,所以这里会有两个 feature map 输出。这两个 feature map 将会进行融合,输入到 RPN 网络中。融合的过程如下图所示:

经过 RPN 之后,再利用 NMS 进行 BBox 的筛选,得到候选框。在上述过程中,很自然的有如下的疑问:为什么要将 Template 和 Search Region 进行融合?这里作者给出的解释是:to provide the region proposal networks with representative features of the search region。相当于简单的进行了一次 Siamese FC 的操作,得到了目标物体的响应图。这样,RPN 网络更容易进行 Proposal 的生成(or 生成高质量的 Proposal)。
2. Verification Network:
有了上述产生的候选框,紧接着引入分类网络进行候选框的打分。这里就是将上述 proposal 输入到一个分类网络中,得到是前景还是背景的得分。
3. Tracking Strategy:
如果是基于 Tracking-by-detection framework,已经可以进行跟踪了,并且可以取得还不错的效果。但是,Local 的搜索机制无法很好的处理上述提到的 短暂消失等问题。所以,作者这里采用阈值控制法,即,根据是否阈值的高低,来推测当前帧是否发生了物体完全消失的情况,实现 Local search 和 Global search 的切换。Global Proposal 产生的方法也是基于滑动窗口的方式进行的。该阈值的计算方式如下(由 Regression 和 Verification 的结果共同决定):

三、实验结果:



论文笔记:Learning regression and verification networks for long-term visual tracking的更多相关文章
- 论文笔记:目标追踪-CVPR2014-Adaptive Color Attributes for Real-time Visual Tracking
基于自适应颜色属性的目标追踪 Adaptive Color Attributes for Real-Time Visual Tracking 基于自适应颜色属性的实时视觉追踪 3月讲的第一篇论文,个人 ...
- 论文笔记 — Learning to Compare Image Patches via Convolutional Neural Networks
论文: 引入论文中的一句话来说明对比图像patches的重要性,“Comparing patches across images is probably one of the most fundame ...
- 论文笔记之:Graph Attention Networks
Graph Attention Networks 2018-02-06 16:52:49 Abstract: 本文提出一种新颖的 graph attention networks (GATs), 可 ...
- 论文笔记——MobileNets(Efficient Convolutional Neural Networks for Mobile Vision Applications)
论文地址:MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications MobileNet由Go ...
- 论文笔记之:Fully-Convolutional Siamese Networks for Object Tracking
gansh Fully-Convolutional Siamese Network for Object Tracking 摘要:任意目标的跟踪问题通常是根据一个物体的外观来构建表观模型.虽然也取得了 ...
- 【论文笔记】Training Very Deep Networks - Highway Networks
目标: 怎么训练很深的神经网络 然而过深的神经网络会造成各种问题,梯度消失之类的,导致很难训练 作者利用了类似LSTM的方法,通过增加gate来控制transform前和transform后的数据的比 ...
- 论文笔记(2)-Dropout-Regularization of Neural Networks using DropConnect
这篇paper使用DropConnect来规则化神经网络.dropconnect和dropout的区别如下图所示.dropout是随机吧隐含层的输出清空,而dropconnect是input unit ...
- Learning to Track at 100 FPS with Deep Regression Networks ECCV 2016 论文笔记
Learning to Track at 100 FPS with Deep Regression Networks ECCV 2016 论文笔记 工程网页:http://davheld.git ...
- 论文笔记之:Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning
论文笔记之:Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning 2017-06-06 21: ...
随机推荐
- Ubuntu18.04 快速返回桌面 【快捷键】
设置->设备->键盘->窗口->隐藏窗口 :双击重置快捷键
- vue 父组件给子组件传值,子组件给父组件传值
父组件如何给子组件传值 使用props 举个例子: 子组件:fromTest.vue,父组件 app.vue fromTest.vue <template> <h2>{{tit ...
- 《图解HTTP》读书笔记(一:网络基础TCP/IP)
好书什么时候开始读都不晚.作为一个测试人员,是一定要掌握一些网络的基础知识的.希望能够边读书边在这里记录笔记,便于加深理解以及日后查阅. 一.TCP/IP协议族 计算机与网络设备要互相通信,双方必须基 ...
- spy-debugger 安装以及使用
参考链接:https://github.com/wuchangming/spy-debugger
- 【Mac】-NO.133.Mac.1 -【重置忘记macos root密码】
Style:Mac Series:Java Since:2018-09-10 End:2018-09-10 Total Hours:1 Degree Of Diffculty:5 Degree Of ...
- Extjs6 grid 导出excel功能类,支持renderer
/* grid 导出excel扩展(纯客户端,提交到后台再导的可以自己改改代码也在) 参考自 https://blog.csdn.net/tianxiaode/article/details/4596 ...
- 接口自动化框架(java)--2.接口用例POST请求,参数配置
这套框架的报告是自己封装的 Post类型的接口通常有请求参数,请求参数也是json类型,所以需要写一个类将请求参数序列化成json对象 以常见的登录接口为例 新建一个package,和postPara ...
- selenium处理元素定位到了点击无效问题
在WEB自动化测试过程中,经常会遇到这样的问题: 元素定位到了,但是点击无效?有人可能会问了,怎么判断元素定位到了,这个问题很好判断 1.给元素加高亮显示 self.driver.execute_sc ...
- C语言中格式字符串
C语言中格式字符串的一般形式为: %[标志][输出最小宽度][.精度][长度]类型, 其中方括号[]中的项为可选项. 一.类型 我们用一定的字符用以表示输出数据的类型,其格式符和意义下表所示: 字符 ...
- 007-li标签CSS水平居中垂直居中
水平居中是text-align:center垂直居中 一般是用 line-height比如你li的高度是80px 那你设置 line-height:80px 文字就垂直居中