论文笔记:Learning regression and verification networks for long-term visual tracking
Learning regression and verification networks for long-term visual tracking
2019-02-18 22:12:25
Paper:https://arxiv.org/abs/1809.04320
Code:https://github.com/xiaobai1217/MBMD
一、文章动机:
本文是为了更好的处理长期跟踪问题,而提出一种结合 Regression 和 Classification Network 的跟踪方法。因为常规的视觉跟踪依赖于 Tracking-by-detection 框架,这种框架自带的局部搜索机制无法很好的处理快速运动,目标的完全消失等挑战性因素。所以,如何针对这些问题,设计基于全局的搜索机制是一个非常值得研究的问题。本文也采用了 Local 和 Global search 相结合的策略,来处理这一问题。
二、跟踪流程:

整体的流程图如上图所示, 主要包含 Regression Network 和 Verification Network。其中回归网络的作用主要是特征提取+候选框产生;而验证网络的作用是为了提供更好的打分依据(基于 MDNet 强大的判别能力)。
1. Regression Network:
该网络采用 SSD 检测框架以及 MobileNet 为特征提取器。两路网络共享相同的网络结构。由于 Search Region 和 Template 的大小并不一致,所以这里会有两个 feature map 输出。这两个 feature map 将会进行融合,输入到 RPN 网络中。融合的过程如下图所示:

经过 RPN 之后,再利用 NMS 进行 BBox 的筛选,得到候选框。在上述过程中,很自然的有如下的疑问:为什么要将 Template 和 Search Region 进行融合?这里作者给出的解释是:to provide the region proposal networks with representative features of the search region。相当于简单的进行了一次 Siamese FC 的操作,得到了目标物体的响应图。这样,RPN 网络更容易进行 Proposal 的生成(or 生成高质量的 Proposal)。
2. Verification Network:
有了上述产生的候选框,紧接着引入分类网络进行候选框的打分。这里就是将上述 proposal 输入到一个分类网络中,得到是前景还是背景的得分。
3. Tracking Strategy:
如果是基于 Tracking-by-detection framework,已经可以进行跟踪了,并且可以取得还不错的效果。但是,Local 的搜索机制无法很好的处理上述提到的 短暂消失等问题。所以,作者这里采用阈值控制法,即,根据是否阈值的高低,来推测当前帧是否发生了物体完全消失的情况,实现 Local search 和 Global search 的切换。Global Proposal 产生的方法也是基于滑动窗口的方式进行的。该阈值的计算方式如下(由 Regression 和 Verification 的结果共同决定):

三、实验结果:



论文笔记:Learning regression and verification networks for long-term visual tracking的更多相关文章
- 论文笔记:目标追踪-CVPR2014-Adaptive Color Attributes for Real-time Visual Tracking
基于自适应颜色属性的目标追踪 Adaptive Color Attributes for Real-Time Visual Tracking 基于自适应颜色属性的实时视觉追踪 3月讲的第一篇论文,个人 ...
- 论文笔记 — Learning to Compare Image Patches via Convolutional Neural Networks
论文: 引入论文中的一句话来说明对比图像patches的重要性,“Comparing patches across images is probably one of the most fundame ...
- 论文笔记之:Graph Attention Networks
Graph Attention Networks 2018-02-06 16:52:49 Abstract: 本文提出一种新颖的 graph attention networks (GATs), 可 ...
- 论文笔记——MobileNets(Efficient Convolutional Neural Networks for Mobile Vision Applications)
论文地址:MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications MobileNet由Go ...
- 论文笔记之:Fully-Convolutional Siamese Networks for Object Tracking
gansh Fully-Convolutional Siamese Network for Object Tracking 摘要:任意目标的跟踪问题通常是根据一个物体的外观来构建表观模型.虽然也取得了 ...
- 【论文笔记】Training Very Deep Networks - Highway Networks
目标: 怎么训练很深的神经网络 然而过深的神经网络会造成各种问题,梯度消失之类的,导致很难训练 作者利用了类似LSTM的方法,通过增加gate来控制transform前和transform后的数据的比 ...
- 论文笔记(2)-Dropout-Regularization of Neural Networks using DropConnect
这篇paper使用DropConnect来规则化神经网络.dropconnect和dropout的区别如下图所示.dropout是随机吧隐含层的输出清空,而dropconnect是input unit ...
- Learning to Track at 100 FPS with Deep Regression Networks ECCV 2016 论文笔记
Learning to Track at 100 FPS with Deep Regression Networks ECCV 2016 论文笔记 工程网页:http://davheld.git ...
- 论文笔记之:Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning
论文笔记之:Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning 2017-06-06 21: ...
随机推荐
- Java代码实现封装多级树结构对象
前言: 在开发中,我们经常见到,前端展示树状结构的,这时候就需要后端去封装一个多级树结构对象,前端根据这样结构的数据去渲染数据,这篇文章讲的是如何封装成多级树结构对象. 正文: 1.先封装个树结构的对 ...
- VUE-009-页面打开时初始化配置项内容
网页开发过程中,尤其是在表单开发过程中,不可避免的会有各种各样的基础数据需要展示,供用户使用.例如,大家在办理信用卡时,经常需要填写各种表单数据,其中:性别(男.女).学历(高中及以下.大专.本科.研 ...
- Linux基础命令2
1.修改网络状态: 1).Cd /etc/sysconfig/network-scripts/network-scripts 2).vi ifcfg-eth0 编辑 onboot=yes: 3 ...
- PyQt5之使用Qt下的designer工具将.ui文件转换成.py文件后添加什么东西后方可运行
首先证明我是加了那些鬼东西以后可以成功运行的. 然后来叙述一下我的过程. 这是一个.ui文件生成的.py文件.(把主要的内容省去了,但是没有影响结构) # -*- coding: utf-8 -*- ...
- coreseek/sphinx中的匹配模式
所谓匹配模式就是用户怎样依据keyword在索引库中查找相关的记录. SPH_MATCH_ALL, 匹配全部查询分词(默认模式); 如"手机配件".不匹配 "我有一部手机 ...
- 软件测试第二次作业:初识JUNIT单元测试方法
软件测试有很多分类,从测试的方法上可分为:黑盒测试.白盒测试.静态测试.动态测试 从软件开发的过程分为:单元测试.集成测试.确认测试.验收.回归等. 在众多的分类中,与开发人员关系最紧密的莫过于单 ...
- cocos2d-x C++ 获取网络图片缓存并展示
#ifndef __HttpGetImg__ #define __HttpGetImg__ #include "cocos2d.h" #include "HttpRequ ...
- Leetcode: The Maze II
There is a ball in a maze with empty spaces and walls. The ball can go through empty spaces by rolli ...
- 《linux就该这么学》第十四节课:第13章,部署DNS域名解析服务(bind服务)
(借鉴请改动) 第十二章收尾 12.2.nfs网络文件系统 RHEL7默认安装了nfs,配置文件在 /etc/export 写入格式:共享目录 允许的客户端(参数) ro ...
- 如何在Jenkins上配置一个可以从其它Job取回Artifact的Job
今天因为工作上的需求,需要在Jenskin上配置一个job, 它应该可以从其它所选择的Job中取回Artifact. 首先,在"构建"步骤中添加 "Copy Artifa ...