Learning regression and verification networks for long-term visual tracking

2019-02-18 22:12:25

Paper:https://arxiv.org/abs/1809.04320

Code:https://github.com/xiaobai1217/MBMD

一、文章动机

本文是为了更好的处理长期跟踪问题,而提出一种结合 Regression 和 Classification Network 的跟踪方法。因为常规的视觉跟踪依赖于 Tracking-by-detection 框架,这种框架自带的局部搜索机制无法很好的处理快速运动,目标的完全消失等挑战性因素。所以,如何针对这些问题,设计基于全局的搜索机制是一个非常值得研究的问题。本文也采用了 Local 和 Global search 相结合的策略,来处理这一问题。

二、跟踪流程

整体的流程图如上图所示, 主要包含 Regression Network 和 Verification Network。其中回归网络的作用主要是特征提取+候选框产生;而验证网络的作用是为了提供更好的打分依据(基于 MDNet 强大的判别能力)。

1. Regression Network

该网络采用 SSD 检测框架以及 MobileNet 为特征提取器。两路网络共享相同的网络结构。由于 Search Region 和 Template 的大小并不一致,所以这里会有两个 feature map 输出。这两个 feature map 将会进行融合,输入到 RPN 网络中。融合的过程如下图所示:

经过 RPN 之后,再利用 NMS 进行 BBox 的筛选,得到候选框。在上述过程中,很自然的有如下的疑问:为什么要将 Template 和 Search Region 进行融合?这里作者给出的解释是:to provide the region proposal networks with representative features of the search region。相当于简单的进行了一次 Siamese FC 的操作,得到了目标物体的响应图。这样,RPN 网络更容易进行 Proposal 的生成(or 生成高质量的 Proposal)。

2. Verification Network

有了上述产生的候选框,紧接着引入分类网络进行候选框的打分。这里就是将上述 proposal 输入到一个分类网络中,得到是前景还是背景的得分。

3. Tracking Strategy

如果是基于 Tracking-by-detection framework,已经可以进行跟踪了,并且可以取得还不错的效果。但是,Local 的搜索机制无法很好的处理上述提到的 短暂消失等问题。所以,作者这里采用阈值控制法,即,根据是否阈值的高低,来推测当前帧是否发生了物体完全消失的情况,实现 Local search 和 Global search 的切换。Global Proposal 产生的方法也是基于滑动窗口的方式进行的。该阈值的计算方式如下(由 Regression 和 Verification 的结果共同决定):

三、实验结果

四、总结:
本文针对 Long-term Tracking 设计的思路,但是短暂消失,物体的突变等因素引起的问题,在常规的 Visual Tracking 中也是存在的。而且,文章采用了较为粗暴的滑动窗口的方式进行 Global Proposal 的产生,这可能导致在多个相似目标出现时,导致跟踪失败。因为此时的 BBox 可能就跑到其他类似物体上去了。这也是跟踪算法与真正的智能跟踪算法最具有差异性的地方。如何提取更加高质量的 Proposal,请参考我们最新提出的目标驱动的全局搜索方法:Describe and Attend to Track: Learning Natural Language guided Structural Representation and Visual Attention for Object Tracking

论文笔记:Learning regression and verification networks for long-term visual tracking的更多相关文章

  1. 论文笔记:目标追踪-CVPR2014-Adaptive Color Attributes for Real-time Visual Tracking

    基于自适应颜色属性的目标追踪 Adaptive Color Attributes for Real-Time Visual Tracking 基于自适应颜色属性的实时视觉追踪 3月讲的第一篇论文,个人 ...

  2. 论文笔记 — Learning to Compare Image Patches via Convolutional Neural Networks

    论文: 引入论文中的一句话来说明对比图像patches的重要性,“Comparing patches across images is probably one of the most fundame ...

  3. 论文笔记之:Graph Attention Networks

    Graph Attention Networks 2018-02-06  16:52:49 Abstract: 本文提出一种新颖的 graph attention networks (GATs), 可 ...

  4. 论文笔记——MobileNets(Efficient Convolutional Neural Networks for Mobile Vision Applications)

    论文地址:MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications MobileNet由Go ...

  5. 论文笔记之:Fully-Convolutional Siamese Networks for Object Tracking

    gansh Fully-Convolutional Siamese Network for Object Tracking 摘要:任意目标的跟踪问题通常是根据一个物体的外观来构建表观模型.虽然也取得了 ...

  6. 【论文笔记】Training Very Deep Networks - Highway Networks

    目标: 怎么训练很深的神经网络 然而过深的神经网络会造成各种问题,梯度消失之类的,导致很难训练 作者利用了类似LSTM的方法,通过增加gate来控制transform前和transform后的数据的比 ...

  7. 论文笔记(2)-Dropout-Regularization of Neural Networks using DropConnect

    这篇paper使用DropConnect来规则化神经网络.dropconnect和dropout的区别如下图所示.dropout是随机吧隐含层的输出清空,而dropconnect是input unit ...

  8. Learning to Track at 100 FPS with Deep Regression Networks ECCV 2016 论文笔记

    Learning to Track at 100 FPS with Deep Regression Networks   ECCV 2016  论文笔记 工程网页:http://davheld.git ...

  9. 论文笔记之:Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning

    论文笔记之:Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning  2017-06-06  21: ...

随机推荐

  1. Java代码实现封装多级树结构对象

    前言: 在开发中,我们经常见到,前端展示树状结构的,这时候就需要后端去封装一个多级树结构对象,前端根据这样结构的数据去渲染数据,这篇文章讲的是如何封装成多级树结构对象. 正文: 1.先封装个树结构的对 ...

  2. VUE-009-页面打开时初始化配置项内容

    网页开发过程中,尤其是在表单开发过程中,不可避免的会有各种各样的基础数据需要展示,供用户使用.例如,大家在办理信用卡时,经常需要填写各种表单数据,其中:性别(男.女).学历(高中及以下.大专.本科.研 ...

  3. Linux基础命令2

    1.修改网络状态: 1).Cd  /etc/sysconfig/network-scripts/network-scripts 2).vi ifcfg-eth0   编辑  onboot=yes: 3 ...

  4. PyQt5之使用Qt下的designer工具将.ui文件转换成.py文件后添加什么东西后方可运行

    首先证明我是加了那些鬼东西以后可以成功运行的. 然后来叙述一下我的过程. 这是一个.ui文件生成的.py文件.(把主要的内容省去了,但是没有影响结构) # -*- coding: utf-8 -*- ...

  5. coreseek/sphinx中的匹配模式

    所谓匹配模式就是用户怎样依据keyword在索引库中查找相关的记录. SPH_MATCH_ALL, 匹配全部查询分词(默认模式); 如"手机配件".不匹配 "我有一部手机 ...

  6. 软件测试第二次作业:初识JUNIT单元测试方法

    软件测试有很多分类,从测试的方法上可分为:黑盒测试.白盒测试.静态测试.动态测试   从软件开发的过程分为:单元测试.集成测试.确认测试.验收.回归等. 在众多的分类中,与开发人员关系最紧密的莫过于单 ...

  7. cocos2d-x C++ 获取网络图片缓存并展示

    #ifndef __HttpGetImg__ #define __HttpGetImg__ #include "cocos2d.h" #include "HttpRequ ...

  8. Leetcode: The Maze II

    There is a ball in a maze with empty spaces and walls. The ball can go through empty spaces by rolli ...

  9. 《linux就该这么学》第十四节课:第13章,部署DNS域名解析服务(bind服务)

    (借鉴请改动)  第十二章收尾  12.2.nfs网络文件系统 RHEL7默认安装了nfs,配置文件在  /etc/export  写入格式:共享目录    允许的客户端(参数)  ro        ...

  10. 如何在Jenkins上配置一个可以从其它Job取回Artifact的Job

    今天因为工作上的需求,需要在Jenskin上配置一个job, 它应该可以从其它所选择的Job中取回Artifact. 首先,在"构建"步骤中添加 "Copy Artifa ...