论文笔记:Parallel Tracking and Verifying: A Framework for Real-Time and High Accuracy Visual Tracking
Parallel Tracking and Verifying: A Framework for Real-Time and High Accuracy Visual Tracking
本文目标在于 tracking performance 和 efficiency 之间达到一种平衡。将 tracking 过程分解为两个并行但是相互协作的部分:
一个用于快速的跟踪(fast tracking);
另一个用于准确的验证(accurate verification)。
本文的 Motivation 主要是:
1. 大部分跟踪的序列,都是比较平坦简单的,但是存在有些非常具有挑战性的片段的存在,使得跟踪的结果不是非常的好。如果处理不好,还会导致跟踪的丢失。本文利用 verifiers 将进行这些关键点的处理。
2. 计算机视觉当中多线程计算已经非常普遍,特别是 SLAM。By splitting tracking and mapping into two parallel threads, PTAM (parallel tracking and mapping) [23] provides one of the most popular SLAM frameworks with many important extensions.
3. 最近快速、准确的跟踪算法提供了有效的 building blocks,并且鼓励我们去寻找组合的解决方法(呵呵了。。。)

创新点:
1. we propose to build real-time high accuracy trackers in a novel framework named parallel tracking and verifying (PTAV).
2. The key idea is : while T needs to run on every frame, V does not. As a general framework, PTAV allows the coordination between the tracker and the verifier: V checks the
tracking results provided by T and sends feedback to V; and V adjusts itself according to the feedback when necessary. By running T and V in parallel, PTAV inherits both the high
efficiency of T and the strong discriminative power of V.
========== 分割线 =========

======== 以上是 PTAV framework 的流程图,也是两个 tracker 和 verifiers 之间互相协助的过程。
PTAV Implementation:
1. Tracking 的过程就是利用了 fDSST 跟踪算法,没啥好说的;但是不同的是, the tracker in this paper,存储了所有的中间结果,since sending out last verification request to ensure fast tracing back.
2. Verifying 是采用了 Siamese network。
==>> 当从 tracking 过程中得到的跟踪结果,如果其验证得分低于一个阈值,那么 V 就认为该跟踪结果不可靠,或者说认为已经跟踪失败了。
此时,V 利用Siamese network,在进行一次检测。具体做法就是利用 region pooling layer 进行一次前传,然后得到许多候选的样本,然后从中选择最好的那个作为检测的结果:

当有了这些检测结果之后,我们在进行一次 check,确认下检测结果是否可信? 其实就是根据检测的置信度和某一阈值进行比较,如果不符合要求,就放大搜索区域,进行再一次的搜索。


============================= 算法部分完毕
实验结果:

想想真可怕,作者居然不辞劳苦的跑了四个数据集。。。
论文笔记:Parallel Tracking and Verifying: A Framework for Real-Time and High Accuracy Visual Tracking的更多相关文章
- Summary on Visual Tracking: Paper List, Benchmarks and Top Groups
Summary on Visual Tracking: Paper List, Benchmarks and Top Groups 2018-07-26 10:32:15 This blog is c ...
- 论文笔记之:Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning
论文笔记之:Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning 2017-06-06 21: ...
- Deep Reinforcement Learning for Visual Object Tracking in Videos 论文笔记
Deep Reinforcement Learning for Visual Object Tracking in Videos 论文笔记 arXiv 摘要:本文提出了一种 DRL 算法进行单目标跟踪 ...
- 论文笔记之:Visual Tracking with Fully Convolutional Networks
论文笔记之:Visual Tracking with Fully Convolutional Networks ICCV 2015 CUHK 本文利用 FCN 来做跟踪问题,但开篇就提到并非将其看做 ...
- 论文笔记: Dual Deep Network for Visual Tracking
论文笔记: Dual Deep Network for Visual Tracking 2017-10-17 21:57:08 先来看文章的流程吧 ... 可以看到,作者所总结的三个点在于: 1. ...
- Correlation Filter in Visual Tracking系列二:Fast Visual Tracking via Dense Spatio-Temporal Context Learning 论文笔记
原文再续,书接一上回.话说上一次我们讲到了Correlation Filter类 tracker的老祖宗MOSSE,那么接下来就让我们看看如何对其进一步地优化改良.这次要谈的论文是我们国内Zhang ...
- 论文笔记之:Learning Multi-Domain Convolutional Neural Networks for Visual Tracking
Learning Multi-Domain Convolutional Neural Networks for Visual Tracking CVPR 2016 本文提出了一种新的CNN 框架来处理 ...
- 论文笔记:Deeper and Wider Siamese Networks for Real-Time Visual Tracking
Deeper and Wider Siamese Networks for Real-Time Visual TrackingUpdated on 2019-04-01 16:10:37 Paper ...
- 论文笔记:Learning regression and verification networks for long-term visual tracking
Learning regression and verification networks for long-term visual tracking 2019-02-18 22:12:25 Pape ...
随机推荐
- html5-特殊符号的使用
<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8&qu ...
- Abandoned country(最小生成树+树形DP)
#include<bits/stdc++.h> using namespace std; struct node{ int u, v, w, nex; bool gone; node(){ ...
- [openjudge-动态规划]摘花生
题目描述 描述 Hello Kitty 想摘点花生送给她喜欢的米老鼠.她来到一片有网格状道路的矩形花生地(如下图),从西北角进去,东南角出来.地里每个道路的交叉点上都有种着一株花生苗,上面有若干颗花生 ...
- iframe使用
iframe是一个前端页面的内联框架(即行内框架),使用很方便, <!--嵌套子页面--> <script type="text/x-template" id=& ...
- Linux基础命令---arch
Arch Arch指令主要用于显示当前主机的硬件结构类型,我们可以看到它输出的结果有:i386.i486.mips.alpha等.此命令的适用范围:RedHat.RHEL.Ubuntu ...
- 关于js闭包之小问题大错误
闭包是 JavaScript 开发的一个关键方面:匿名函数可以访问父级作用域的变量. 如果闭包的作用域中保存着一个 HTML 元素,则该元素无法被销毁.(下面代码来自高程) 刚看到一个关于闭包自己没注 ...
- VMWare常用快捷键
VMWare常用快捷键 Ctrl-Alt-Enter 进入全屏模式 ctrl+alt+insert 退出全屏 Ctrl-Alt 返回正常(窗口)模式 Ctrl-A ...
- Django的View
一个视图函数(类),简称视图,是一个简单的Python 函数(类),它接受Web请求并且返回Web响应. 响应可以是一张网页的HTML内容,一个重定向,一个404错误,一个XML文档,或者一张图片. ...
- Spring数据库开发
Spring的数据库开发 #Spring中JDBC模板的作用 JDBC模板负责数据库资源管理和错误处理: #熟悉Spring JDBC的配置 配置数据源和jdbc模板 <?xml versio ...
- lnmp 安装redis-最全
一. 安装redis 1.下载,解压,编译 $ wget http://download.redis.io/releases/redis-3.2.8.tar.gz $ tar -xzf redis-3 ...