THOR: Tracking Holistic Object Representations

BMVC 2019 Oral

2019-08-04 10:30:09

Paperhttps://arxiv.org/pdf/1907.12920

Projecthttps://sites.google.com/view/vision-thor/

Codehttps://github.com/xl-sr/THOR

Related Papers: (利用外部记忆网络来动态更新目标模板)

1. Learning Dynamic Memory Networks for Object Tracking, Tianyu Yang, Antoni B. Chan  (ECCV), 2018, pp. 152-167, paper, code

2. Visual Tracking via Dynamic Memory Networks, Tianyu Yang and Antoni B. Chan, T-PAMI 2019, Paper, Code

3. A Memory Model based on the Siamese Network for Long-term Tracking,Lee, Hankyeol, Seokeon Choi, and Changick Kim. (ECCV Workshop). 2018.  Paper

1. Background and Motivation:

现有的基于 matching 方法的跟踪器,很多都是拿 第一帧的目标模板和后续采样的 proposal 进行匹配,从而得到相应得分,得到跟踪结果。问题是,跟踪过程中,目标是动态变化的,所以,作者就想设计一种动态的目标表达方法,来很好的建模 object template 的变化。

本文所提出的跟踪方法示意图如下所示:

2. The Proposed Method:

为了得到一个丰富的 multi-template representation 进行跟踪,本文提出一种由 long-term module (LTM) 和 short-term module(STM)构成的框架。如上图所示,跟字面意思相同,STM 适用于短期更新的模板,而 LTM 适合建模长期的外观变化(represents the tacked objects in diverse conditions, e.g. lighting, shape)。而这种用短期 feature 和 长期 feature 进行跟踪的思想,之前的工作也有探索,但是,本文还是跟他们由区别的,即:特征发现的方法以及用于跟踪的方法(the way features are found and used for tracking)。

2.1 Long-term Module:

该模块的目标是:存储具有最大多样性的跟踪结果。正式的来说, LTM 的目标是最大化由模板构成的 feature vector 的超平形体(我知道很拗口,嗯,还会看原文吧:the goal of LTM is to maximize the volume T(f1, ... fn) of the parallelotope formed by the feature vectors fi of the tempalte Ti)。在深度匹配算法中,给定 template image 的 feature vector 被当做是卷积核。孪生网络将图像映射为 feature,然后用到的卷积操作被当做是相似性度量的方法。在跟踪过程中,template kernel f1 被用于 search image 以得到最高相应的位置。所以,如果我们想要衡量两个 template 之间的相似性,我们可以计算 f1 * f2。用内存中所有的 template 来计算该相似性,我们可以构架一个 Gram matrix:

其中,G 是 n * n marix, n 通常还会比 feature space 小。G 的决定条件,称为:the Gram determinat,is the square of the n-dimensional volume T of the parallelotope constructed on f1, f2, ... fn. 所以,目标函数可以写为:

当某一个模板如果可以提升 Gram determinant,那么就考虑将其替换掉 template 集合中的对应模板。

Lower Bound

由于长期跟踪中存在 model drift 的问题,所以存贮的过程会终止。为了处理这种情况,作者在 |G| 上,设置了一种 upper bound。然而,由于找到这么一个 value 并不是很直接,所以作者考虑用 lower bound on the similarity measure between a candidate tempalte Tc and the base template T1. 新的模板需要满足如下的条件:fc * f1 > l * G11. 参数 l 可以看做是 temperature on the similarity of T1 on itself. 并且可以用于平衡 tracking performance against robustness against drift.

2.2 Short-term Module:

STM 模块的目标是处理 abrupt movements 和 partial occlusion。STM 模块遵循先进先出的方式,slots 的个数设置为固定的 Kst。作者也将 STM 中的 object representation 用于计算 diversity measure。但是,在短期模型中,这种度量方式表现并不好。所以作者计算:

即:作者将 Gram matrix 的上三角部分进行求和,然后用最大值进行归一化。该 \gamma 的范围是 [0-1],越靠近1,则 STM 中的模板越多样化。

3. Experiments:

最后作者提到了一些可以继续改善的地方:

1. Siamese Tracker 对参数很敏感,所以,本文的方法也对超参数有点敏感,毕竟是基于 Siamese Network 做的;

2. 作者也考虑将 Siamese tracker 和 THOR 进行端到端的训练。

==

THOR: Tracking Holistic Object Representations的更多相关文章

  1. Object Tracking Benchmark

    Abstract 问题: 1)evaluation is often not suffcient 2)biased for certain types of algorthms 3)datasets ...

  2. 基于粒子滤波的物体跟踪 Particle Filter Object Tracking

    Video来源地址 一直都觉得粒子滤波是个挺牛的东西,每次试图看文献都被复杂的数学符号搞得看不下去.一个偶然的机会发现了Rob Hess(http://web.engr.oregonstate.edu ...

  3. (转)Awesome Object Detection

    Awesome Object Detection 2018-08-10 09:30:40 This blog is copied from: https://github.com/amusi/awes ...

  4. ICLR 2014 International Conference on Learning Representations深度学习论文papers

    ICLR 2014 International Conference on Learning Representations Apr 14 - 16, 2014, Banff, Canada Work ...

  5. 9. A Pythonic Object

    Thanks to the Python data model, your user-defined types can behave as naturally as the built-in typ ...

  6. 计算机视觉code与软件

    Research Code A rational methodology for lossy compression - REWIC is a software-based implementatio ...

  7. cvpr2015papers

    @http://www-cs-faculty.stanford.edu/people/karpathy/cvpr2015papers/ CVPR 2015 papers (in nicer forma ...

  8. Metric Learning度量学习:**矩阵学习和图学习

    DML学习原文链接:http://blog.csdn.net/lzt1983/article/details/7884553 一篇metric learning(DML)的综述文章,对DML的意义.方 ...

  9. Self-Supervised Representation Learning

    Self-Supervised Representation Learning 2019-11-11 21:12:14  This blog is copied from: https://lilia ...

随机推荐

  1. Android canvas.save()与canvas.restore()的使用总结

    含义canvas.save(); 画布将当前的状态保存canvas.restore(); 画布取出原来所保存的状态使用 canvas.save();与canvas.restore();一般结合使用,. ...

  2. Pod和Namespace的基本介绍

    namespace资源名称空间 删除namespace资源会级联删除其所包含的所有其它资源对象    名称空间仅仅只是用来限制资源名称的作用域      并不能实现Pod的通信隔离 在名称空间下操作s ...

  3. Python爬虫系列:四、Cookie的使用

    Cookie,指某些网站为了辨别用户身份.进行session跟踪而储存在用户本地终端上的数据(通常经过加密) 比如说有些网站需要登录后才能访问某个页面,在登录之前,你想抓取某个页面内容是不允许的.那么 ...

  4. python(读取excel操作-xlrd模块)

    一.安装xlrd模块 到python官网下载http://pypi.python.org/pypi/xlrd模块安装,前提是已经安装了python 环境. 或者在cmd窗口  pip install  ...

  5. sklearn.model_selection 的train_test_split方法和参数

    train_test_split是sklearn中用于划分数据集,即将原始数据集划分成测试集和训练集两部分的函数. from sklearn.model_selection import train_ ...

  6. Linux之RHEL7root密码破解(一)

    很多时候我们都会有这样的经历,各种密码,各种复杂,忘记了怎么办???Windows的有关密码忘记了是可以通过相关的邮箱啊手机号等等是可以 找回的,那么Linux的root密码忘记了,该怎么办呢?那么接 ...

  7. C++(四十五) — 类型转换(static_cast、dynamic_cast 、const_cast、reinterpreter_cast)

     0.总结 (1)要转换的变量,转换前.转换后.转换后的结果. (2)一般情况下,避免进行类型转换. 1._static_cast(静态类型转换,int 转换为char) 格式:TYPE B = st ...

  8. ReqMan — 需求提取和协同处理工具

            ReqMan是由德国engineering method AG公司开发的一款高效的.可自由定制的需求提取和协同处理工具.ReqMan 能够将PDF.Word.Excel等格式的文档提取 ...

  9. 项目笔记---WPF之Metro风格UI(转)

    写在前面 作为新年开篇的文章,当然要选择比较“Cool”的东西来分享,这自然落到了WPF身上,WPF技术自身可塑性非常强,其强大的绘图技术以及XAML技术比WinForm而言有本质的飞跃. 切入正题, ...

  10. MySQL数据的优化方案

    一.选取最使用的字段属性 mysql可以使用的支持大数据量的存取,但是一般说来,数据库中的表越小,在它上面执行的查询也就会越快,因此在创建表的时候,为了获得更好的性能,我们可以将表中的字段的宽度尽量设 ...