Visual Tracking with Fully Convolutional Networks
http://blog.csdn.net/carrierlxksuper/article/details/48918297
传统的跟踪方法依赖低维的人工特征,但这种特征对目标的外观变化等问题不够鲁棒。
与此相比,CNN从大量的数据中能够学到高级的信息,有较强的分类能力,这些特征有较好的泛化能力。
如果直接用CNN来跟踪的话,需要大量的数据来进行训练,这显然不合适。之前有人用DNN做在线跟踪并取得了不错的效果,但这个过程中,DNN被当做黑盒子来用。这篇文章从跟踪的角度研究了CNN特征的性质,发现了两个重要的性质:
首先,不同深度的CNN特征在跟踪时有不同的性质。顶层的卷积层获得了更抽象更高级的特征,这些特征能更好的区分不同种类的物体,处理形变遮挡时也更加鲁棒。
但如果是同类物体,这些特征的区分度并不好。更低卷积层提供了更细节的局部特征,这些特征能将具有相似外观的同类物体更好的区分开来。但在物体有较大形变时不够鲁棒。基于此,本文提出自动切换高低层进行跟踪。
其次,CNN的特征是从ImageNet上提前训练来区分物体的,但对于特定的物体来说,并不是所有特征都是有用于跟踪的,有些特征会被当做noise。如果把所有的特征图都用上的话,很难将目标与背景进行区分。可以通过特征选择来丢掉noise 特征,那么该如何进行特征选择呢?
这篇论文的主要贡献有:
1)分析CNN从大规模图像分类中学到的特征,找到适用于跟踪的那些特征。这有助于更好的理解CNN特征和设计适用于跟踪的特征。
2)提出新的跟踪方法,使用两层卷积网络,可以更好的处理物体形变和区分目标与背景。
3)提出能自动选择特征的方法,提高跟踪精度。
用于跟踪的深度特征分析
分析是基于16层的VGG网络的,VGG是在ImageNet上已经训练好的。其中有13个卷积层跟着3个全连接层。
分析1 尽管CNN特征图的感受野很大,激活特征图是稀疏并且局部的,激活区域和目标区域高度相关。
从图上可以看出特征图只有少量非0值,这些非0值是位置确定的且与目标区域有关。还得到了CNN 特征的语义图,语义图表明,输入的改变,导致目标区域的所选特征图大幅增长。因此,这些特征map获得了目标的可视化描述。这就表明,DNN学到的特征是有位置的且与目标相关的,因此,CNN的特征可用于确定目标位置。
分析2 很多CNN特征是noisy,或者与将目标与背景区分无关
用ImageNet训练的CNN特征能描述大量的目标,但当跟踪时,应当只关注小部分的目标,只需将目标与背景区分即可,这就要求我们选择好的特征。
分析3 不同层编码不同的特征,高层获得目标种类的语义概念,低层编码更多的区分特征来获得内部的种类变化。
因为特征图有大量冗余,故采用一种稀疏表示框架来更好的可视化。
Visual Tracking with Fully Convolutional Networks的更多相关文章
- 论文笔记之:Visual Tracking with Fully Convolutional Networks
论文笔记之:Visual Tracking with Fully Convolutional Networks ICCV 2015 CUHK 本文利用 FCN 来做跟踪问题,但开篇就提到并非将其看做 ...
- 论文笔记:SiamRPN++: Evolution of Siamese Visual Tracking with Very Deep Networks
SiamRPN++: Evolution of Siamese Visual Tracking with Very Deep Networks 2019-04-02 12:44:36 Paper:ht ...
- 中文版 R-FCN: Object Detection via Region-based Fully Convolutional Networks
R-FCN: Object Detection via Region-based Fully Convolutional Networks 摘要 我们提出了基于区域的全卷积网络,以实现准确和高效的目标 ...
- Fully Convolutional Networks for Semantic Segmentation 译文
Fully Convolutional Networks for Semantic Segmentation 译文 Abstract Convolutional networks are powe ...
- 论文阅读(Xiang Bai——【CVPR2016】Multi-Oriented Text Detection with Fully Convolutional Networks)
Xiang Bai--[CVPR2016]Multi-Oriented Text Detection with Fully Convolutional Networks 目录 作者和相关链接 方法概括 ...
- 论文学习:Fully Convolutional Networks for Semantic Segmentation
发表于2015年这篇<Fully Convolutional Networks for Semantic Segmentation>在图像语义分割领域举足轻重. 1 CNN 与 FCN 通 ...
- 『计算机视觉』R-FCN:Object Detection via Region-based Fully Convolutional Networks
一.网络介绍 参考文章:R-FCN详解 论文地址:Object Detection via Region-based Fully Convolutional Networks R-FCN是Faster ...
- 【Semantic Segmentation】 Instance-sensitive Fully Convolutional Networks论文解析(转)
这篇文章比较简单,但还是不想写overview,转自: https://blog.csdn.net/zimenglan_sysu/article/details/52451098 另外,读这篇pape ...
- 【Detection】R-FCN: Object Detection via Region-based Fully Convolutional Networks论文分析
目录 0. Paper link 1. Overview 2. position-sensitive score maps 2.1 Background 2.2 position-sensitive ...
随机推荐
- Android性能优化:布局优化 详细解析(含<include>、<ViewStub>、<merge>讲解 )
1. 影响的性能 布局性能的好坏 主要影响 :Android应用中的页面显示速度 2. 如何影响性能 布局影响Android性能的实质:页面的测量 & 绘制时间 1个页面通过递归 完成测量 & ...
- 【bzoj1878】[SDOI2009]HH的项链
考虑非莫队的离线算法.. 若[l,r]中有重复数值很麻烦,考虑取一个数为代表(最左或最右) 1.最左:用BIT,先把所有第一个出现的数扔进去,将询问左端点升序,每次都可能产生历史的无用点,并出现新的“ ...
- WPA-PSK无线网络破解原理及过程
原文链接地址:http://www.freebuf.com/articles/wireless/58342.html 本文将主要讲讲WPA-PSK类型的无线网络安全问题,首先我们看下802.11协议相 ...
- 洛谷 P1514 引水入城 解题报告
P1514 引水入城 题目描述 在一个遥远的国度,一侧是风景秀美的湖泊,另一侧则是漫无边际的沙漠.该国的行政区划十分特殊,刚好构成一个 NN 行 \times M×M 列的矩形,如上图所示,其中每个格 ...
- 最近遇到的DISCUZ一些问题解决方法
“抱歉,您的请求来路不正确或表单验证串不符,无法提交” 打开“source\class\helper\helper_form.php”, 然后把“$_GET[‘formhash’] == formha ...
- C++ STL 一般总结(转载)
注:原博地址:http://www.cnblogs.com/biyeymyhjob/archive/2012/07/22/2603525.html 以下内容来源网上 经过整合而成 一.一般介绍 STL ...
- BNU-2017.7.3排位赛1总结
比赛链接:https://www.bnuoj.com/v3/contest_show.php?cid=9146#info A题 国际象棋棋盘,黑白相间染色. B题 最大值只取决于每个连通块的大小,一个 ...
- chrome插件控制台
在manifest.json中添加下面的几行 "background": { "scripts": ["background.js"] }, ...
- 6.UiWatcher API 详细介绍
Tip: 1.监听器不是完能的,所以若用例需要设置监听器防止用例被打断,最好把延迟时间调高一点 2.UiDevice是不会触发监听功能的 3.监听器在方法体或者循环体中是程序还是会被打断的 4.监听器 ...
- #define _INTSIZEOF(n) ((sizeof(n)+sizeof(int)-1)&~(sizeof(int) - 1) )
原文 功能: 首先,sizeof(int)肯定是2的次方数,比如32位是4,64位是8 ((sizeof(n)+sizeof(int)-1)&~(sizeof(int) - 1) ) 的意思就 ...