http://blog.csdn.net/carrierlxksuper/article/details/48918297

传统的跟踪方法依赖低维的人工特征,但这种特征对目标的外观变化等问题不够鲁棒。

与此相比,CNN从大量的数据中能够学到高级的信息,有较强的分类能力,这些特征有较好的泛化能力。

如果直接用CNN来跟踪的话,需要大量的数据来进行训练,这显然不合适。之前有人用DNN做在线跟踪并取得了不错的效果,但这个过程中,DNN被当做黑盒子来用。这篇文章从跟踪的角度研究了CNN特征的性质,发现了两个重要的性质:

首先,不同深度的CNN特征在跟踪时有不同的性质。顶层的卷积层获得了更抽象更高级的特征,这些特征能更好的区分不同种类的物体,处理形变遮挡时也更加鲁棒。

但如果是同类物体,这些特征的区分度并不好。更低卷积层提供了更细节的局部特征,这些特征能将具有相似外观的同类物体更好的区分开来。但在物体有较大形变时不够鲁棒。基于此,本文提出自动切换高低层进行跟踪。

其次,CNN的特征是从ImageNet上提前训练来区分物体的,但对于特定的物体来说,并不是所有特征都是有用于跟踪的,有些特征会被当做noise。如果把所有的特征图都用上的话,很难将目标与背景进行区分。可以通过特征选择来丢掉noise 特征,那么该如何进行特征选择呢?

这篇论文的主要贡献有:

1)分析CNN从大规模图像分类中学到的特征,找到适用于跟踪的那些特征。这有助于更好的理解CNN特征和设计适用于跟踪的特征。

2)提出新的跟踪方法,使用两层卷积网络,可以更好的处理物体形变和区分目标与背景。

3)提出能自动选择特征的方法,提高跟踪精度。

用于跟踪的深度特征分析

      分析是基于16层的VGG网络的,VGG是在ImageNet上已经训练好的。其中有13个卷积层跟着3个全连接层。

分析1 尽管CNN特征图的感受野很大,激活特征图是稀疏并且局部的,激活区域和目标区域高度相关。

从图上可以看出特征图只有少量非0值,这些非0值是位置确定的且与目标区域有关。还得到了CNN 特征的语义图,语义图表明,输入的改变,导致目标区域的所选特征图大幅增长。因此,这些特征map获得了目标的可视化描述。这就表明,DNN学到的特征是有位置的且与目标相关的,因此,CNN的特征可用于确定目标位置。

分析2 很多CNN特征是noisy,或者与将目标与背景区分无关

用ImageNet训练的CNN特征能描述大量的目标,但当跟踪时,应当只关注小部分的目标,只需将目标与背景区分即可,这就要求我们选择好的特征。

分析3 不同层编码不同的特征,高层获得目标种类的语义概念,低层编码更多的区分特征来获得内部的种类变化。 

      因为特征图有大量冗余,故采用一种稀疏表示框架来更好的可视化。

Visual Tracking with Fully Convolutional Networks的更多相关文章

  1. 论文笔记之:Visual Tracking with Fully Convolutional Networks

    论文笔记之:Visual Tracking with Fully Convolutional Networks ICCV 2015  CUHK 本文利用 FCN 来做跟踪问题,但开篇就提到并非将其看做 ...

  2. 论文笔记:SiamRPN++: Evolution of Siamese Visual Tracking with Very Deep Networks

    SiamRPN++: Evolution of Siamese Visual Tracking with Very Deep Networks 2019-04-02 12:44:36 Paper:ht ...

  3. 中文版 R-FCN: Object Detection via Region-based Fully Convolutional Networks

    R-FCN: Object Detection via Region-based Fully Convolutional Networks 摘要 我们提出了基于区域的全卷积网络,以实现准确和高效的目标 ...

  4. Fully Convolutional Networks for Semantic Segmentation 译文

    Fully Convolutional Networks for Semantic Segmentation 译文 Abstract   Convolutional networks are powe ...

  5. 论文阅读(Xiang Bai——【CVPR2016】Multi-Oriented Text Detection with Fully Convolutional Networks)

    Xiang Bai--[CVPR2016]Multi-Oriented Text Detection with Fully Convolutional Networks 目录 作者和相关链接 方法概括 ...

  6. 论文学习:Fully Convolutional Networks for Semantic Segmentation

    发表于2015年这篇<Fully Convolutional Networks for Semantic Segmentation>在图像语义分割领域举足轻重. 1 CNN 与 FCN 通 ...

  7. 『计算机视觉』R-FCN:Object Detection via Region-based Fully Convolutional Networks

    一.网络介绍 参考文章:R-FCN详解 论文地址:Object Detection via Region-based Fully Convolutional Networks R-FCN是Faster ...

  8. 【Semantic Segmentation】 Instance-sensitive Fully Convolutional Networks论文解析(转)

    这篇文章比较简单,但还是不想写overview,转自: https://blog.csdn.net/zimenglan_sysu/article/details/52451098 另外,读这篇pape ...

  9. 【Detection】R-FCN: Object Detection via Region-based Fully Convolutional Networks论文分析

    目录 0. Paper link 1. Overview 2. position-sensitive score maps 2.1 Background 2.2 position-sensitive ...

随机推荐

  1. MySQL 5.5 主从复制

    MySQL 5.5 主从复制的原理.过程   分为同步复制和异步复制,实际复制架构中大部分为异步复制.复制的基本过程如下:  1).Slave上面的IO进程连接上Master,并请求从指定日志文件的指 ...

  2. 【linux】/dev/null与/dev/zero详解

    引用别人的资源,收藏: http://www.cnblogs.com/xianghang123/archive/2012/03/23/2413381.html

  3. UTF-8和GBK编码之间的区别(页面编码、数据库编码区别)以及在实际项目中的应用

    第一节:UTF-8和GBK编码概述 UTF-8 (8-bit Unicode Transformation Format) 是一种针对Unicode的可变长度字符编码,又称万国码,它包含全世界所有国家 ...

  4. winform布局 FlowLayoutPanel的控件

    http://www.cnblogs.com/moon-mountain/archive/2011/09/08/2171232.html 1.采用流布局:工具箱里边容器里有一个:FlowLayoutP ...

  5. php开启压缩gzip

    php服务的开启压缩,节省带宽 看是否开启压缩的网站 http://www.cnblogs.com/GaZeon/p/5421906.html 找到php.ini,修改下面的 ,重启php-fpm z ...

  6. [io benchmark]常用磁盘基准/压力测试工具

    Unix Disk I/O Benchmarks fio - NEW! fio is an I/O tool meant to be used both for benchmark and stres ...

  7. c++构造是否要加大括号

    笔者被这个问题困扰良久,终于下决心看个究竟.废话不多说,先上结论: 如果对象是原生类型,加大括号会保证生成对象被初始化(一般是0) 如果对象非原生类型,加大括号或者不加,效果是一样的,都会执行该类的默 ...

  8. TCP ------ 抓包分析(seq ack)

    总结: 1.ACK包可以和其他包合在一起,比如ACK包可以携带数据 2.可以接收多个数据包后,一次性给一个应答,不用每个数据包一一对应给应答 3.在通信过程中,通过接收到的包的ack值可以判断是否是上 ...

  9. discuz开发,登录次数过多,锁定解决方法

    到数据库里的表找到pre_common_failedlogin 和pre_ucenter_failedlogins清空里面的内容即可. truncate table pre_common_failed ...

  10. 正则(?is)

    Q:经常看见的正则前面的 (?i) (?s) (?m) (?is) (?im) 是什么意思?A: 称为内联匹配模式,通常用内联匹配模式代替使用枚举值RegexOptions指定的全局匹配模式,写起来更 ...