meanShift的概念最早是由Fukunage[1]在1975年提出的,其最初的含义正如其名:偏移的均值向量;但随着理论的发展,meanShift的含义已经发生了很多变化。如今,我们说的meanShift算法,一般是指一个迭代的步骤,即先算出当前点的偏移均值,然后以此为新的起始点,继续移动,直到满足一定的结束条件。

  在很长一段时间内,meanShift算法都没有得到足够的重视,直到1995年另一篇重要论文的发表。Yizong Cheng在论文中[2]定义了一族核函数,使得随着样本与被偏移点的距离不同,其偏移量对均值偏移向量的贡献也不同。其次,他还设定了一个权重系数,使得不同样本点的重要性不一样,这大大扩展了meanShift的应用范围。

  2000年,Dorin Comaniciu[3]将非刚体的跟踪问题近似为一个meanShift的最优化问题,利用图像的颜色特征(直方图)使得跟踪可以实时进行(seminal paper)。2003年,对应的期刊论文[4]中,可以通过改进权重的带宽h适应尺度变化。

  在Dorin Comaniciu挖下这个大坑后,随后国内外无数研究者争相往其中灌水。以下挖掘了几篇论文作为后续研究的代表。

(1)将空间颜色直方图作为目标表观,然后在MS tracking框架下得到改进的算法。

  S.T Birchfield, Sriram Rangarajan. Spatiograms versus histograms for region-based tracking. CVPR, 2005 spatiogram, nb表示颜色(直方图)索引为b的像素数量,ub和∑b分别表示对应像素点空间分布的均值和协方差矩阵。

(2)尺度自适应。在Mean Shift跟踪中解决尺度问题一般从推导过程进入,所以这类文章的数学推导略难:

  Robert T. Collins. Mean-shift blob tracking through scale space. CVPR, 2003.

指出了seminal paper的尺度上的问题。

  Zoran Zivkovic, Ben Krose. An Em-like algorithm for color-histogram-based object tracking. CVPR, 2004.

[补充] Tomas Vojir, Jana Noskova, and Jiri Matas.Robust Scale-adaptive Mean-Shift for Tracking. SCIA 2013. (best paper) (论文几乎破纪录地在40+段视频上与TLD在内的几个Tracking-by-detection方法进行了对比,报道效果还是比较让人意外的)

(When an object becomes larger, the localization becomes poor since not all pixels belonging to the object are included in the search window and the similarity function has local maxima on parts of the object. If the object become smaller,the kernel window includes background clutter which often leads to tracking failure.)

(3)目标表观的多特征选择(这也是篇高引用的论文,很多人将它视为Online learning for tracking的开端):

   Robert T. Collins, Yanxi Liu, Marius Leordeanu.Online Selection of Discriminative Tracking Features. TPAMI, 2005.

将一种在线多特征选择机制嵌入在均值漂移跟踪方法中,利用目标颜色特征,通过在线选择的方式,在这些特征中选择那些对目标及背景可分性高的特征用于均值漂移跟踪,以适应跟踪过程中目标及背景的变化,但文中使用的多个特征是通过目标颜色分量的不同组合构造的,本质上还只是利用了目标的颜色信息。

(4)目标分块,以适应遮挡的情况:

   J. Jeyakar, R.V. Babu, K.R. Ramakrishnan. Robust object tracking with background-weighted local kernels. CVIU, 2008.

目标直方图的更新,与经典的线性加权不同,下文使用了Kalman filter对每个bin进行滤波更新:

  Peng NingSong, Yang Jie, Liu Zhi. Mean Shift blob tracking with kernel histogram filtering and hypothesis testing. Pattern Recognition Letters, 2005.

(5)目标多特征,这里推荐两篇中文文献。一类只考虑候选模板(直方图)与参考的相似度,另一类考虑与背景的鉴别性来调整特征权重(以下两篇都属于后者):

  王永忠,梁彦,赵春晖等.基于多特征自适应融合的核跟踪方法.自动化学报,  2008.

   袁广林, 薛模根,韩裕生等.基于自适应多特征融合的Mean Shift目标跟踪.计算机研究与发展, 2010.

(6)快速移动目标:

  Chunhua Shen, Brooks M.J, van den Hengel A. Fast Global Kernel Density Mode Seeking: Applications to Localization and Tracking. TIP, 2007.

   Li ShuXiao, Chang HongXing, Zhu ChengFei. Adaptive pyramid mean shift for global real-time visual tracking. Image and Vision Computing, 2010.

(7)最后,我押宝它是Mean Shift跟踪在Top期刊上的绝唱,它采用“积分直方图”(并不是那种积分直方图,你懂得)的方式克服光照等影响带来的模型漂移:

  Ido. Leichter. Mean Shift Trackers with Cross-Bin Metrics. TPAMI, 2012.

[1] Fukunaga K, Hostetler L. The estimation of the gradient of a density function, with applications in pattern recognition[J]. Information Theory, IEEE Transactions on, 1975, 21(1): 32-40.

[2] Cheng Y. Mean shift, mode seeking, and clustering[J]. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 1995, 17(8): 790-799.

[3]Comaniciu D, Ramesh V, Meer P. Real-time tracking of non-rigid objects using mean shift[C]//Computer Vision and Pattern Recognition, 2000. Proceedings. IEEE Conference on. IEEE, 2000, 2: 142-149.

[4] Dorin Comaniciu, Visvanathan Ramesh, Peter Meer.Kernel-based object tracking. TPAMI, 2003.

ms的更多相关文章

  1. ASP.NET Linux部署(2) - MS Owin + WebApi + Mono + Jexus

    ASP.NET Linux部署(2) - MS Owin + WebApi + Mono + Jexus 本文承接我的上一篇博文: ASP.NET 5 Linux部署,那篇文章主要是针对最新的ASP. ...

  2. MS SQL巡检系列——检查外键字段是否缺少索引

    前言感想:一时兴起,突然想写一个关于MS SQL的巡检系列方面的文章,因为我觉得这方面的知识分享是有价值,也是非常有意义的.一方面,很多经验不足的人,对于巡检有点茫然,不知道要从哪些方面巡检,另外一方 ...

  3. MS SQL巡检系列——检查重复索引

    前言感想:一时兴起,突然想写一个关于MS SQL的巡检系列方面的文章,因为我觉得这方面的知识分享是有价值,也是非常有意义的.一方面,很多经验不足的人,对于巡检有点茫然,不知道要从哪些方面巡检,另外一方 ...

  4. 群集中的MS DTC分布式事务协调器

    MS DTC在大多数SQL 服务器下都需要安装,若只是安装数据库引擎或Analysis 服务可不安装DTC.如果后需要使用分布式事务,则可在SQL Server群集安装完成后再安装DTC. 一.群集M ...

  5. python访问MS SqlServer(通过pyodbc)

    #!/usr/bin/env python # -*- coding: utf-8 -*- import pyodbc class MSSQL: """ 封装pyodbc ...

  6. MS SQLServer 批量附加数据库 分类: SQL Server 数据库 2015-07-13 11:12 30人阅读 评论(0) 收藏

    ************************************************************ * 标题:MS SQLServer 批量附加数据库 * 说明:请根据下面的注释 ...

  7. [MS SQL Server]SQL Server如何开启远程访问

    在日常工作中,经常需要连接到远程的MS SQL Server数据库中.当然也经常会出现下面的连接错误. 解决方法: 1. 设置数据库允许远程连接,数据库实例名-->右键--->属性---C ...

  8. Linux下使用FreeTDS访问MS SQL Server 2005数据库(包含C测试源码)

    Linux下使用FreeTDS访问MS SQL Server 2005数据库(包含C测试源码) http://blog.csdn.net/helonsy/article/details/7207497 ...

  9. MS SQL Server中数据表、视图、函数/方法、存储过程是否存在判断及创建

    前言 在操作数据库的时候经常会用到判断数据表.视图.函数/方法.存储过程是否存在,若存在,则需要删除后再重新创建.以下是MS SQL Server中的示例代码. 数据表(Table) 创建数据表的时候 ...

  10. MS SQL Server 数据库分离-SQL语句

    前言 今天在在清理数据库,是MS SQL Server,其中用到分离数据库文件.在这过程中,出现了一个小小的问题:误将数据库日志文件删除了,然后数据就打不开了,除了脱机,其他操作都报错. 数据库分离 ...

随机推荐

  1. python成长之路——第一天

    一.python版本间的差异: 1.1:2.x与3.x版本对比 version 2.x 3.x print print " "或者print()打印都可以正常输出 只能print( ...

  2. uboot中添加FIQ中断及相关问题

    本文主要说明了在uboot中添加FIQ中断时遇到的问题以及对应的解决办法. 首先交代一下项目的软硬件环境.硬件方面,使用s3c2440作为主控芯片,外接串口.网卡等设备.软件方面,主控芯片上电后运行u ...

  3. webkit内核浏览器的CSS写法

    -webkit-tap-highlight-color: transparent; Mobile上点击链接高亮的时候设置颜色为透明 -webkit-user-select: none; 设置为无法选择 ...

  4. 关于Jquery获取Table中td内的内容

    $(this).children().eq(1).text()获取的是显示的值$(this).children().eq(1).html()获取的是<td></td>之间的所有 ...

  5. c#语句 习题

    1.输入月份,日期,打印出是今年的第几天.(今年是平年) 2. 一个游戏,前20关是每一关自身的分数,21-30关每一关是10分,31-40关每一关是20分,41-49关每一关是30分,50关是100 ...

  6. Neusoft(3)增加自己的内核模块

    Linux版本 Ubuntu12.04LTS,内核版本为3.2.0-26-generic-ape 具体方法如下: 1.建立源文件,假设文件目录为path,文件名为hello.c源代码如下: #incl ...

  7. td内容过长,省略号表示

    .word{ min-width:100px; max-width:200px; overflow:hidden; white-space:nowrap; text-overflow:ellipsis ...

  8. docker pipework

    #!/bin/bash #auto install docker and Create VM #Define PATH Varablies IPADDR=`ifconfig |grep "B ...

  9. BizTalk开发系列(一) "Hello World"

    学习开发语言的时候很喜欢输出“Hello World”作为第一个程序.今天我们也在BizTalk 上创建一个简单的 "Hello World" 程序. BizTalk的时候有很多文 ...

  10. 【iCore3双核心板】【4.3寸液晶驱动板爆照!】

     [源代码完全开源,过几天连同硬件一起发布] 花了好久的时间,我们的fpga工程师才完成这液晶模块的驱动代码,其核心价值如下: 1.完全基于fpga驱动,sdram当做缓存: 2.内建双缓冲机制:方便 ...