论文笔记:Chaotic Invariants of Lagrangian Particle Trajectories for Anomaly Detection in Crowded Scenes
近期在关注 crowd scene方面的东西。由于某些原因须要在crowd scene上实现 anomaly detection。所以看到了这篇论文,该论文是眼下在crowd scene中进行abnormal detection做的最好的,记录下笔记当做学习资料。
传统的 anomaly detection中,非常多突发事件监測都是基于motion information的,这样就忽略了由于appreance导致可是又没有造成 motion abnormal的情况下的漏监測。 比方卡车超重在桥上行走
传统的光流法,像素变化直方图,或者是背景差分法都非常难应用于 crowd scenes ,由于此时的背景是 dynamic的。
也有将 motion 和 appreance 结合在一起进行abnormal detection的
在crowd scene中,非常多一般的abnormal even detection方法都不能取得非常好的效果,由于crowd scene的背景是常常剧烈变化的,传统的方法不能充分检測到这样的变化。
关于Anomaly detection的,关注得不多,眼下看到的方法有以下几种:
- Social force model
- Optical flow
social force model 主流的Optical flow方法有点不同,它主要是考虑crowd scene中的Froce,因此就没有Optical flow中的遮挡问题
该论文提出的方法也是基于 Optical flow的,能够适用于 coherent and incoherent scene。创新点例如以下:
- 利用粒子轨迹对crowd scene进行建模,并提出具有代表性的trajectories 来对复杂的crowd flows进行建模
- 在 crowd context 中引入 chaotic dynamics(混沌动力学),并通过调节一系列的 chaotic invariant feature来抽取 复杂的crowd motions 信息,这能够用来进行 anomaly detection
- 提出一个概率框架来进行anomaly detection and localization
Significance of Crowd Scene Analysis
- 管理大量人群在有限空间的聚集事件
- 突发事件检測、定位以及警告
- 集群监督,公共场所监控,安全控制等等
例如以下图,是不同密集层度的集群
challenge
- 检測的人群目标密度非常大
- 有多种运动目标的密集层度,如上图
- 传统方法
- 是适合在稀疏空间
- 会受到严重遮挡,检測目标小,目标appreance相似的问题
另外,在crowd scene中,非常多一般的abnormal even detection方法都不能取得非常好的效果,由于crowd scene的背景是常常剧烈变化的,传统的方法不能充分检測到这样的变化
论文的Idea
拉格朗日质点动力学 + 混沌不变量
- 框架例如以下:
论文创新点
- 眼下唯一利用粒子轨迹聚类来对crowsed scene 进行建模
- 在 crowd context中引入混沌不变量
- 能够处理连贯和不连贯的人流
Particle Advection
当中,T T 是视频帧。WW 是视频帧的宽度, HH 是视频帧的高度
Cluster Particle Trajectories
- 原则:几条轨迹流可能仅仅是有一个单一的运动目标产生
- 方法:聚类
- step1 : 去除那些相对运动量比較少的点或轨迹。由于它们包括的运动信息比較少
- step2 : 依据轨迹流的位置信息进行K-means聚类
- 输出:聚类后的代表性轨迹流
在step1中去除点或轨迹的标准是轨迹流的方差。设定阈值 ϵ\epsilon, 去除那些方差比ϵ\epsilon小的轨迹流
var\{(X^t_w,Y^t_h)\}
轨迹流聚类后例如以下:
这些聚类后的轨迹流就是 representative trajectories。
实验结果证明,突发事件检測基本上对cluster number不敏感
Chaotic Invariants
- Representation of scenes: Representative trajectories
- To identify the scene’s dynamics in terms of the dynamics of representative trajectories: lChaotic dynamics by measurable chaotic invariants
论文中说到,运用上面提取的 representative trajectories 能够创建一个基于 Chaotic Invariants 的模型。该模型能够 handle both coherent and incoherent scenes and offer a description using only two features
也就是两个Chaotic Invariants:largest Lyapunov exponent :L 和 correlation dimension:D。
此外,为了进行 anomaly detection。还添加了feature M。代表的是轨迹流 xx 和 yy 的平均坐标 MM
对于 Chaotic Invariants。我个人不是非常懂,理解得不太好。
假设有懂得人还望指教。
Feature Set
由上面可知,本模型得到的特征集例如以下: F={L,D,M}F=\{L,D,M\}
- L: Largest Lyapunov exponent
- D: Correlation dimension
- M: Mean of representative trajectories (Only necessary for position-caused anomalies)
则求解 LL 和 DD 的步骤例如以下:
求解过程还是挺好懂的,就是先找一条轨迹流的最邻近的轨迹流组成轨迹流pairs,然后进行求解LL 和 DD
Advantages of the Algorithm
- Proven to be insensitive to the changes in time delay, embedding dimension, size of data set and to some extent noise
- Ensure L>0 for condition of chaotic analysis
计算chaotic feature 时须要的特征比較多,因此本文在轨迹中插入一些点来达到每一个事件序列都有500个点
Anomaly Detection
Definition of anomaly: Spatiotemporal change of scene/system dynamics (chaotic or/and positions)
- Global anomaly: entire change of dynamics
- Local anomaly: dynamics changes near particular spatial points
- Approach: Probabilistic model
详细方法例如以下:
首先运用GMM算法描写叙述正常场景的概率密度函数:
P(\Gamma|\Phi) = \sum^{K}_{k=1}w_kN(\Gamma;u_k,\Sigma_k)
当中:
Γ\Gamma denotes a four (or six if M features are included) dimensional set of random variables with two features for each time series in x and y
KK : 高斯元的个数
uu : 均值
Σ\Sigma : 方差
Φ\Phi : 模型參数
Model Learning
Normality model: Multi-variate GMM
- Learning by: EM + IPRA algorithm
- Principle for judging a query as normal or abnormal: Probability of the query belonging to the normality model + ML criterion
也就是。当我们用一些正常的视频序列 SS 来训练模型P(Γ|Φ)=∑Kk=1wkN(Γ;uk,Σk)P(\Gamma|\Phi) = \sum^{K}_{k=1}w_kN(\Gamma;u_k,\Sigma_k),模型的输入每一个 representative trajectories。学习得到模型參数 Φm \Phi_m 后。就能够将測试视频流输入模型,对全部的representative trajectories输出的概率求平均值。依据最大似然准则(ML)将平均值与阈值 LthresL_{thres} 比較推断測试视频是属于normal还是abnormal。
Anomaly Localization
1.计算每一个representative trajectory 对于模型的输出概率
2.定位那些比阈值LthresL_{thres}小的representative trajectory
3.依据位置信息对它们进行聚类得到多个cluster
4.去除那些包括少量trajectories的cluster
5.剩下的那些cluster就是基本的abnormal region
Experiment Results
举个栗子,以下两个图中。人工标记黄色框汇总有人站起来跳舞,其它人在鼓掌。跳舞的人就属于 abnormal 的。
(事实上仅仅给一帧的图片我看不太出)
这是实验结果。中间的图是检測到的全部的abnormal region。右边是去除那些包括少量trajectories 的cluster后的情况,基本能够定位成功
关于 GMM和EM算法的资料:
http://blog.csdn.net/u012176591/article/details/46051431
K-means聚类和EM思想
http://www.cnblogs.com/jerrylead/archive/2011/04/06/2006910.html
(EM算法)The EM Algorithm :
http://www.cnblogs.com/jerrylead/archive/2011/04/06/2006936.html
高斯混合模型(GMM) :
http://www.cnblogs.com/mindpuzzle/archive/2013/04/24/3036447.html
EM及高斯混合模型:
http://www.cnblogs.com/zhangchaoyang/articles/2624882.html
$(function () {
$('pre.prettyprint code').each(function () {
var lines = $(this).text().split('\n').length;
var $numbering = $('
$(this).addClass('has-numbering').parent().append($numbering);
for (i = 1; i ').text(i));
};
$numbering.fadeIn(1700);
});
});
论文笔记:Chaotic Invariants of Lagrangian Particle Trajectories for Anomaly Detection in Crowded Scenes的更多相关文章
- 论文笔记《Spatial Memory for Context Reasoning in Object Detection》
好久不写论文笔记了,不是没看,而是很少看到好的或者说值得记的了,今天被xinlei这篇paper炸了出来,这篇被据老大说xinlei自称idea of the year,所以看的时候还是很认真的,然后 ...
- 【论文笔记】YOLOv4: Optimal Speed and Accuracy of Object Detection
论文地址:https://arxiv.org/abs/2004.10934v1 github地址:https://github.com/AlexeyAB/darknet 摘要: 有很多特征可以提高卷积 ...
- 论文笔记之:From Facial Parts Responses to Face Detection: A Deep Learning Approach
From Facial Parts Responses to Face Detection: A Deep Learning Approach ICCV 2015 从以上两张图就可以感受到本文所提方法 ...
- 论文笔记: LSTD A Low-Shot Transfer Detector for Object Detection
背景知识: Zeroshot Learning,零次学习. 模型 对于 训练集 中 没有出现过 的 类别,能自动创造出相应的映射: X→Y. Low/Few-shot Learning.One-sho ...
- Deep Learning论文笔记之(四)CNN卷积神经网络推导和实现(转)
Deep Learning论文笔记之(四)CNN卷积神经网络推导和实现 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文, ...
- 论文笔记之:Visual Tracking with Fully Convolutional Networks
论文笔记之:Visual Tracking with Fully Convolutional Networks ICCV 2015 CUHK 本文利用 FCN 来做跟踪问题,但开篇就提到并非将其看做 ...
- Deep Learning论文笔记之(八)Deep Learning最新综述
Deep Learning论文笔记之(八)Deep Learning最新综述 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文,但老感觉看完 ...
- Twitter 新一代流处理利器——Heron 论文笔记之Heron架构
Twitter 新一代流处理利器--Heron 论文笔记之Heron架构 标签(空格分隔): Streaming-process realtime-process Heron Architecture ...
- Deep Learning论文笔记之(六)Multi-Stage多级架构分析
Deep Learning论文笔记之(六)Multi-Stage多级架构分析 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些 ...
随机推荐
- 数据结构--汉诺塔递归Java实现
/*汉诺塔递归 * 1.将编号0-N-1个圆盘,从A塔座移动到B上面 * 2.将编号N的1个圆盘,从A移动到C上面 * 3.最后将B上面的N-1个圆盘移动到C上面 * 注意:盘子的编号从上到下1-N ...
- Easy UI下拉列表默认选中(多行)与为文本框赋值
1.为单行文本框赋值 var data2 = $('#LoadArea').combobox("getData"); if (data2) { $('#id).combobox(' ...
- Python函数篇:装饰器
装饰器本质上是一个函数,该函数用来处理其他函数,它可以让其他函数在不需要修改代码的前提下增加额外的功能,装饰器的返回值也是一个函数对象.它经常用于有切面需求的场景,比如:插入日志.性能测试.事务处理. ...
- DbContext 中的 Explicit interface implementation
疑惑 前段时间一直再用Entity Framework 6,写了一些公用的方法,在这个过程中发现了DbContext实现的接口IObjectContextAdapter,可以通过这个接口访问到更底层的 ...
- 前端必须收藏的CSS3动效库!!!
现在的网站和App的设计中越来越重视用户体验,而优秀的动效则能使你的应用更具交互性,从而吸引更多用户的使用. 如果你对CSS3中定义动效还不熟练,或希望采用更加简单直接的方式在你的应用中引入动效的话, ...
- [转载] Rss 与 Feed 的概念区别
转载自http://www.chinaz.com/news/2011/0831/207961.shtml 可能很多刚刚接触博客的童鞋们,也和我一样不太了解:rss和feed概念或者说不了解rss和fe ...
- CLR设计类型之接口
写在前面的话: 写到这一节的时候,CLR设计类型就已经结束了,因为CLR要求的是有一定基础的人看的,所以我们不是从基础类型以及运算符开始的,文章从一开始就讲的是深入面向对象编程 ...
- [Egret]长按图片分享、分享图片、本地存储
egret 分享有API可以把一个显示对象树渲染成一个位图纹理,我把它赋值给 HTML 的 Image 元素,就实现了图片的显示,在微信中,通过长按图片可以分享出去.当然在其他浏览器可以保存在本地. ...
- FPGA时钟分频(转)
http://www.cnblogs.com/fpga/archive/2009/10/24/1589318.html 占空比为50%的分频 偶数分频比较简单 比如N分频,那么计数到N/2-1,然后时 ...
- 基于BroadReceiver实现获取短信内容
我朋友拜托我做一个能实现向指定号码发短信获取动态密码的一个小app,中间用到了基于监听系统通知的BroadReceiver 来实现获取有新短信并且获取新短信的内容.下面就是这个小app的实现监听部分的 ...