【原创】Liu_LongPo 转载请注明出处

【CSDN】http://blog.csdn.net/llp1992

近期在关注 crowd scene方面的东西。由于某些原因须要在crowd scene上实现 anomaly detection。所以看到了这篇论文，该论文是眼下在crowd scene中进行abnormal detection做的最好的，记录下笔记当做学习资料。

传统的 anomaly detection中，非常多突发事件监測都是基于motion information的，这样就忽略了由于appreance导致可是又没有造成 motion abnormal的情况下的漏监測。比方卡车超重在桥上行走

传统的光流法，像素变化直方图，或者是背景差分法都非常难应用于 crowd scenes ，由于此时的背景是 dynamic的。

也有将 motion 和 appreance 结合在一起进行abnormal detection的

在crowd scene中，非常多一般的abnormal even detection方法都不能取得非常好的效果，由于crowd scene的背景是常常剧烈变化的，传统的方法不能充分检測到这样的变化。

关于Anomaly detection的，关注得不多，眼下看到的方法有以下几种：

Social force model
Optical flow

social force model 主流的Optical flow方法有点不同，它主要是考虑crowd scene中的Froce，因此就没有Optical flow中的遮挡问题

该论文提出的方法也是基于 Optical flow的，能够适用于 coherent and incoherent scene。创新点例如以下：

利用粒子轨迹对crowd scene进行建模，并提出具有代表性的trajectories 来对复杂的crowd flows进行建模
在 crowd context 中引入 chaotic dynamics(混沌动力学)，并通过调节一系列的 chaotic invariant feature来抽取复杂的crowd motions 信息，这能够用来进行 anomaly detection
提出一个概率框架来进行anomaly detection and localization

Significance of Crowd Scene Analysis

管理大量人群在有限空间的聚集事件
突发事件检測、定位以及警告
集群监督，公共场所监控，安全控制等等

例如以下图，是不同密集层度的集群

challenge

检測的人群目标密度非常大
有多种运动目标的密集层度，如上图
传统方法
- 是适合在稀疏空间
- 会受到严重遮挡，检測目标小，目标appreance相似的问题

另外，在crowd scene中，非常多一般的abnormal even detection方法都不能取得非常好的效果，由于crowd scene的背景是常常剧烈变化的，传统的方法不能充分检測到这样的变化

论文的Idea

拉格朗日质点动力学 + 混沌不变量

框架例如以下：

论文创新点

眼下唯一利用粒子轨迹聚类来对crowsed scene 进行建模
在 crowd context中引入混沌不变量
能够处理连贯和不连贯的人流

Particle Advection

当中，T T 是视频帧。WW 是视频帧的宽度， HH 是视频帧的高度

Cluster Particle Trajectories

原则：几条轨迹流可能仅仅是有一个单一的运动目标产生
方法：聚类
- step1 ：去除那些相对运动量比較少的点或轨迹。由于它们包括的运动信息比較少
- step2 ：依据轨迹流的位置信息进行K-means聚类
输出：聚类后的代表性轨迹流

在step1中去除点或轨迹的标准是轨迹流的方差。设定阈值 ϵ\epsilon, 去除那些方差比ϵ\epsilon小的轨迹流

var{(Xtw,Yth)}<ϵ

var\{(X^t_w,Y^t_h)\}

轨迹流聚类后例如以下：

这些聚类后的轨迹流就是 representative trajectories。

实验结果证明，突发事件检測基本上对cluster number不敏感

Chaotic Invariants

Representation of scenes: Representative trajectories
To identify the scene’s dynamics in terms of the dynamics of representative trajectories: lChaotic dynamics by measurable chaotic invariants

论文中说到，运用上面提取的 representative trajectories 能够创建一个基于 Chaotic Invariants 的模型。该模型能够 handle both coherent and incoherent scenes and offer a description using only two features

也就是两个Chaotic Invariants：largest Lyapunov exponent :L 和 correlation dimension：D。

此外，为了进行 anomaly detection。还添加了feature M。代表的是轨迹流 xx 和 yy 的平均坐标 MM

对于 Chaotic Invariants。我个人不是非常懂，理解得不太好。

假设有懂得人还望指教。

Feature Set

由上面可知，本模型得到的特征集例如以下： F={L,D,M}F=\{L,D,M\}

L: Largest Lyapunov exponent
D: Correlation dimension
M: Mean of representative trajectories (Only necessary for position-caused anomalies)

则求解 LL 和 DD 的步骤例如以下：

求解过程还是挺好懂的，就是先找一条轨迹流的最邻近的轨迹流组成轨迹流pairs，然后进行求解LL 和 DD

Advantages of the Algorithm

Proven to be insensitive to the changes in time delay, embedding dimension, size of data set and to some extent noise
Ensure L>0 for condition of chaotic analysis

计算chaotic feature 时须要的特征比較多，因此本文在轨迹中插入一些点来达到每一个事件序列都有500个点

Anomaly Detection

Definition of anomaly: Spatiotemporal change of scene/system dynamics (chaotic or/and positions)

Global anomaly: entire change of dynamics
Local anomaly: dynamics changes near particular spatial points
Approach: Probabilistic model

详细方法例如以下：

首先运用GMM算法描写叙述正常场景的概率密度函数：

P(Γ|Φ)=∑k=1KwkN(Γ;uk,Σk)

P(\Gamma|\Phi) = \sum^{K}_{k=1}w_kN(\Gamma;u_k,\Sigma_k)

当中：

Γ\Gamma denotes a four (or six if M features are included) dimensional set of random variables with two features for each time series in x and y

KK : 高斯元的个数

uu : 均值

Σ\Sigma : 方差

Φ\Phi : 模型參数

Model Learning

Normality model: Multi-variate GMM

Learning by: EM + IPRA algorithm
Principle for judging a query as normal or abnormal: Probability of the query belonging to the normality model + ML criterion

也就是。当我们用一些正常的视频序列 SS 来训练模型P(Γ|Φ)=∑Kk=1wkN(Γ;uk,Σk)P(\Gamma|\Phi) = \sum^{K}_{k=1}w_kN(\Gamma;u_k,\Sigma_k)，模型的输入每一个 representative trajectories。学习得到模型參数 Φm \Phi_m 后。就能够将測试视频流输入模型，对全部的representative trajectories输出的概率求平均值。依据最大似然准则(ML)将平均值与阈值 LthresL_{thres} 比較推断測试视频是属于normal还是abnormal。

Anomaly Localization

1.计算每一个representative trajectory 对于模型的输出概率

2.定位那些比阈值LthresL_{thres}小的representative trajectory

3.依据位置信息对它们进行聚类得到多个cluster

4.去除那些包括少量trajectories的cluster

5.剩下的那些cluster就是基本的abnormal region

Experiment Results

举个栗子，以下两个图中。人工标记黄色框汇总有人站起来跳舞，其它人在鼓掌。跳舞的人就属于 abnormal 的。

（事实上仅仅给一帧的图片我看不太出）

这是实验结果。中间的图是检測到的全部的abnormal region。右边是去除那些包括少量trajectories 的cluster后的情况，基本能够定位成功

关于 GMM和EM算法的资料：

http://blog.csdn.net/u012176591/article/details/46051431

K-means聚类和EM思想

http://www.cnblogs.com/jerrylead/archive/2011/04/06/2006910.html

（EM算法）The EM Algorithm ：

http://www.cnblogs.com/jerrylead/archive/2011/04/06/2006936.html

高斯混合模型（GMM）：

http://www.cnblogs.com/mindpuzzle/archive/2013/04/24/3036447.html

EM及高斯混合模型:

http://www.cnblogs.com/zhangchaoyang/articles/2624882.html

$(function () {
$('pre.prettyprint code').each(function () {
var lines = $(this).text().split('\n').length;
var $numbering = $('

论文笔记：Chaotic Invariants of Lagrangian Particle Trajectories for Anomaly Detection in Crowded Scenes的更多相关文章

论文笔记《Spatial Memory for Context Reasoning in Object Detection》
好久不写论文笔记了,不是没看,而是很少看到好的或者说值得记的了,今天被xinlei这篇paper炸了出来,这篇被据老大说xinlei自称idea of the year,所以看的时候还是很认真的,然后 ...
【论文笔记】YOLOv4: Optimal Speed and Accuracy of Object Detection
论文地址:https://arxiv.org/abs/2004.10934v1 github地址:https://github.com/AlexeyAB/darknet 摘要: 有很多特征可以提高卷积 ...
论文笔记之：From Facial Parts Responses to Face Detection: A Deep Learning Approach
From Facial Parts Responses to Face Detection: A Deep Learning Approach ICCV 2015 从以上两张图就可以感受到本文所提方法 ...
论文笔记： LSTD A Low-Shot Transfer Detector for Object Detection
背景知识: Zeroshot Learning,零次学习. 模型对于训练集中没有出现过的类别,能自动创造出相应的映射: X→Y. Low/Few-shot Learning.One-sho ...
Deep Learning论文笔记之（四）CNN卷积神经网络推导和实现（转）
Deep Learning论文笔记之(四)CNN卷积神经网络推导和实现 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文, ...
论文笔记之：Visual Tracking with Fully Convolutional Networks
论文笔记之:Visual Tracking with Fully Convolutional Networks ICCV 2015 CUHK 本文利用 FCN 来做跟踪问题,但开篇就提到并非将其看做 ...
Deep Learning论文笔记之（八）Deep Learning最新综述
Deep Learning论文笔记之(八)Deep Learning最新综述 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文,但老感觉看完 ...
Twitter 新一代流处理利器——Heron 论文笔记之Heron架构
Twitter 新一代流处理利器--Heron 论文笔记之Heron架构标签(空格分隔): Streaming-process realtime-process Heron Architecture ...
Deep Learning论文笔记之（六）Multi-Stage多级架构分析
Deep Learning论文笔记之(六)Multi-Stage多级架构分析 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些 ...

随机推荐

indexed database IndexedDB
Indexed Database API 目的是提供一个可供javascript存储和检索对象,并且还能进行查询,搜索等数据库操作设计为几乎完全异步,因此绝大部分操作都稍后执行,因此每次操作都应 ...
web前端vertical-align的作用及对象详解
很多程序员知道web前端技术里的vertical-align是什么意思,但是对于vertical-align到底以什么为对齐标准却一知半解,今天我们就来说说web前端vertical-align. 1 ...
Linux系列教程（二十一）——Linux的bash基本功能
上篇博客我们介绍了什么是shell,以及编写shell脚本的两种执行方式.我们知道在敲命令的时候,有很多快捷键,比如tab键能补全命令,在比如为什么我们直接敲 ll 命令能显示目录的长格式,其实这是b ...
Thrift全面介绍
官网:http://thrift.apache.org 简介 Thrift是一个软件框架,用来进行可扩展且跨语言的服务的开发.它结合了功能强大的软件堆栈和代码生成引擎,以构建在 C++, Java ...
matplotlib删除x轴
组内有个同事,有个奇怪的需求需要matplotlib删除x轴效果图如下:
打印中文dict list的各种姿势
在开发过程中,我们经常需要打印一些变量的值,便于调试.这个时候就会发现如果在dict list这些容器中,如果包含中文字符,不管是str类型,还是unicode类型,都打印不出来.如下: >&g ...
linux使用yum安装mariadb
一,安装 yum install mariadb mariadb-server 二,如何设置密码用root 进入mysql后 mysql>set password =password('你的 ...
python打包exe pyinstaller 简单使用
源由最近公司让做了一个小工具,使用python写的,写完之后要求能放在其它电脑上运行,于是就开始寻找方案; 按网上的说法 py2exe已经很久没更新了,资料也不多: 于是就采用pyinstaller ...
socket.io 入门篇（一）
本文原文地址:https://www.limitcode.com/detail/591b114bb1d4fe074099d9c9.html 前言本篇介绍使用node.js模块组件socket.io实 ...
head first python菜鸟学习笔记（第六章）
1. Python提供字典,允许有效组织数据,将数据与名关联,从而实现快速查找,而不是以数字关联. 字典是内置数据结构,允许将数据与键而不是数字关联.这样可以使内存中的数据与实际数据的结构保持一致.? ...

论文笔记：Chaotic Invariants of Lagrangian Particle Trajectories for Anomaly Detection in Crowded Scenes