[转]运动检测(前景检测)之(二)混合高斯模型GMM
转自:http://blog.csdn.net/zouxy09/article/details/9622401
因为监控发展的需求,目前前景检测的研究还是很多的,也出现了很多新的方法和思路。个人了解的大概概括为以下一些:
帧差、背景减除(GMM、CodeBook、 SOBS、 SACON、 VIBE、 W4、多帧平均……)、光流(稀疏光流、稠密光流)、运动竞争(Motion Competition)、运动模版(运动历史图像)、时间熵……等等。如果加上他们的改进版,那就是很大的一个家族了。
对于上一些方法的一点简单的对比分析可以参考下:
http://www.cnblogs.com/ronny/archive/2012/04/12/2444053.html
至于哪个最好,看使用环境吧,各有千秋,有一些适用的情况更多,有一些在某些情况下表现更好。这些都需要针对自己的使用情况作测试确定的。呵呵。
推荐一个牛逼的库:http://code.google.com/p/bgslibrary/里面包含了各种背景减除的方法,可以让自己少做很多力气活。
还有王先荣博客上存在不少的分析:
http://www.cnblogs.com/xrwang/archive/2010/02/21/ForegroundDetection.html
下面的博客上转载王先荣的上面几篇,然后加上自己分析了两篇:
本文主要关注其中的一种背景减除方法:GMM。tornadomeet的博客上对ViBe进行了分析,我这里就不再啰嗦了,具体的理论分析可以参考:
http://www.cnblogs.com/tornadomeet/archive/2012/06/02/2531565.html
里面有了GMM的代码,并有了详细的注释。我之前根据这个代码(在这里,非常感谢tornadomeet)改写了一个Mat格式的版本,现在发上来和大家交流,具体如下:(在VS2010+OpenCV2.4.2中测试通过)。(当然了,OpenCV也已经提供了MOG的背景减除方法)
MOG_BGS.h
- #pragma once
- #include <iostream>
- #include "opencv2/opencv.hpp"
- using namespace cv;
- using namespace std;
- //定义gmm模型用到的变量
- #define GMM_MAX_COMPONT 6 //每个GMM最多的高斯模型个数
- #define GMM_LEARN_ALPHA 0.005
- #define GMM_THRESHOD_SUMW 0.7
- #define TRAIN_FRAMES 60 // 对前 TRAIN_FRAMES 帧建模
- class MOG_BGS
- {
- public:
- MOG_BGS(void);
- ~MOG_BGS(void);
- void init(const Mat _image);
- void processFirstFrame(const Mat _image);
- void trainGMM(const Mat _image);
- void getFitNum(const Mat _image);
- void testGMM(const Mat _image);
- Mat getMask(void){return m_mask;};
- private:
- Mat m_weight[GMM_MAX_COMPONT]; //权值
- Mat m_mean[GMM_MAX_COMPONT]; //均值
- Mat m_sigma[GMM_MAX_COMPONT]; //方差
- Mat m_mask;
- Mat m_fit_num;
- };
MOG_BGS.cpp
- #include "MOG_BGS.h"
- MOG_BGS::MOG_BGS(void)
- {
- }
- MOG_BGS::~MOG_BGS(void)
- {
- }
- // 全部初始化为0
- void MOG_BGS::init(const Mat _image)
- {
- /****initialization the three parameters ****/
- for(int i = 0; i < GMM_MAX_COMPONT; i++)
- {
- m_weight[i] = Mat::zeros(_image.size(), CV_32FC1);
- m_mean[i] = Mat::zeros(_image.size(), CV_8UC1);
- m_sigma[i] = Mat::zeros(_image.size(), CV_32FC1);
- }
- m_mask = Mat::zeros(_image.size(),CV_8UC1);
- m_fit_num = Mat::ones(_image.size(),CV_8UC1);
- }
- //gmm第一帧初始化函数实现
- //捕获到第一帧时对高斯分布进行初始化.主要包括对每个高斯分布的权值、期望和方差赋初值.
- //其中第一个高斯分布的权值为1,期望为第一个像素数据.其余高斯分布权值为0,期望为0.
- //每个高斯分布都被赋予适当的相等的初始方差 15
- void MOG_BGS::processFirstFrame(const Mat _image)
- {
- for(int i = 0; i < GMM_MAX_COMPONT; i++)
- {
- if (i == 0)
- {
- m_weight[i].setTo(1.0);
- _image.copyTo(m_mean[i]);
- m_sigma[i].setTo(15.0);
- }
- else
- {
- m_weight[i].setTo(0.0);
- m_mean[i].setTo(0);
- m_sigma[i].setTo(15.0);
- }
- }
- }
- // 通过新的帧来训练GMM
- void MOG_BGS::trainGMM(const Mat _image)
- {
- for(int i = 0; i < _image.rows; i++)
- {
- for(int j = 0; j < _image.cols; j++)
- {
- int num_fit = 0;
- /**************************** Update parameters Start ******************************************/
- for(int k = 0 ; k < GMM_MAX_COMPONT; k++)
- {
- int delm = abs(_image.at<uchar>(i, j) - m_mean[k].at<uchar>(i, j));
- long dist = delm * delm;
- // 判断是否匹配:采样值与高斯分布的均值的距离小于3倍方差(表示匹配)
- if( dist < 3.0 * m_sigma[k].at<float>(i, j))
- {
- // 如果匹配
- /****update the weight****/
- m_weight[k].at<float>(i, j) += GMM_LEARN_ALPHA * (1 - m_weight[k].at<float>(i, j));
- /****update the average****/
- m_mean[k].at<uchar>(i, j) += (GMM_LEARN_ALPHA / m_weight[k].at<uchar>(i, j)) * delm;
- /****update the variance****/
- m_sigma[k].at<float>(i, j) += (GMM_LEARN_ALPHA / m_weight[k].at<float>(i, j)) * (dist - m_sigma[k].at<float>(i, j));
- }
- else
- {
- // 如果不匹配。则该该高斯模型的权值变小
- m_weight[k].at<float>(i, j) += GMM_LEARN_ALPHA * (0 - m_weight[k].at<float>(i, j));
- num_fit++; // 不匹配的模型个数
- }
- }
- /**************************** Update parameters End ******************************************/
- /*********************** Sort Gaussian component by 'weight / sigma' Start ****************************/
- //对gmm各个高斯进行排序,从大到小排序,排序依据为 weight / sigma
- for(int kk = 0; kk < GMM_MAX_COMPONT; kk++)
- {
- for(int rr=kk; rr< GMM_MAX_COMPONT; rr++)
- {
- if(m_weight[rr].at<float>(i, j)/m_sigma[rr].at<float>(i, j) > m_weight[kk].at<float>(i, j)/m_sigma[kk].at<float>(i, j))
- {
- //权值交换
- float temp_weight = m_weight[rr].at<float>(i, j);
- m_weight[rr].at<float>(i, j) = m_weight[kk].at<float>(i, j);
- m_weight[kk].at<float>(i, j) = temp_weight;
- //均值交换
- uchar temp_mean = m_mean[rr].at<uchar>(i, j);
- m_mean[rr].at<uchar>(i, j) = m_mean[kk].at<uchar>(i, j);
- m_mean[kk].at<uchar>(i, j) = temp_mean;
- //方差交换
- float temp_sigma = m_sigma[rr].at<float>(i, j);
- m_sigma[rr].at<float>(i, j) = m_sigma[kk].at<float>(i, j);
- m_sigma[kk].at<float>(i, j) = temp_sigma;
- }
- }
- }
- /*********************** Sort Gaussian model by 'weight / sigma' End ****************************/
- /*********************** Create new Gaussian component Start ****************************/
- if(num_fit == GMM_MAX_COMPONT && 0 == m_weight[GMM_MAX_COMPONT - 1].at<float>(i, j))
- {
- //if there is no exit component fit,then start a new component
- //当有新值出现的时候,若目前分布个数小于M,新添一个分布,以新采样值作为均值,并赋予较大方差和较小权值
- for(int k = 0 ; k < GMM_MAX_COMPONT; k++)
- {
- if(0 == m_weight[k].at<float>(i, j))
- {
- m_weight[k].at<float>(i, j) = GMM_LEARN_ALPHA;
- m_mean[k].at<uchar>(i, j) = _image.at<uchar>(i, j);
- m_sigma[k].at<float>(i, j) = 15.0;
- //normalization the weight,let they sum to 1
- for(int q = 0; q < GMM_MAX_COMPONT && q != k; q++)
- {
- //对其他的高斯模型的权值进行更新,保持权值和为1
- /****update the other unfit's weight,u and sigma remain unchanged****/
- m_weight[q].at<float>(i, j) *= (1 - GMM_LEARN_ALPHA);
- }
- break; //找到第一个权值不为0的即可
- }
- }
- }
- else if(num_fit == GMM_MAX_COMPONT && m_weight[GMM_MAX_COMPONT -1].at<float>(i, j) != 0)
- {
- //如果GMM_MAX_COMPONT都曾经赋值过,则用新来的高斯代替权值最弱的高斯,权值不变,只更新均值和方差
- m_mean[GMM_MAX_COMPONT-1].at<uchar>(i, j) = _image.at<uchar>(i, j);
- m_sigma[GMM_MAX_COMPONT-1].at<float>(i, j) = 15.0;
- }
- /*********************** Create new Gaussian component End ****************************/
- }
- }
- }
- //对输入图像每个像素gmm选择合适的高斯分量个数
- //排序后最有可能是背景分布的排在最前面,较小可能的短暂的分布趋向于末端.我们将排序后的前fit_num个分布选为背景模型;
- //在排过序的分布中,累积概率超过GMM_THRESHOD_SUMW的前fit_num个分布被当作背景模型,剩余的其它分布被当作前景模型.
- void MOG_BGS::getFitNum(const Mat _image)
- {
- for(int i = 0; i < _image.rows; i++)
- {
- for(int j = 0; j < _image.cols; j++)
- {
- float sum_w = 0.0; //重新赋值为0,给下一个像素做累积
- for(uchar k = 0; k < GMM_MAX_COMPONT; k++)
- {
- sum_w += m_weight[k].at<float>(i, j);
- if(sum_w >= GMM_THRESHOD_SUMW) //如果这里THRESHOD_SUMW=0.6的话,那么得到的高斯数目都为1,因为每个像素都有一个权值接近1
- {
- m_fit_num.at<uchar>(i, j) = k + 1;
- break;
- }
- }
- }
- }
- }
- //gmm测试函数的实现
- void MOG_BGS::testGMM(const Mat _image)
- {
- for(int i = 0; i < _image.rows; i++)
- {
- for(int j = 0; j < _image.cols; j++)
- {
- int k = 0;
- for( ; k < m_fit_num.at<uchar>(i, j); k++)
- {
- if(abs(_image.at<uchar>(i, j) - m_mean[k].at<uchar>(i, j)) < (uchar)( 2.5 * m_sigma[k].at<float>(i, j)))
- {
- m_mask.at<uchar>(i, j) = 0;
- break;
- }
- }
- if(k == m_fit_num.at<uchar>(i, j))
- {
- m_mask.at<uchar>(i, j) = 255;
- }
- }
- }
- }
Main.cpp
- // This is based on the "An Improved Adaptive Background Mixture Model for
- // Real-time Tracking with Shadow Detection" by P. KaewTraKulPong and R. Bowden
- // Author : zouxy
- // Date : 2013-4-13
- // HomePage : http://blog.csdn.net/zouxy09
- // Email : zouxy09@qq.com
- #include "opencv2/opencv.hpp"
- #include "MOG_BGS.h"
- #include <iostream>
- #include <cstdio>
- using namespace cv;
- using namespace std;
- int main(int argc, char* argv[])
- {
- Mat frame, gray, mask;
- VideoCapture capture;
- capture.open("video.avi");
- if (!capture.isOpened())
- {
- cout<<"No camera or video input!\n"<<endl;
- return -1;
- }
- MOG_BGS Mog_Bgs;
- int count = 0;
- while (1)
- {
- count++;
- capture >> frame;
- if (frame.empty())
- break;
- cvtColor(frame, gray, CV_RGB2GRAY);
- if (count == 1)
- {
- Mog_Bgs.init(gray);
- Mog_Bgs.processFirstFrame(gray);
- cout<<" Using "<<TRAIN_FRAMES<<" frames to training GMM..."<<endl;
- }
- else if (count < TRAIN_FRAMES)
- {
- Mog_Bgs.trainGMM(gray);
- }
- else if (count == TRAIN_FRAMES)
- {
- Mog_Bgs.getFitNum(gray);
- cout<<" Training GMM complete!"<<endl;
- }
- else
- {
- Mog_Bgs.testGMM(gray);
- mask = Mog_Bgs.getMask();
- morphologyEx(mask, mask, MORPH_OPEN, Mat());
- erode(mask, mask, Mat(7, 7, CV_8UC1), Point(-1, -1)); // You can use Mat(5, 5, CV_8UC1) here for less distortion
- dilate(mask, mask, Mat(7, 7, CV_8UC1), Point(-1, -1));
- imshow("mask", mask);
- }
- imshow("input", frame);
- if ( cvWaitKey(10) == 'q' )
- break;
- }
- return 0;
- }
[转]运动检测(前景检测)之(二)混合高斯模型GMM的更多相关文章
- 运动检测(前景检测)之(二)混合高斯模型GMM
运动检测(前景检测)之(二)混合高斯模型GMM zouxy09@qq.com http://blog.csdn.net/zouxy09 因为监控发展的需求,目前前景检测的研究还是很多的,也出现了很多新 ...
- PRML读书会第九章 Mixture Models and EM(Kmeans,混合高斯模型,Expectation Maximization)
主讲人 网络上的尼采 (新浪微博: @Nietzsche_复杂网络机器学习) 网络上的尼采(813394698) 9:10:56 今天的主要内容有k-means.混合高斯模型. EM算法.对于k-me ...
- Opencv混合高斯模型前景分离
#include "stdio.h" #include "string.h" #include "iostream" #include &q ...
- [zz] 混合高斯模型 Gaussian Mixture Model
聚类(1)——混合高斯模型 Gaussian Mixture Model http://blog.csdn.net/jwh_bupt/article/details/7663885 聚类系列: 聚类( ...
- OpenCV混合高斯模型函数注释说明
OpenCV混合高斯模型函数注释说明 一.cvaux.h #define CV_BGFG_MOG_MAX_NGAUSSIANS 500 //高斯背景检测算法的默认参数设置 #define CV_BGF ...
- 混合高斯模型:opencv中MOG2的代码结构梳理
/* 头文件:OurGaussmix2.h */ #include "opencv2/core/core.hpp" #include <list> #include&q ...
- 混合高斯模型(GMM)推导及实现
作者:桂. 时间:2017-03-20 06:20:54 链接:http://www.cnblogs.com/xingshansi/p/6584555.html 声明:欢迎被转载,不过记得注明出处哦 ...
- 机器学习进阶-背景建模-(帧差法与混合高斯模型) 1.cv2.VideoCapture(进行视频读取) 2.cv2.getStructureElement(构造形态学的卷积) 3.cv2.createBackgroundSubtractorMOG2(构造高斯混合模型) 4.cv2.morpholyEx(对图像进行形态学的变化)
1. cv2.VideoCapture('test.avi') 进行视频读取 参数说明:‘test.avi’ 输入视频的地址2. cv2.getStructureElement(cv2.MORPH_E ...
- 混合高斯模型(Gaussian mixture model, GMM)
1. 前言 这就是为什么我要学习一下二维高斯分布的原因: 总感觉数学知识不够用呐,顺带把混合高斯模型也回顾一下. 2. 单高斯模型(Gaussian single model, GSM) 2.1 一维 ...
随机推荐
- windows下查看dns缓存和刷新缓存
ipconfig /displaydns 显示已有缓存,可能比较大建议 ipconfig /displaydns > C:\Users\SDWQ\Desktop\1.txt 再查看. 强制更新缓 ...
- 配置使用TargetFrameworks输出多版本类库
1.类库右键 2.修改配置 修改前: <Project Sdk="Microsoft.NET.Sdk"> <PropertyGroup> <Targe ...
- ios开发之 -- 单例类
单例模式是一种软件设计模式,再它的核心结构中指包含一个被称为单例类的特殊类. 通过单例模式可以保证系统中一个类只有一个势力而且该势力易于外界访问,从而方便对势力个数的控制并节约系统资源.如果希望在系统 ...
- python--常用的十进制、16进制、字符串、字节串之间的转换
进行协议解析时,总是会遇到各种各样的数据转换的问题,从二进制到十进制,从字节串到整数等等 整数之间的进制转换: 10进制转16进制: hex(16) ==> 0x10 16进制转10进制 ...
- MySQL 监控指标
为了排查问题,对数据库的监控是必不可少的,在此介绍下 MySQL 中的常用监控指标. 简介 MySQL 有多个分支版本,常见的有 MySQL.Percona.MariaDB,各个版本所对应的监控项也会 ...
- Win7环境下 IIS配置
一.介绍IIS Internet Information Services(IIS,互联网信息服务),是由微软公司提供的基于运行Microsoft Windows的互联网基本服务.最初是Windows ...
- 前端开发 - CSS - 上
CSS: 1.css的引入方式 2.基础选择器 3.高级选择器 4.选择器的优先级 5.伪类选择器 6.字体样式 7.文本样式 8.背景 9.盒模型border 10.margin 11.paddin ...
- libtorch 哪些函数比较常用?
libtorch 加载 pytorch 模块进行预测示例 void mat2tensor(const char * path, torch::Tensor &output) { //读取图片 ...
- 排序算法review<2>--Shell 排序
shell排序方法也是一种插入排序算法,于1959年由D.L.Shell提出,其基本方法是:首先将带排序文件分为d1(d1<n)组,将所有彼此之间间隔为d和d的倍数的记录放在一组中,然后在组内进 ...
- URL地址中的字符串转换
url出现了有+,空格,/,?,%,#,&,=等特殊符号的时候,可能在服务器端无法获得正确的参数值,怎么解决?解决办法将这些字符转化成服务器可以识别的字符,对应关系如下:URL字符转义 用其它 ...