MATLAB 物体识别算法说明:vision.ForegroundDetector, vision.BlobAnalysis
在官方示例中,Motion-Based Multiple Object Tracking和Using Kalman Filter for Object Tracking都使用了下面两个算法进行物体的识别
1、vision.ForegroundDetector
原理:The ForegroundDetector System object compares a color or grayscale video frame to a background model to determine whether individual pixels are part of the background or the foreground. It then computes a foreground mask. By using background subtraction, you can detect foreground objects in an image taken from a stationary camera.
将每一帧和一个背景帧进行对比,判断每个像素点是属于背景,还是属于罩子(罩子就是不属于背景的意思)。通过这种对比,就能识别出后面帧中运动的物体。适用范围:一个固定的摄像头所拍摄的视频。
算法:Gaussian mixture models (GMM).,呵呵,又是高斯。
使用方法见官方文档、示例。
参数,也是最重要的部分:
AdaptLearningRate,默认true,解释:
Enables the object to adapt the learning rate during the period specified by the NumTrainingFrames property. When you set this property to true, the object sets the LearningRate property to 1/(current frame number). When you set this property to false, the LearningRate property must be set at each time step.
很简单,就是设置要不要Learning。
NumTrainingFrames,默认150,解释:
用于训练背景模型的帧数,前面讲过,通过和这个背景模型对比来识别运动的物体。注意:这些数目的帧是指视频开头的部分。
LearningRate,默认0.005,解释:
Learning rate for parameter updates(说不上来,自己理解吧。)
Specify the learning rate to adapt model parameters. This property controls how quickly the model adapts to changing conditions. Set this property appropriately to ensure algorithm stability.(控制背景模型的更新速度,同时该参数影响算法的稳定性)
When you set AdaptLearningRate to true, the LearningRate property takes effect only after the training period specified by NumTrainingFrames is over.
(这个参数在初始的学习帧数,也就是上一个参数完毕后,才开始生效)
When you set the AdaptLearningRate to false, this property will not be available. This property is tunable.
MinimumBackgroundRatio,默认0.7,解释:
Threshold to determine background model
Set this property to represent the minimum of the apriori probabilities for pixels to be considered background values. Multimodal backgrounds can not be handled, if this value is too small.
一个像素被认为是属于背景的最小先验概率。个人认为这个参数控制识别的敏感性,设置比较大时,识别就比较迟钝,对细微变化忽略掉。
NumGaussians,默认5,解释:
Number of Gaussian modes in the mixture model(高斯大神的数量?大神保佑我)
Specify the number of Gaussian modes in the mixture model. Set this property to a positive integer. Typically this value is 3, 4 or 5. Set this value to 3 or greater to be able to model multiple background modes.(貌似是越大越好?然后更利于处理多背景的情况)
InitialVariance,解释:
Variance when initializing a new Gaussian mode
呵呵
一些相关的方法就不解释了。
2、vision.BlobAnalysis
原理:computes statistics for connected regions in a binary image. (将连通的区域连起来,作为识别的那个移动物体);
输入输出参数:
Use the step syntax below with input binary image, BW, blob analysis object, H, and any optional properties. The step method computes and returns statistics of the input binary image depending on the property values specified. The order of the returned values when there are multiple outputs are in the order they are described below:
输出:区域的面积、中心点、外面的框框。
[AREA,CENTROID,BBOX] = step(H,BW) returns the area, centroid and the bounding box of the blobs when the AreaOutputPort, CentroidOutputPort and BoundingBoxOutputPort properties are set to true. These are the only properties that are set to true by default. If you set any additional properties to true, the corresponding outputs follow the AREA,CENTROID, and BBOX outputs.
输入参数有很多个,这里不一一解释,后面用到再详细说。
可设置的属性:
AreaOutputPort,CentroidOutputPort,BoundingBoxOutputPort
默认为true,表示会输出[AREA,CENTROID,BBOX]
MajorAxisLengthOutputPort,MinorAxisLengthOutputPort,OrientationOutputPort,EccentricityOutputPort,
EquivalentDiameterSquaredOutputPort,ExtentOutputPort,PerimeterOutputPort,LabelMatrixOutputPort
一些计算结果的输出,默认为false
OutputDataType,默认double,设置输出数据的格式,包括: double, single, or Fixed point
Connectivity,默认8,设置哪些像素点是连接的,可选4和8。你懂的,一个小正方形周围有8个小正方形。
MaximumCount,默认50,解释:
Maximum number of labeled regions in each input image(每幅图中最大的区域个数,也就是识别到的运动物体个数)
MinimumBlobArea,默认0,解释:
Minimum blob area in pixels(区域最小面积,占多少个像素?)
MaximumBlobArea,默认为最大的整型数intmax('uint32')
Maximum blob area in pixels(区域占的最大面积,单位像素)
以上两个属性可以控制识别到的区域大小,把不想识别到的筛选出去。
ExcludeBorderBlobs,默认false
Exclude blobs that contain at least one border pixel
Set this property to true if you do not want to label blobs that contain at least one border pixel.
排除掉有边界的区域。
MATLAB 物体识别算法说明:vision.ForegroundDetector, vision.BlobAnalysis的更多相关文章
- 手把手教你使用LabVIEW OpenCV dnn实现物体识别(Object Detection)含源码
前言 今天和大家一起分享如何使用LabVIEW调用pb模型实现物体识别,本博客中使用的智能工具包可到主页置顶博客LabVIEW AI视觉工具包(非NI Vision)下载与安装教程中下载 一.物体识别 ...
- C#中调用Matlab人工神经网络算法实现手写数字识别
手写数字识别实现 设计技术参数:通过由数字构成的图像,自动实现几个不同数字的识别,设计识别方法,有较高的识别率 关键字:二值化 投影 矩阵 目标定位 Matlab 手写数字图像识别简介: 手写 ...
- 基于MATLAB的人脸识别算法的研究
基于MATLAB的人脸识别算法的研究 作者:lee神 现如今机器视觉越来越盛行,从智能交通系统的车辆识别,车牌识别到交通标牌的识别:从智能手机的人脸识别的性别识别:如今无人驾驶汽车更是应用了大量的机器 ...
- DeepID人脸识别算法之三代(转)
DeepID人脸识别算法之三代 转载请注明:http://blog.csdn.net/stdcoutzyx/article/details/42091205 DeepID,目前最强人脸识别算法,已经三 ...
- DeepID人脸识别算法之三代
DeepID人脸识别算法之三代 转载请注明:http://blog.csdn.net/stdcoutzyx/article/details/42091205 DeepID,眼下最强人脸识别算法.已经三 ...
- 【YOLOv5】LabVIEW+YOLOv5快速实现实时物体识别(Object Detection)含源码
前言 前面我们给大家介绍了基于LabVIEW+YOLOv3/YOLOv4的物体识别(对象检测),今天接着上次的内容再来看看YOLOv5.本次主要是和大家分享使用LabVIEW快速实现yolov5的物体 ...
- 3D物体识别的如果检验
3D物体识别的如果验证 这次目的在于解释怎样做3D物体识别通过验证模型如果在聚类里面.在描写叙述器匹配后,这次我们将执行某个相关组算法在PCL里面为了聚类点对点相关性的集合,决定如果物体在场景里面的实 ...
- ROS kinetic + Realsens D435i + ORK + LINEMOD 物体识别
1. ORK 网址:https://wg-perception.github.io/object_recognition_core/ ORK (Object Recognition Kitchen) ...
- ADAS可行驶区域道路积水反光区域的识别算法
ADAS可行驶区域道路积水反光区域的识别算法 Water logging area reflecting recognition algorithm for ADAS 1. 工程概要 1.1 概述: ...
随机推荐
- WMI资料汇总
简介 http://technet.microsoft.com/zh-cn/library/ee692772.aspx#E5IAC 主页 http://msdn.microsoft.com/zh-cn ...
- 制作web字体:CSS3 @font-face
@font-face是CSS3中的一个模块,他主要是把自己定义的Web字体嵌入到你的网页中,随着@font-face模块的出现,我们在Web的开发中使用字体不怕只能使用Web安全字体,另外@font- ...
- cas的http配置和rmi远程调用
1.cas配置http请求(服务端) 1) 解压cas-server-3.4.4-release.zip将modules目录下的cas-server-webapp-3.4.4.war改名称为cas.w ...
- Java中byte与16进制字符串的互相转换
* Convert byte[] to hex string.这里我们可以将byte转换成int,然后利用Integer.toHexString(int)来转换成16进制字符串. * @param s ...
- linuxmint 默认不启动图形界面
1.参考:http://garyu.blog.51cto.com/2838408/513772 修改/etc/X11/default-display-manager文件 该文件的内容一般是一个路径,比 ...
- 《BI项目笔记》数据源视图设置
目的数据源视图是物理源数据库和分析维度与多维数据集之间的逻辑数据模型.在创建数据源视图时,需要在源数据库中指定包含创建维度和多维数据集所需要的数据表格和视图.BIDS与数据库连接,读取表格和视图定义, ...
- WebSocket实战之————Workerman服务器的安装启动
安装php apt-get install php5-cli root@iZ23b64pe35Z:/home/www# php -v PHP 5.5.9-1ubuntu4.20 (cli) (buil ...
- 'JAVAC' 不是内部或外部命令解决方法,记得要重启cmd
我们在配置完环境变量后,在命令提示框中输入javac命令时,往往会提示javac不是内部或者外部命令时怎么办呢?我们一起来解决它吧! 我们配置完java环境变量之后,在命令行输入javac按下回车键, ...
- lhgdialog: iframe页面里面的,确定,关闭、取消按钮的操作
lhgdialog: iframe页面里面的,确定,关闭.取消按钮的操作 如果你正在用lhgdialog,用他人iframe,或者 content:'url:http://www.baidu.com/ ...
- Django1.9开发博客(10)- 全文搜索
Django本身不提供全文检索的功能,但django-haystack为其提供了全文检索的框架. django-haystack能为Django提供whoosh,solr,Xapian和Elastic ...