sklearn GMM模型介绍

参考 SKlearn 库 EM 算法混合高斯模型参数说明及代码实现和 sklearn.mixture.GaussianMixture

记录下常用的参数，以及函数。

参数说明

class sklearn.mixture.GaussianMixture(n_components=1, covariance_type='full', tol=0.001, reg_covar=1e-06, max_iter=100, 
n_init=1, init_params='kmeans', weights_init=None, means_init=None, precisions_init=None, random_state=None, warm_start=False,
 verbose=0, verbose_interval=10)

1. n_components: 混合高斯模型个数，默认为 1
2. covariance_type: 协方差类型，包括 {‘full’,‘tied’, ‘diag’, ‘spherical’} 四种，full 指每个分量有各自不同的标准协方差矩阵，完全协方差矩阵（元素都不为零）， tied 指所有分量有相同的标准协方差矩阵（HMM 会用到），diag 指每个分量有各自不同对角协方差矩阵（非对角为零，对角不为零）， spherical 指每个分量有各自不同的简单协方差矩阵，球面协方差矩阵（非对角为零，对角完全相同，球面特性），默认‘full’ 完全协方差矩阵

3. tol：EM 迭代停止阈值，默认为 1e-3.
4. reg_covar: 协方差对角非负正则化，保证协方差矩阵均为正，默认为 0
5. max_iter: 最大迭代次数，默认 100
6. n_init: 初始化次数，用于产生最佳初始参数，默认为 1
7. init_params: {‘kmeans’, ‘random’}, defaults to ‘kmeans’. 初始化参数实现方式，默认用 kmeans 实现，也可以选择随机产生
8. weights_init: 各组成模型的先验权重，可以自己设，默认按照 7 产生
9. means_init: 初始化均值，同 8
10. precisions_init: 初始化精确度（模型个数，特征个数），默认按照 7 实现
11. random_state : 随机数发生器
12. warm_start : 若为 True，则 fit（）调用会以上一次 fit（）的结果作为初始化参数，适合相同问题多次 fit 的情况，能加速收敛，默认为 False。
13. verbose : 使能迭代信息显示，默认为 0，可以为 1 或者大于 1（显示的信息不同）
14. verbose_interval : 与 13 挂钩，若使能迭代信息显示，设置多少次迭代后显示信息，默认 10 次。

函数：

aic(X) Akaike information criterion for the current model on the input X. 　　　　　　　　输入 X 上当前模型的 aic（X）Akaike 信息标准。
bic(X) Bayesian information criterion for the current model on the input X.　　　　　　　　输入 X 上当前模型的 bic（X）贝叶斯信息准则。
fit(X[, y]) Estimate model parameters with the EM algorithm.　　　　　　　　　　　　　　fit（X [，y]）使用 EM 算法估算模型参数。
get_params([deep]) Get parameters for this estimator.　　　　　　　　　　　　　　　　get_params（[deep]）获取此估算器的参数。
predict(X) Predict the labels for the data samples in X using trained model.　　　　　　　　预测（X）使用训练模型预测 X 中数据样本的标签。
predict_proba(X) Predict posterior probability of each component given the data.　　　　　　predict_proba（X）预测给定数据的每个组件的后验概率。
sample([n_samples]) Generate random samples from the fitted Gaussian distribution.　　　　sample（[n_samples]）从拟合的高斯分布生成随机样本。
score(X[, y]) Compute the per-sample average log-likelihood of the given data X.　　　　得分（X [，y]）计算给定数据 X 的每样本平均对数似然。
score_samples(X) Compute the weighted log probabilities for each sample.　　　　　　score_samples（X）计算每个样本的加权对数概率。
set_params(**params) Set the parameters of this estimator.　　　　　　　　　　　　　　set_params（** params）设置此估算器的参数。

最主要的步骤是fit，然后内部在用em算法进行迭代求参数了。

score_samples(x) 返回加权对数概率，所以指数形式，就是gmm模型给出的概率。

predict_proba() 给出每个gmm的子高斯模型的概率，类似这种形式：

[[1.23749644e-06 1.95769562e-15 9.99998763e-01 5.29319585e-14]

 [2.22219085e-35 1.06858732e-17 5.83110038e-16 1.00000000e+00]

 [1.35866699e-42 1.85132861e-23 6.24590778e-19 1.00000000e+00]...

这是个4个组分的gmm，已经红色标注了，这是概率最高的，属于对应组分的概率最大

predict () 预测是哪个组分的，

用上面的例子，得到的结果就是： [2 3 3 ...] 因为是4分类，0123

常用的也就这些了，sklearn的框架要比自己写的好用很多，虽然能够推导出公式，但是代码不一定写的出来。。。

最后分享一个关于协方差类型的官网例子： GMM covariances

以此为模板，我们只需要把数据的输入形式搞对应了，就可以做很多事情。

值得一提的是，gmm需要初始化，我们上一篇学习的kmeans就可以拿来做gmm的初始化，他的 k个质心坐标，可以用来作为gmm k个组分的初始均值。这个在我们下一篇实战中细说。

sklearn GMM模型介绍的更多相关文章

Python 3 利用 Dlib 19.7 和 sklearn机器学习模型实现人脸微笑检测
0.引言利用机器学习的方法训练微笑检测模型,给一张人脸照片,判断是否微笑: 使用的数据集中69张没笑脸,65张有笑脸,训练结果识别精度在95%附近: 效果: 图1 示例效果工程利用pytho ...
吴裕雄 python 机器学习——混合高斯聚类GMM模型
import numpy as np import matplotlib.pyplot as plt from sklearn import mixture from sklearn.metrics ...
IO模型介绍
先理解几个问题: (1)为什么读取文件的时候,需要用户进程通过系统调用内核完成(系统不能自己调用内核)什么是用户态和内核态?为什么要区分内核态和用户态呢? 在 CPU 的所有指令中,有些指令是非常危险 ...
模型介绍之FastText
模型介绍一: 1. FastText原理及实践前言----来源&特点 fastText是Facebook于2016年开源的一个词向量计算和文本分类工具,在学术上并没有太大创新.但是它的优点也 ...
python 全栈开发，Day44(IO模型介绍,阻塞IO,非阻塞IO,多路复用IO,异步IO,IO模型比较分析,selectors模块,垃圾回收机制)
昨日内容回顾协程实际上是一个线程,执行了多个任务,遇到IO就切换切换,可以使用yield,greenlet 遇到IO gevent: 检测到IO,能够使用greenlet实现自动切换,规避了IO阻 ...
{python之IO多路复用} IO模型介绍阻塞IO(blocking IO) 非阻塞IO(non-blocking IO) 多路复用IO(IO multiplexing) 异步IO(Asynchronous I/O) IO模型比较分析 selectors模块
python之IO多路复用阅读目录一 IO模型介绍二阻塞IO(blocking IO) 三非阻塞IO(non-blocking IO) 四多路复用IO(IO multiplexing) 五 ...
(zhuan) 深度学习全网最全学习资料汇总之模型介绍篇
This blog from : http://weibo.com/ttarticle/p/show?id=2309351000224077630868614681&u=5070353058& ...
深入理解 Java 内存模型（一）- 内存模型介绍
深入理解 Java 内存模型(一)- 内存模型介绍深入理解 Java 内存模型(二)- happens-before 规则深入理解 Java 内存模型(三)- volatile 语义深入理解 J ...
OSI七层网络模型与TCP/IP四层模型介绍
目录 OSI七层网络模型与TCP/IP四层模型介绍 1.OSI七层网络模型介绍 2.TCP/IP四层网络模型介绍 3.各层对应的协议 4.OSI七层和TCP/IP四层的区别 5.交换机工作在OSI的哪 ...

随机推荐

BZOJ 3993 [SDOI2015]星际战争 | 网络流二分答案
链接 BZOJ 3993 题解这道题挺棵的-- 二分答案t,然后源点向武器连t * b[i], 武器向能攻击的敌人连1, 敌人向汇点连a[i],如果最大流等于所有敌人的a[i]之和则可行. #inc ...
分库分表中间件sharding-jdbc的使用
数据分片产生的背景,可以查看https://shardingsphere.apache.org/document/current/cn/features/sharding/,包括了垂直拆分和水平拆分的 ...
Python之旅：并发编程之协程
一引子本节的主题是基于单线程来实现并发,即只用一个主线程(很明显可利用的cpu只有一个)情况下实现并发,为此我们需要先回顾下并发的本质:切换+保存状态 cpu正在运行一个任务,会在两种情况下切走去 ...
Build CRUD Application with jQuery EasyUI
http://www.jeasyui.com/tutorial/app/crud.php It has become a common necessily for web application to ...
SQL Server优化的方法
SQL Server优化的方法<一> 查询速度慢的原因很多,常见如下几种: 1.没有索引或者没有用到索引(这是查询慢最常见的问题,是程序设计的缺陷) 2.I/O吞吐量小,形成了 ...
What does -1 mean in numpy reshape?
The criterion to satisfy for providing the new shape is that 'The new shape should be compatible wit ...
压力测试以及编译安装httpd2.4
压力测试以及编译安装httpd2.4 作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.使用 deflate_module模块压缩页面优化传输速度我们的httpd软件自带的有一个 ...
yearProgress.vue
<template> <div class="progressbar"> <el-progress :text-inside="true&q ...
POJ 2965 The Pilots Brothers' refrigerator （暴力枚举）
https://vjudge.net/problem/POJ-2965 与poj-1753相似,只不过这个要记录路径.poj-1753:https://www.cnblogs.com/fht-lito ...
js 判断日期大小、是否在时间范围内等处理
var beginval="2015-09-01";//这个时间可以是日期控件选择的,也可以是其他的任何日期时间 var endval="2015-09-01" ...

sklearn GMM模型介绍

参数说明

函数：

sklearn GMM模型介绍的更多相关文章

随机推荐

热门专题