Matalab之模糊KMeans原理

对Kmeans方法相信大家都会不陌生，这是一种广泛被应用的基于划分的聚类算法。首先对它的核心思想做一个简单的介绍：

算法把n个向量x_j(1,2…,n)分为c个组G_i(i=1,2,…,c)，并求每组的聚类中心，使得非相似性（或距离）指标的价值函数（或目标函数）达到最小。当选择欧几里德距离为组j中向量x_k与相应聚类中心c_i间的非相似性指标时，价值函数可定义为：

（1.1）

这里Ji是组i内的价值函数。这样Ji的值依赖于Gi的几何特性和ci的位置。一般来说，可用一个通用距离函数d(x_k,c_i)代替组I中的向量x_k，则相应的总价值函数可表示为：

（1.2）

划分过的组一般用一个c×n的二维隶属矩阵U来定义。如果第j个数据点X(j)属于组i，则U中的元素U(i,j)为1；否则，该元素取0。一旦确定聚类中心v(i)，可导出如下使式（1.1）最小：

(1.3)

强调一点，如果v(i)是X（j）的最近的聚类中心，那么X（j）属于i组。由于一个给定数据只能属于一个组，所以隶属矩阵U具有如下性质：

（1.4）

Kmeans虽然简单实用，但是对于一些实际问题在功能上还是略显逊色，同时它还有一个先天的不足，那就是它是一种硬性的划分方法。FCM算法是对硬性划分的一种改进，其核心思想如下：

FCM把n个向量x_i（i=1,2,…,n）分为c个模糊组，并求每组的聚类中心，使得非相似性指标的价值函数达到最小。FCM与HCM的主要区别在于FCM用模糊划分，使得每个给定数据点用值在0，1间的隶属度来确定其属于各个组的程度。与引入模糊划分相适应，隶属矩阵U允许有取值在0，1间的元素。不过，加上归一化规定，一个数据集的隶属度的和总等于1：

（2.1）

那么，FCM的价值函数（或目标函数）就是式（1.1）的一般化形式：

（2.2）

这里U（i,j）介于0,1之间；C（i）为模糊组I的聚类中心；d(i,j)是模糊组I的聚类中心到第j个数据之间的欧式距离；为了获得使得该目标函数最小值的条件，重新构造目标函数如下：

（2.3）

这里l_j，j=1到n，是（2.1）式的n个约束式的拉格朗日乘子。对所有输入参量求导，使式（2.2）达到最小的必要条件为：

(2.4)

(2.5)

由上述两个必要条件，模糊C均值聚类算法是一个简单的迭代过程。在批处理方式运行时，FCM用下列步骤确定聚类中心c_i和隶属矩阵U[1]：

步骤1：用值在0，1间的随机数初始化隶属矩阵U，使其满足式（2.1）中的约束条件

步骤2：用式（2.4）计算c个聚类中心c_i，i=1,…,c。

步骤3：根据式（2.2）计算价值函数。如果它小于某个确定的阀值，或它相对上次价值函数值的改变量小于某个阀值，则算法停止。

步骤4：用（2.5）计算新的U矩阵。返回步骤2。

上述算法也可以先初始化聚类中心，然后再执行迭代过程。由于不能确保FCM收敛于一个最优解。算法的性能依赖于初始聚类中心。

关于FCM算法的介绍就到这里了，下讲将会针对一个实际例子给出实现代码

Matalab之模糊KMeans原理的更多相关文章

Matalab之模糊KMeans实现
这节继续上节的KMeans进行介绍,上节主要是对模糊KMeans方法的原理做了介绍,没有实践印象总是不深刻,前段时间有个师姐让我帮着写了个模糊KMeans的算法,今天就拿她给出的例子来对这个方法做个实 ...
Mahout 模糊kmeans
Mahout 模糊KMeans 一.算法流程模糊 C 均值聚类(FCM),即众所周知的模糊 ISODATA,是用隶属度确定每个数据点属于某个聚类的程度的一种聚类算法.1973 年,Bezdek 提 ...
1. K-Means原理解析
1. K-Means原理解析 2. K-Means的优化 3. sklearn的K-Means的使用 4. K-Means和K-Means++实现 1. 前言我们在一开始的时候应该就说过,机器学习按 ...
11 K-Means 原理及案例
11 K-Means 原理及案例非监督学习 unsupervised learning (非监督学习) ,只有特征值,没有目标值聚类: 主要方法 - k-means (K - 需要分成的类别数) ...
机器学习——KMeans聚类，KMeans原理，参数详解
0.聚类聚类就是对大量的未知标注的数据集,按数据的内在相似性将数据集划分为多个类别,使类别内的数据相似度较大而类别间的数据相似度较小,聚类属于无监督的学习方法. 1.内在相似性的度量聚类是根据数据 ...
es 基于match_phrase的模糊匹配原理及使用
[版权声明]:本文章由danvid发布于http://danvid.cnblogs.com/,如需转载或部分使用请注明出处在业务中经常会遇到类似数据库的"like"的模糊匹配需求 ...
Kmeans原理与实现
原理 http://www.cnblogs.com/jerrylead/archive/2011/04/06/2006910.html 实现 http://www.cnblogs.com/zjutzz ...
K-Means聚类算法原理
K-Means算法是无监督的聚类算法,它实现起来比较简单,聚类效果也不错,因此应用很广泛.K-Means算法有大量的变体,本文就从最传统的K-Means算法讲起,在其基础上讲述K-Means的优化变体 ...
canvas 1px 出现模糊解决方法及原理
关于canvas绘制1像素出现模糊的原因及解决方法 canvas是html5中非常强大的功能,但是在绘制的时候如果出现1像素,例如画一条1像素的线可能出现模糊情况. 一.解决方法网上比较常见的解决方 ...

随机推荐

Mysql bigint 类型转为datetime
最近在使用quartz,在mysql中其数据库表中的时间都是使用bigint类型存储的,要想使其查询结果显示为yyyy-mm-dd hh:MM:ss的格式需要使用 from_unixtime()函数, ...
Ubuntu14.0.4 64位 ADT 连接手机调试问题
1:使用 lsusb 命令查看USB 设备 y@y:~$ lsusbBus 001 Device 002: ID 8087:8000 Intel Corp. Bus 001 Device 001: I ...
Qt中事件分发源代码剖析（一共8个步骤，顺序非常清楚：全局的事件过滤器，再传递给目标对象的事件过滤器，最终传递给目标对象）
Qt中事件分发源代码剖析 Qt中事件传递顺序: 在一个应该程序中,会进入一个事件循环,接受系统产生的事件,并且进行分发,这些都是在exec中进行的.下面举例说明: 1)首先看看下面一段示例代码: in ...
Jquery之家5个顶级Material Design框架
谷歌Material Design在如今的前端页面设计中非常流行.Material Design的设计风格向我们展示了一个简单而有内涵的现代UI设计方案. Material Design是如此的简洁美 ...
Reverse Linked List 解答
Question Reverse a singly linked list. Solution 1 -- Iterative Remember to set head.next = null or i ...
UML_活动图
一.活动图的组成元素 Activity Diagram Element 1.活动状态图(Activity) 2.动作状态(Actions) 3.动作状态约束(Action Constraints) 4 ...
Unsupported Media Type 415问题解决办法（Ajax）
场景:Ajax传一个json对象到服务器,让参数自动封装至与json对象匹配的java对象中. 错误类型错误类型1: "status":415 "error" ...
libev事件库学习笔记
一.libev库的安装因为个人的学习环境是在ubuntu 12.04上进行的,所以本节仅介绍该OS下的安装步骤. 使用系统工具自动化安装: sudo apt-get install libev-de ...
PC和ARM平台编译Qt的命令
编译for PC 的Qt过程是: (1)qmake -project (qmake命令,用于创建hello.pro,将所有的文件编译成一个与平台无关的工程文件).(注意:按照前面步骤安装好Qt环境之后 ...
【树形贪心】【UVA1267】Network
重要意义:复习好久没写的邻接表了. Network, Seoul 2007, LA3902 Consider a tree network with n nodes where the interna ...

Matalab之模糊KMeans原理

Matalab之模糊KMeans原理的更多相关文章

随机推荐

热门专题