聚类算法,无监督学习的范畴,没有明确的类别信息. 给定n个训练样本{x1,x2,x3,...,xn} kmeans算法过程描述如下所示: 1.创建k个点作为起始质心点,c1,c2,...,ck 2.重复以下过程直到收敛 遍历所有样本xi 遍历所有质心cj 记录质心与样本间的距离 将样本分配到距离其最近的质心 对每一个类,计算所有样本的均值并将其作为新的质心 下图展示了对n个样本点进行K-means聚类的效果,这里k取2. 需要注意的几点: k个点怎么取 1.选择距离尽可能远的k个点 首先随机选一