python k-means聚类实例

port  sys

reload(sys)

sys.setdefaultencoding('utf-8')

import matplotlib.pyplot as plt

import numpy as np

culster1 = np.random.uniform(0.5, 1.5, (2, 20))

culster2 = np.random.uniform(1.5, 2.5, (2, 20))

culster3 = np.random.uniform(1.5, 3.5, (2, 20))

culster4 = np.random.uniform(3.5, 4.5, (2, 20))

x1 = np.hstack((culster1,culster2))

x2 = np.hstack((culster2,culster3))

x = np.hstack((x1,x2)).T

plt.figure()

plt.axis([0, 5, 0, 5])

plt.xlabel('x')

plt.ylabel('y')

plt.grid(True)

plt.plot(x[:,0],x[:,1], 'k.', markersize = 12)

from sklearn.cluster import KMeans

from scipy.spatial.distance import cdist

kmeans = KMeans(n_clusters = 2)

kmeans.fit(x)

plt.plot(kmeans.cluster_centers_[:,0],kmeans.cluster_centers_[:,1],'ro')

K = range(1, 10)

meandistortions = []

for k in K:

    kmeans = KMeans(n_clusters=k)

    kmeans.fit(x)

    meandistortions.append(sum(np.min(cdist(x, kmeans.cluster_centers_,'euclidean'), axis=1)) / x.shape[0])#选择每行最小距离求和

plt.figure()

plt.grid(True)

plt1 = plt.subplot(2,1,1)

plt1.plot(x[:,0], x[:,1], 'k.')

plt2 = plt.subplot(2,1,2)

plt2.plot(K, meandistortions)

python k-means聚类实例的更多相关文章

机器学习之路：python k均值聚类 KMeans 手写数字
python3 学习使用api 使用了网上的数据集,我把他下载到了本地可以到我的git中下载数据集: https://github.com/linyi0604/MachineLearning 代码: ...
机器学习实战5：k-means聚类：二分k均值聚类+地理位置聚簇实例
k-均值聚类是非监督学习的一种,输入必须指定聚簇中心个数k.k均值是基于相似度的聚类,为没有标签的一簇实例分为一类. 一经典的k-均值聚类思路: 1 随机创建k个质心(k必须指定,二维的很容易确定 ...
Python实现kMeans(k均值聚类)
Python实现kMeans(k均值聚类) 运行环境 Pyhton3 numpy(科学计算包) matplotlib(画图所需,不画图可不必) 计算过程 st=>start: 开始 e=> ...
机器学习算法与Python实践之（五）k均值聚类（k-means）
机器学习算法与Python实践这个系列主要是参考<机器学习实战>这本书.因为自己想学习Python,然后也想对一些机器学习算法加深下了解,所以就想通过Python来实现几个比较常用的机器学 ...
机器学习算法与Python实践之（六）二分k均值聚类
http://blog.csdn.net/zouxy09/article/details/17590137 机器学习算法与Python实践之(六)二分k均值聚类 zouxy09@qq.com http ...
100天搞定机器学习|day44 k均值聚类数学推导与python实现
[如何正确使用「K均值聚类」? 1.k均值聚类模型给定样本,每个样本都是m为特征向量,模型目标是将n个样本分到k个不停的类或簇中,每个样本到其所属类的中心的距离最小,每个样本只能属于一个类.用C表示 ...
k近邻聚类简介
简介在所有机器学习算法中,k近邻(K-Nearest Neighbors,KNN)相对是比较简单的. 尽管它很简单,但事实证明它在某些任务中非常有效,甚至更好.它可以用于分类和回归问题! 然而,它更 ...
k均值聚类算法原理和（TensorFlow）实现
顾名思义,k均值聚类是一种对数据进行聚类的技术,即将数据分割成指定数量的几个类,揭示数据的内在性质及规律. 我们知道,在机器学习中,有三种不同的学习模式:监督学习.无监督学习和强化学习: 监督学习,也 ...
【转】算法杂货铺——k均值聚类(K-means)
k均值聚类(K-means) 4.1.摘要在前面的文章中,介绍了三种常见的分类算法.分类作为一种监督学习方法,要求必须事先明确知道各个类别的信息,并且断言所有待分类项都有一个类别与之对应.但是很多时 ...
第十篇：K均值聚类(KMeans)
前言本文讲解如何使用R语言进行 KMeans 均值聚类分析,并以一个关于人口出生率死亡率的实例演示具体分析步骤. 聚类分析总体流程 1. 载入并了解数据集:2. 调用聚类函数进行聚类:3. 查看聚类 ...

随机推荐

leetcode187. 重复的DNA序列
所有 DNA 都由一系列缩写为 A,C,G 和 T 的核苷酸组成,例如:"ACGAATTCCG".在研究 DNA 时,识别 DNA 中的重复序列有时会对研究非常有帮助.编写一个函数 ...
matlab中实现 IEEE754浮点数与一般十进制数之间互相转换的方法
------------恢复内容开始------------ %2020/12/2 11:42:31clcformat long % IEEE754 to deca = '40800000'a = d ...
SpringCloud 源码系列（2）—— 注册中心 Eureka（中）
五.服务注册 1.实例信息注册器初始化服务注册的代码位置不容易发现,我们看 DiscoveryClient 初始化调度任务的这个方法,这段代码会去初始化一个实例信息复制器 InstanceInfoR ...
redis雪崩，击穿，穿透
redis穿透什么是redis穿透? 1.查询一个一定不存在的数据,由于缓存是不命中时被动写的,并且出于容错考虑,如果从存储层查不到数据则不写入缓存 2.这将导致这个不存在的数据每次请求都要到存储层 ...
PyQt（Python+Qt）学习随笔：QHeaderView.ResizeMode取值及含义
老猿Python博文目录专栏:使用PyQt开发图形界面Python应用老猿Python博客地址关于ResizeMode的使用请参考<PyQt(Python+Qt)学习随笔:QTableWi ...
PyQt（Python+Qt）学习随笔:QHeaderView的CascadingSectionResizes属性
老猿Python博文目录老猿Python博客地址一.CascadingSectionResizes作用 QHeaderView的CascadingSectionResizes属性用于控制当用户调整 ...
使用T4模板动态生成NPoco实体类
这是一个妥妥的NPoco类,这是我们在工作开发中,手动去写这个实体类,属实非常心累,字段少无所谓一次两次,数量多了,字段多了,就心态裂开
软件工程团队作业-测试与发布（Alpha版本）
Alpha版本测试报告功能测试报告概述测试阶段:alpha验收测试测试方法:手动功能测试测试环境(测试矩阵) Windows操作系统(win10)附带"Windows讲述人&quo ...
团队作业part1--团队展示&选题
一.团队展示 1.队名 DiligentVegetableChicken 2.队员信息纪昂学(组长):3118005053 廖业成:3118005060 蔡越:3118005086 周梓波:3118 ...
理解js浅拷贝和深拷贝
理解深拷贝和浅拷贝之前先了解下js中的基本类型和引用类型 1.基本类型: 在js中,数据的基本类型undefined,null,string,number,boolean,在变量中赋的实际值,基本类型 ...

python k-means聚类实例

python k-means聚类实例的更多相关文章

随机推荐

热门专题