使用sklearn估计器构建K-Means聚类模型

实例要求：以sklearn库自带的iris数据集为例，使用sklearn估计器构建K-Means聚类模型，并且完成预测类别功能以及聚类结果可视化。

实例代码：

import pandas as pd

import matplotlib.pyplot as plt

from sklearn.datasets import load_iris

from sklearn.preprocessing import MinMaxScaler

from sklearn.cluster import KMeans

from sklearn.manifold import TSNE

'''  构建K-Means模型  '''

iris = load_iris()

iris_data = iris['data'] # 提取数据集中的数据

iris_target = iris['target'] # 提取数据集中的标签

iris_names = iris['feature_names'] # 提取特征名

scale = MinMaxScaler().fit(iris_data) # 训练规则

iris_dataScale = scale.transform(iris_data) # 应用规则

kmeans = KMeans(n_clusters=3,random_state=123).fit(iris_dataScale) # 构建并训练模型

print('构建的K-Means模型为：\n',kmeans)

result = kmeans.predict([[1.5,1.5,1.5,1.5]])

print('花瓣花萼长度宽度全为1.5的鸢尾花预测类别为：',result[0])

'''  聚类结果可视化  '''

tsne = TSNE(n_components=2,init='random',random_state=177).fit(iris_data)    # 使用TSNE进行数据降维，降成两维

df = pd.DataFrame(tsne.embedding_)                    # 将原始数据转换为DataFrame

df['labels'] = kmeans.labels_     # 将聚类结果存储进df数据表中

df1 = df[df['labels']==0]

df2 = df[df['labels']==1]

df3 = df[df['labels']==2]

# fig = plt.figure(figsize=(9,6))    # 绘制图形  设定空白画布，并制定大小

plt.plot(df1[0],df1[1],'bo',df2[0],df2[1],'r*',df3[0],df3[1],'gD')

plt.show()                          # 显示图片

实例结果：

　　构建的K-Means模型为：

　　花瓣预测结果：

　　聚类结果可视化：

使用sklearn估计器构建K-Means聚类模型的更多相关文章

100天搞定机器学习|day44 k均值聚类数学推导与python实现
[如何正确使用「K均值聚类」? 1.k均值聚类模型给定样本,每个样本都是m为特征向量,模型目标是将n个样本分到k个不停的类或簇中,每个样本到其所属类的中心的距离最小,每个样本只能属于一个类.用C表示 ...
探索sklearn | K均值聚类
1 K均值聚类 K均值聚类是一种非监督机器学习算法,只需要输入样本的特征 ,而无需标记. K均值聚类首先需要随机初始化K个聚类中心,然后遍历每一个样本,将样本归类到最近的一个聚类中,一个聚类中样本特征 ...
吴裕雄 python 机器学习——K均值聚类KMeans模型
import numpy as np import matplotlib.pyplot as plt from sklearn import cluster from sklearn.metrics ...
sklearn.neighbors.KNeighborsClassifier(k近邻分类器)
KNeighborsClassifier参数说明KNeighborsClassifier(n_neighbors=5, weights='uniform', algorithm='auto', lea ...
ML: 聚类算法-K均值聚类
基于划分方法聚类算法R包: K-均值聚类(K-means) stats::kmeans().fpc::kmeansruns() K-中心点聚类(K-Medoids) ...
自然语言处理--LDA主题聚类模型
LDA模型算法简介: 算法的输入是一个文档的集合D={d1, d2, d3, ... , dn},同时还需要聚类的类别数量m:然后会算法会将每一篇文档 di 在所有Topic上的一个概率值p:这样 ...
机器学习之路：python k均值聚类 KMeans 手写数字
python3 学习使用api 使用了网上的数据集,我把他下载到了本地可以到我的git中下载数据集: https://github.com/linyi0604/MachineLearning 代码: ...
k近邻聚类简介
简介在所有机器学习算法中,k近邻(K-Nearest Neighbors,KNN)相对是比较简单的. 尽管它很简单,但事实证明它在某些任务中非常有效,甚至更好.它可以用于分类和回归问题! 然而,它更 ...

随机推荐

Spring Scheduled定时任务报错 java.lang.IllegalStateException: Encountered invalid @Scheduled method 'xxx': For input string: "2S"
报错信息如下: org.springframework.beans.factory.BeanCreationException: Error creating bean with name 'ding ...
VBA 生成XML(转)
需要引用连个库,Microsoft ADO Ext. 6.0 for DDL and Security, Miscrosoft ActiveX Data Objects 2.7 Library . ...
python对mysql数据库的一些常用操作
import pymysql class OperationDatabase(): def __init__(self,Ip,User,PassWd,DBname): self.ip=Ip self. ...
Mac使用Charles进行HTTPS抓包
技术来源: PengYunjing 第一步配置HTTP代理,这步与抓取HTTP请求是一样的: 选择在8888端口上监听,然后确定.够选了SOCKS proxy,还能截获到浏览器的http访问请求. ...
CSS3网页动画
CSS3网页动画概要:CSS3变形是一些效果的集合如:平移.旋转.缩放.倾斜效果每个效果都可以称为变形(transform)他们可以分别操控元素发生平移.旋转.缩放.倾斜等变化. 网页中能够实现 ...
php + mysql 存入表情【如何转义emoji表情，让它可以存入utf8的数据库】
方法1:base_encode64 这种方法是可以,但是旧数据没有经过encode操作,取数据的时候如果统一进行decode的话,旧数据会丢失的. 1 方法2:urlencode 这个似乎可以,对没有 ...
matplotlib 绘图报错 RuntimeError: Invalid DISPLAY variable
ssh 远程登录 Linux 服务器使用 matplotlib.pyplot 绘图时报错原因: matplotlib 在 windows 下的默认 backend 是 TkAgg:在 Linux 下 ...
博客三--tensorflow的队列及线程基本操作
连接我的开源中国账号:https://my.oschina.net/u/3770644/blog/3036960查询
java画按钮的边框
import javax.swing.*;import java.awt.*;public class demo_4{ public static void main(String [] arg ...
CENTOS7上安装MYSQL5.7.21流程
1系统约定安装文件下载目录:/data/softwareMysql目录安装位置:/usr/local/mysql数据库保存位置:/data/mysql日志保存位置:/data/log/mysql 2下 ...

使用sklearn估计器构建K-Means聚类模型

使用sklearn估计器构建K-Means聚类模型的更多相关文章

随机推荐

热门专题