机器学习——KMeans

导入类库

 from sklearn.cluster import KMeans

 from sklearn.datasets import make_blobs

 import numpy as np

 import matplotlib.pyplot as plt

　　KMeans算法的过程：(假如有两类)

随机选择两个点作为聚类的中心
计算所有点距离两个中心的距离，选择距离较近的点作为类别。（例如：距离蓝点近，类别是蓝色）
计算已经分好类的各组数据的平均值，使用各组数据的平均值中心作为新的中心
以新的中心为依据跳转至第2步
直到收敛(两次迭代的数值没有明显的变化：新中心点距离上一次中心点的距离小于某个阈值，例如：0.03)

代码

 plt.figure(figsize=(6, 3))

 n_samples = 1500

 random_state = 170

 '''

 make_blobs聚类数据生成器：用来生成聚类算法的测试数据

 n_samples：待生成的样本的总数

 n_features：每个样本的特征数

 centers：类别数

 cluster_std：每个类别的方差，放在列表中

 '''

 X, y = make_blobs(n_samples=n_samples, random_state=random_state)

 '''

 KMeans是结果受初始值影响的局部最优的迭代算法

 n_clusters：K值，类别数

 max_iter：最大迭代次数，凸数据集可忽略该值，非凸数据集可能很难收敛，可指定最大迭代次数让算法可以及时推出循环

 n_init：用不同的初始化质心运行算法的次数，默认是10，K值较大时，可适当增大该值

 init：初始值选择的方式，默认为k-means++

 algorithm：auto、full、elkan；auto自动选择，数据值稀疏时选择full，数据稠密时选择elkan

 '''

 y_pred = KMeans(n_clusters=2, random_state=random_state).fit_predict(X)

 # print(X[:, 0])

 # print(y)

 # for i in y_pred:

 #     print(i)

 # 根据颜色画出散点图

 plt.subplot(121)

 plt.scatter(X[:, 0], X[:, 1], c=y_pred)

 plt.subplot(122)

 plt.scatter(X[:, 0], X[:, 1], c=y)

 plt.show()

机器学习——KMeans的更多相关文章

视觉机器学习------K-means算法
K-means(K均值)是基于数据划分的无监督聚类算法. 一.基本原理聚类算法可以理解为无监督的分类方法,即样本集预先不知所属类别或标签,需要根据样本之间的距离或相似程度自动进行分类.聚 ...
机器学习——KMeans聚类，KMeans原理，参数详解
0.聚类聚类就是对大量的未知标注的数据集,按数据的内在相似性将数据集划分为多个类别,使类别内的数据相似度较大而类别间的数据相似度较小,聚类属于无监督的学习方法. 1.内在相似性的度量聚类是根据数据 ...
机器学习-kmeans的使用
import numpy as np import pandas as pd import matplotlib from matplotlib import pyplot as plt %matpl ...
机器学习--k-means聚类原理
“物以类聚,人以群分”, 所谓聚类就是将相似的元素分到一"类"(有时也被称为"簇"或"集合"), 簇内元素相似程度高, 簇间元素相似程度低. ...
Python之机器学习K-means算法实现
一.前言: 今天在宿舍弄了一个下午的代码,总算还好,把这个东西算是熟悉了,还不算是力竭,只算是知道了怎么回事.今天就给大家分享一下我的代码.代码可以运行,运行的Python环境是Python3.6以上 ...
机器学习K-Means
1.K-Means聚类算法属于无监督学习算法. 2.原理:先随机选择K个质心,根据样本到质心的距离将样本分配到最近的簇中,然后根据簇中的样本更新质心,再次计算距离重新分配簇,直到质心不再发生变化,迭代 ...
09-赵志勇机器学习-k-means
(草稿) k-means: 1. 随机选取n个中心 2. 计算每个点到各个中心的距离 3. 距离小于阈值的归成一类. 4. 计算新类的质心,作为下一次循环的n个中心 5. 直到新类的质心和对应本次循环 ...
机器学习-K-means聚类及算法实现（基于R语言）
K-means聚类将n个观测点,按一定标准(数据点的相似度),划归到k个聚类(用户划分.产品类别划分等)中. 重要概念:质心 K-means聚类要求的变量是数值变量,方便计算距离. 算法实现 R语言 ...
机器学习 - k-means聚类
k-means简介 k-means是无监督学习下的一种聚类算法,简单说就是不需要数据标签,仅靠特征值就可以将数据分为指定的几类.k-means算法的核心就是通过计算每个数据点与k个质心(或重心)之间的 ...

随机推荐

mysql将表数据导出为txt或csv文件
语法:select 字段 from 表名 into outfile 路径示例txt:select * from stu_class into outfile './stu_class.text'; ...
UE4 行为树资料
Composites Select 选择从左往右执行其子节点,直到一个达成,则 Select 达成并返回上层,否则失败并返回上层 Sequence 队列从左往右执行其子节点,直到一个失败,则 Se ...
彻底解决MacOS上应用程序快捷键冲突的问题，自定义快捷键设置
1看图操作上面选择好你要修改的应用程序的快捷键 ,我以Chrome为例子最后点击下ADD 然后回到Chrome的菜单,发现刷新页的快捷键变成了F5 注意,快捷键的名字要和你Chrome菜单上的名字 ...
移动端底部fixed固定定位输入框ios下不兼容
简短记录下最近开发移动端项目碰到的小坑,产品需求做一个售后对话页面,底部固定输入框,和微信对话差不多,但是在ios下,fixed失效,输入框被虚拟键盘挡住,在安卓下是正常的. 尝试过网上说的很多方法, ...
UEFI+GPT安装WIN7，WIN8/WIN10下安装WIN7双系统
一.BIOS更改首先来bios更改:我们知道,uefi+gpt引导虽然出来的时间比较长,但是win7还不能完全的支持,所以在使用uefi+gpt安装win7的时候就会出现各种错误!所以我们在安装Wi ...
python把列表前几个元素提取到新列表
需要添加几个就循环几次 list = ['a','b','c','d','e'] new_list = [] for i in range(3): print(list[i]) new_list. ...
Quartz.NET 入门（转）
概述 Quartz.NET是一个开源的作业调度框架,非常适合在平时的工作中,定时轮询数据库同步,定时邮件通知,定时处理数据等. Quartz.NET允许开发人员根据时间间隔(或天)来调度作业.它实现了 ...
SQL baseline_11g
conn sh/sh--执行想要创建基线的语句,语句的执行计划将会被缓存set autotrace on select /*ghbaselines1*/ count(*) from customers ...
IntelliJ IDEA设置svn.exe的路径
安装TortoiseSVN客户端时,必须选中command line client tools这个选项
小米众筹新品---8H凉感慢回弹记忆绵枕 99元上手开箱图
在众目睽睽之下,商城终于成了杂货铺众筹发布了第98期新品——8H凉感慢回弹记忆绵枕H1,售价为99元,主打舒适凉感,抗菌吸湿,三曲线护颈设计,3~5秒慢回弹. 本着程序员的读书历程:x 语言入门 — ...

机器学习——KMeans

导入类库

KMeans算法的过程：(假如有两类)

代码

机器学习——KMeans的更多相关文章

随机推荐

热门专题

　　KMeans算法的过程：(假如有两类)