K最近邻算法项目实战

这里我们用酒的分类来进行实战练习

下面来代码

1.把酒的数据集载入到项目中

from sklearn.datasets import load_wine

#从sklearn的datasets模块载入数据集

wine_dataset = load_wine()

#打印酒数据集中的键

print('\n\n\n')

print('代码运行结果:')

print('====================================')

print('红酒数据集中的键:\n{}'.format(wine_dataset.keys()))

print('====================================')

print('\n\n\n')

#使用.shape来打印数据的概况

print('\n\n\n')

print('代码运行结果:')

print('====================================')

print('数据概况:{}'.format(wine_dataset['data'].shape))

print('====================================')

print('\n\n\n')

#打印酒的数据集中的简短描述

print(wine_dataset['DESCR'])

2.下面我们来生成训练集和测试集来训练和测试K最近邻算法模型

　　后面的例子中我们用大写的X来表示数据的特征,用小写的y表示数据对应的标签.这是因为X是一个二维数组,也称为矩阵,而y是一个一维数组,或者说是一个向量

#导入数据集拆分工具

from sklearn.model_selection import train_test_split

#将数据集拆分为训练数据集和测试数据集

X_train,X_test,y_train,y_test = train_test_split(wine_dataset['data'],wine_dataset['target'],random_state=0)

print('\n\n\n')

print('代码运行结果:')

print('====================================')

#打印训练数据集中特征向量的形态

print('X_train shape:{}'.format(X_train.shape))

#打印测试数据集中特征向量的形态

print('X_train shape:{}'.format(X_test.shape))

#打印训练数据集中特征向量的形态

print('X_train shape:{}'.format(y_train.shape))

#打印测试数据集中特征向量的形态

print('X_train shape:{}'.format(y_test.shape))

print('====================================')

print('\n\n\n')

3.使用K最近邻算法进行建模

#导入KNN分类模型

from sklearn.neighbors import KNeighborsClassifier

#指定模型的n_neighbors参数值为1

knn = KNeighborsClassifier(n_neighbors = 1)

接下来使用knn方法中的"fit()"(拟合)方法来进行建模

print('\n\n\n')

print('代码运行结果:')

print('====================================')

#用模型对数据进行拟合

knn.fit(X_train,y_train)

print(knn)

print('====================================')

print('\n\n\n')

4.训练好了模型,接下来我们使用模型对新样本的分类进行预测

先来看一下模型的评分:0.76(不算好,也不算差,只进行测试K最近邻算法,权且消遣)

print('\n\n\n')

print('代码运行结果:')

print('====================================')

#打印模型的得分

print('测试数据集得分:{:.2f}'.format(knn.score(X_test,y_test)))

print('====================================')

print('\n\n\n')

5.接下来大餐来了,甭管准不准,先来预测一下吧

import numpy as np

#输入新的数据点

X_new = np.array([[13.2,2.77,2.51,18.5,96.6,1.04,2.55,0.57,1.47,6.2,1.05,3.33,820]])

#使用.predict进行预测

prediction = knn.predict(X_new)

print('\n\n\n')

print('代码运行结果:')

print('====================================')

print('预测新红酒的分类为:{}'.format(wine_dataset['target_names'][prediction]))

print('====================================')

print('\n\n\n')

结果是:

代码运行结果:

====================================

预测新红酒的分类为:['class_2']

====================================

总结:

　　ok,作为第一个机器学习的小实战,这的确是激动人心的,不过这远远达不到我们的要求,在求知的道路上我们永不止步

文章引自:《深入浅出python机器学习》

K最近邻算法项目实战的更多相关文章

机器学习-K最近邻算法
一.介绍二.编程练习一(K最近邻算法在单分类任务的应用): import numpy as np #导入科学计算包import matplotlib.pyplot as plt #导入画图工具fr ...
机器学习【一】K最近邻算法
K最近邻算法 KNN 基本原理离哪个类近,就属于该类 [例如:与下方新元素距离最近的三个点中,2个深色,所以新元素分类为深色] K的含义就是最近邻的个数.在sklearn中,KNN的K值是通过n ...
【算法】K最近邻算法（K-NEAREST NEIGHBOURS，KNN）
K最近邻算法(k-nearest neighbours,KNN) 算法对一个元素进行分类查看它k个最近的邻居在这些邻居中,哪个种类多,这个元素有更大概率是这个种类使用使用KNN来做两项基本工 ...
图说十大数据挖掘算法(一)K最近邻算法
如果你之前没有学习过K最近邻算法,那今天几张图,让你明白什么是K最近邻算法. 先来一张图,请分辨它是什么水果很多同学不假思索,直接回答:“菠萝”!!! 仔细看看同学们,这是菠萝么?那再看下边这这张图 ...
《算法图解》——第十章 K最近邻算法
第十章 K最近邻算法 1 K最近邻(k-nearest neighbours,KNN)——水果分类 2 创建推荐系统利用相似的用户相距较近,但如何确定两位用户的相似程度呢? ①特征抽取对水果 ...
12、K最近邻算法（KNN算法）
一.如何创建推荐系统? 找到与用户相似的其他用户,然后把其他用户喜欢的东西推荐给用户.这就是K最近邻算法的分类作用. 二.抽取特征推荐系统最重要的工作是:将用户的特征抽取出来并转化为度量的数字,然后 ...
[笔记]《算法图解》第十章 K最近邻算法
K最近邻算法简称KNN,计算与周边邻居的距离的算法,用于创建分类系统.机器学习等. 算法思路:首先特征化(量化) 然后在象限中选取目标点,然后通过目标点与其n个邻居的比较,得出目标的特征. 余弦相似 ...
PCB 加投率计算实现基本原理--K最近邻算法（KNN）
PCB行业中,客户订购5000pcs,在投料时不会直接投5000pcs,因为实际在生产过程不可避免的造成PCB报废, 所以在生产前需计划多投一定比例的板板, 例:订单量是5000pcs,加投3%,那 ...
KNN算法项目实战——改进约会网站的配对效果
KNN项目实战——改进约会网站的配对效果 1.项目背景: 海伦女士一直使用在线约会网站寻找适合自己的约会对象.尽管约会网站会推荐不同的人选,但她并不是喜欢每一个人.经过一番总结,她发现自己交往过的人可 ...

随机推荐

React拾遗（下）
reconciliation(协调算法) react用于更新DOM的算法.基于两点假设,实现了一个启发的O(n)算法: 两个不同类型的元素将产生不同的树. 通过渲染器附带key属性,开发者可以示意哪些 ...
C# 怎么生成DLL文件(转)
有两种方法: 但是一般这个使用打开VS2008,依次点击:菜单->文件->新建项目->项目类型visual C#(这里假设为该项目所取的名字是DllBuild)-& ...
linux内核中#if IS_ENABLED(CONFIG_XXX)与#ifdef CONFIG_XXX的区别
1. #if IS_ENABLED(CONFIG_XXX) 1.1 IS_ENABLED的定义如下: /* * IS_ENABLED(CONFIG_FOO) evaluates to 1 if CON ...
OS X环境下如何搭建编译Cocos2D-X v3.x的Android Studio工程
Cocos2D-X官网已经简单介绍了如何在OS X环境下搭建Cocos2D-X v2.x和v3.x的指南.具体链接为:http://www.cocos.com/doc/article/index?ty ...
Qt编写自定义控件44-天气仪表盘
一.前言天气仪表盘控件是所有控件中唯一一个使用了svg矢量图的控件,各种天气图标采用的矢量图,颜色变换采用动态载入svg的内容更改生成的,其实也可以采用图形字体来做,本次控件为了熟悉下svg在Qt中 ...
关于采样率&位深&码率&无损的一些心得
转载自:https://blog.csdn.net/Marenow/article/details/85253283 记笔记,记下来自己的一些关于音频基础知识的总结. 采样率外界的声音都是模拟信号,在 ...
（十一）Centos之帮助命令
帮助命令man (manual) 比如我们可以看下man命令的解释 [root@localhost ~]# man man MAN(1) ...
使用redis做为MySQL的缓存-C语言编写UDF
介绍在实际项目中,MySQL数据库服务器有时会位于另外一台主机,需要通过网络来访问数据库:即使应用程序与MySQL数据库在同一个主机中,访问MySQL也涉及到磁盘IO操作(MySQL也有一些数据预读 ...
VMware虚拟机中CentOS7的硬盘空间扩容
查看centos7系统挂载点信息扩展VMWare-centos7硬盘空间对新增加的硬盘进行分区.格式化添加新LVM到已有的LVM组,实现扩容 1.查看centos7系统挂载点信息 df -h查看 ...
【数据库开发】MySQL命令大全
1.连接Mysql 格式: mysql -h主机地址 -u用户名 -p用户密码1.连接到本机上的MYSQL. 首先打开DOS窗口,然后进入目录mysql\bin,再键入命令mysql -u root ...