用KNN实现iris的4分类问题&测试精度

import matplotlib.pyplot as plt

from scipy import sparse

import numpy as np

import matplotlib as mt

import pandas as pd

from IPython.display import display

from sklearn.datasets import load_iris

import sklearn as sk

from sklearn.model_selection import  train_test_split

from sklearn.neighbors import KNeighborsClassifier

iris=load_iris()

#print(iris)

X_train,X_test,y_train,y_test = train_test_split(iris['data'],iris['target'],random_state=0)

iris_dataframe = pd.DataFrame(X_train,columns=iris.feature_names)

knn = KNeighborsClassifier(n_neighbors=1)

knn.fit(X_train,y_train)

# KNeighborsClassifier(algorithm='auto',leaf_size=30,metric='minkowski',

#                      metric_params=None,n_jobs=1,n_neighbors=1,p=2,weights='uniform')

X_new = np.array([[5,2.9,1,0.2]])

print("X_new.shape:{}".format(X_new.shape))

prediction = knn.predict(X_new)

print("Prediction X_new:{}".format(prediction))

print("prediction X_new belong to {}".format(iris['target_names'][prediction]))

#评估模型

#计算精度方法1

print("test score1:{:.2f}".format(knn.score(X_test,y_test)))

#计算精度方法2

y_pred = knn.predict(X_test)

print("test score2:{:.2f}".format(np.mean(y_pred == y_test)))

输出：

Prediction X_new:[0]
prediction X_new belong to ['setosa']
test score1:0.97
test score2:0.97

测试精度

knn的邻居设置会影响测试精度，举例说明：

import matplotlib.pyplot as plt

import mglearn

from scipy import sparse

import numpy as np

import matplotlib as mt

import pandas as pd

from IPython.display import display

from sklearn.datasets import load_breast_cancer

import sklearn as sk

from sklearn.model_selection import  train_test_split

from sklearn.neighbors import KNeighborsClassifier

cancer = load_breast_cancer()

X_train,X_test,y_train,y_test =train_test_split(cancer.data,cancer.target,stratify=cancer.target,random_state=66)

training_accuracy=[]

test_accuracy=[]

neighbors_settings = range(1,11)

for n_neighbors in neighbors_settings:

    clf = KNeighborsClassifier(n_neighbors=n_neighbors)

    clf.fit(X_train,y_train)

    training_accuracy.append(clf.score(X_train,y_train))

    test_accuracy.append(clf.score(X_test,y_test))

plt.plot(neighbors_settings,training_accuracy,label="training accuracy")

plt.plot(neighbors_settings,test_accuracy,label="test accuracy")

plt.xlabel("n_neighbors")

plt.ylabel("accuracy")

plt.legend()

plt.show()

可以看出，6是最优。

KNN算法的优点是简单可解释性强，

缺点是：

样本大的时候性能不好
特征多（几百个+）的时候效果不好
稀疏数据集不适用

用KNN实现iris的4分类问题&测试精度的更多相关文章

kNN(K-Nearest Neighbor)最近的分类规则
KNN最近的规则,主要的应用领域是未知的鉴定,这一推断未知的哪一类,这样做是为了推断.基于欧几里得定理,已知推断未知什么样的特点和最亲密的事情特性: K最近的邻居(k-Nearest Neighbor ...
在opencv3中实现机器学习算法之：利用最近邻算法（knn)实现手写数字分类
手写数字digits分类,这可是深度学习算法的入门练习.而且还有专门的手写数字MINIST库.opencv提供了一张手写数字图片给我们,先来看看这是一张密密麻麻的手写数字图:图片大小为1000*20 ...
kNN处理iris数据集-使用交叉验证方法确定最优 k 值
基本流程: 1.计算测试实例到所有训练集实例的距离: 2.对所有的距离进行排序,找到k个最近的邻居: 3.对k个近邻对应的结果进行合并,再排序,返回出现次数最多的那个结果. 交叉验证: 对每一个k,使 ...
knn原理及借助电影分类实现knn算法
KNN最近邻算法原理 KNN英文全称K-nearst neighbor,中文名称为K近邻算法,它是由Cover和Hart在1968年提出来的 KNN算法原理: 1. 计算已知类别数据集中的点与当前点之 ...
85、使用TFLearn实现iris数据集的分类
''' Created on 2017年5月21日 @author: weizhen ''' #Tensorflow的另外一个高层封装TFLearn(集成在tf.contrib.learn里)对训练T ...
使用KNN对iris数据集进行分类——python
filename='g:\data\iris.csv' lines=fr.readlines()Mat=zeros((len(lines),4))irisLabels=[]index=0for lin ...
数学建模：2.监督学习--分类分析- KNN最邻近分类算法
1.分类分析分类(Classification)指的是从数据中选出已经分好类的训练集,在该训练集上运用数据挖掘分类的技术,建立分类模型,对于没有分类的数据进行分类的分析方法. 分类问题的应用场景:分 ...
最邻近规则分类(K-Nearest Neighbor)KNN算法
自写代码: # Author Chenglong Qian from numpy import * #科学计算模块 import operator #运算符模块 def createDaraSet( ...
kNN(K-Nearest Neighbor)最邻近规则分类
KNN最邻近规则,主要应用领域是对未知事物的识别,即推断未知事物属于哪一类,推断思想是,基于欧几里得定理,推断未知事物的特征和哪一类已知事物的的特征最接近: K近期邻(k-Nearest Neighb ...

随机推荐

drf框架 - JWT认证插件
JWT认证 JWT认证方式与其他认证方式对比: 优点 1) 服务器不要存储token,token交给每一个客户端自己存储,服务器压力小 2)服务器存储的是签发和校验token 两段算法,签发认证的效 ...
关于Djiango中前端多对多字段点（，）的显示问题
去除点的方法: <td> {% for roles_son in roles.permissions.all %} {% if forloop.last %} # 利用模板语言中的循环机制 ...
RookeyFrame 附件上传附件
上传附件可允许的格式: 位置:Rookey.Frame.Web\Config\upload.xml 节点:Attachment -> allowType
记下mongoose（转载）
连接mongodb时使用的是mongoose模块,安装和使用方法如下: 安装: npm install mongoose --save 使用: let mongoose = require('mong ...
Xilinx ISE的时序约束
使用Synplify Pro加时序约束.综合完毕后,可以在ISE中进行布局.布线.需要用.ucf文件指定布局布线的时钟约束.前者可以比后者小. 早期的ISE,两个约束可以继承.现在用的高版本,反而需要 ...
java https
1. 异常突现在这普通的一天,我写普通的代码,却突然收到不普通的报警 javax.net.ssl.SSLHandshakeException: server certificate change i ...
org.apache.ibatis.cache.CacheException: Error serializing object
异常: 十二月 26, 2017 3:38:05 下午 org.apache.jasper.servlet.TldScanner scanJars 信息: At least one JAR was s ...
Codeforces 876E National Property ——（2-SAT）
在这题上不是标准的“a或b”这样的语句,因此需要进行一些转化来进行建边.同时在这题上点数较多,用lrj大白书上的做法会T,因此采用求强连通分量的方法来求解(对一个点,如果其拓扑序大于其为真的那个点,则 ...
Hadoop hadoop 机架感知配置
机架感知脚本使用python3编写机架感知脚本,报存到topology.py,给予执行权限 import sys import os DEFAULT_RACK="/default-rack ...
leaflet地图框架
leaflet 中文API LeafLet js 官网:http://leafletjs.com/index.html LeafLet js 官网demo: http://leafletjs.com/ ...

用KNN实现iris的4分类问题&测试精度

用KNN实现iris的4分类问题&测试精度的更多相关文章

随机推荐

热门专题