sklearn训练感知器用iris数据集

简化版代码

 from sklearn import datasets

 import numpy as np

 #获取data和类标

 iris = datasets.load_iris()

 X = iris.data[:,[2,3]]

 y = iris.target

 #测试样本和训练样本三七分

 from sklearn.model_selection import train_test_split

 X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.3,random_state=0)

 #数据特征标准化

 from sklearn.preprocessing import StandardScaler

 sc = StandardScaler()

 sc.fit(X_train)

 X_test_std = sc.transform(X_test)

 X_train_std = sc.transform(X_train)

 #训练感知器模型

 from sklearn.linear_model import Perceptron

 ppn = Perceptron(max_iter=40,eta0=0.1,random_state=0)

 ppn.fit(X_train_std,y_train)

 #训练完成后，对测试数据进行预测

 y_pred = ppn.predict(X_test_std)

 print('Missclassified samples:%d'%(y_pred!=y_test).sum())

 from sklearn.metrics import accuracy_score

 print('Accuracy:%.2f'%accuracy_score(y_test,y_pred))

解释版+可视化

from sklearn import datasets#iris已包含在sklearn库中

import numpy as np

iris = datasets.load_iris()

#提取150个花朵样本中的花瓣长度和花瓣宽度两个特征的值，并由此构建特征矩阵X,同时将对应花朵所属类型的类标赋值给向量y

#打印出来iris可以发现iris包括的key包括五个值：data（其中有四列）、target、target_name、DESCR、feature_names

#X提取的是data里面的3、4列，y提取的是target，即类型的类标

#print(iris)

#print(iris.keys())

#print(iris.data.shape)

#print(iris.data[:5])#显示样本前五行，因为iris是字典不是列表，所以不能调用head（）的方法获取前五行

X = iris.data[:, [2, 3]]

y = iris.target#iris的每个样本都包含了品种信息，即目标属性（第5列，也叫target或label）

'''如果执行np.unique(y)返回存储在iris.target中的各类花朵的类标，可以看到，scikit-learn已分别将Iris-Sentosa、Iris-Versicolor

和Iris-Virginia的类名另存为整数（0,1,2），对许多机器学习库来说，这是针对性能优化一种推荐的做法

print(np.unique(y))

'''

'''

为了评估训练得到的模型在未知数据上的表现，我们进一步将数据集划分为训练数据集和测试数据集

使用scikit-learn中model_selection模块中的train_test_split函数，随机将数据矩阵X与类标向量y按照3:7的比例划分为测试数据集（

45个样本）和训练数据集（105个样本）

'''

from sklearn.model_selection import train_test_split

X_train, X_test, y_train,y_test = train_test_split(X, y, test_size=0.3, random_state=0)

'''

许多机器学习和优化算法都要求对数据做特征缩放。我们将使用scikit-learn的preprocessing模块中的StandardScaler类

对特征进行标准化处理

在下面的代码中，从preprocessing模块中加载了StandardScaler类，并实例化了一个StandScaler对象，用变量sc作为对它的引用

使用StandardScaler中的fit方法，可以计算训练数据中的每个特征的μ（样本均值）和σ（标准差）。通过调用transform方法，

可以使用前面计算得到的μ和σ来对训练数据做标准化处理。注意：需要使用相同的缩放参数分别处理训练和测试数据。

'''

from sklearn.preprocessing import StandardScaler

sc = StandardScaler()

sc.fit(X_train)

X_train_std = sc.transform(X_train)

X_test_std = sc.transform(X_test)

'''

在对训练数据做了标准化处理后，下面训练感知器模型

'''

from sklearn.linear_model import Perceptron

ppn = Perceptron(max_iter=40, eta0=0.1, random_state=0)#n_iter是迭代次数，eta是学习速率，random_state参数在每次迭代后初始化重新排练数据集

ppn.fit(X_train_std, y_train)

'''

使用scikit-learn完成模型的训练后，就可以在测试数据集上使用predict方法进行预测了

'''

y_pred = ppn.predict(X_test_std)#predict class labels for samples in X

print('Misclassified samples:%d'%(y_test != y_pred).sum())

'''

计算感知器在测试数据集上的分类准确率

'''

from sklearn.metrics import accuracy_score

print('Accuracy:%.2f' % accuracy_score(y_test,y_pred))

'''

使用plot_decision_regions函数来绘制刚刚训练过得模型的决策区域，并观察不同花朵样本的分类项

'''

from matplotlib.colors import ListedColormap

import matplotlib.pyplot as plt

def plot_decision_regions(X,y,classifier,test_idx = None,resolution = 0.02):

    #setup marker generator and color map

    markers = ('s', 'x', 'o', '^', 'v')

    colors = ('red', 'blue', 'lightgreen', 'gray', 'cyan')

    cmap = ListedColormap(colors[:len(np.unique(y))])

    #plot the decision surface

    x1_min, x1_max = X[:, 0].min()-1, X[:, 0].max()+1

    x2_min, x2_max = X[:, 0].min()-1, X[:, 1].max()+1

    xx1, xx2 = np.meshgrid(np.arange(x1_min, x1_max, resolution), np.arange(x2_min, x2_max, resolution))

    Z = classifier.predict(np.array([xx1.ravel(), xx2.ravel()]).T)

    Z = Z.reshape(xx1.shape)

    plt.contourf(xx1, xx2, Z, alpha=0.4, cmap=cmap)

    plt.xlim(xx1.min(), xx1.max())

    plt.ylim(xx2.min(), xx2.max())

    #plot all samples

    X_test,y_test = X[test_idx, :], y[test_idx]

    for idx, cl in enumerate(np.unique(y)):

        plt.scatter(x=X[y == cl, 0], y=X[y == cl, 1], alpha=0.8, c=cmap(idx), marker=markers[idx], label=cl)

    #highlight test samples

    if test_idx:

        X_test, Y_test = X[test_idx, :], y[test_idx]

        plt.scatter(X_test[:, 0],X_test[:, 1], c='', alpha=1.0, linewidth=1, marker='o', s=55, label='test set')

X_combined_std = np.vstack((X_train_std, X_test_std))

Y_combined = np.hstack((y_train, y_test))

plot_decision_regions(X=X_combined_std,

                      y=Y_combined,

                      classifier=ppn,

                      test_idx=range(105, 150))

plt.xlabel('petal length [standardized]')

plt.ylabel('petal width [standardized]')

plt.legend(loc='upper left')

print(plt.show())

自己手动注释

sklearn训练感知器用iris数据集的更多相关文章

Python_sklearn机器学习库学习笔记（七）the perceptron(感知器）
一.感知器感知器是Frank Rosenblatt在1957年就职于Cornell航空实验室时发明的,其灵感来自于对人脑的仿真,大脑是处理信息的神经元(neurons)细胞和链接神经元细胞进行信息传 ...
（1）Deep Learning之感知器
What is deep learning? 在人工智能领域,有一个方法叫机器学习.在机器学习这个方法里,有一类算法叫神经网络.神经网络如下图所示: 上图中每个圆圈都是一个神经元,每条线表示神经元之间 ...
二、单层感知器和BP神经网络算法
一.单层感知器 1958年[仅仅60年前]美国心理学家FrankRosenblant剔除一种具有单层计算单元的神经网络,称为Perceptron,即感知器.感知器研究中首次提出了自组织.自学习的思想, ...
python之感知器-从零开始学深度学习
感知器-从零开始学深度学习未来将是人工智能和大数据的时代,是各行各业使用人工智能在云上处理大数据的时代,深度学习将是新时代的一大利器,在此我将从零开始记录深度学习的学习历程. 我希望在学习过程中做到 ...
机器学习笔记2 – sklearn之iris数据集
前言本篇我会使用scikit-learn这个开源机器学习库来对iris数据集进行分类练习. 我将分别使用两种不同的scikit-learn内置算法--Decision Tree(决策树)和kNN(邻 ...
ML（2）——感知器
感知器(PLA——Perceptron Learning Algorithm),也叫感知机,处理的是机器学习中的分类问题,通过学习得到感知器模型来对新实例进行预测,因此属于判别模型.感知器于1957年 ...
感知器及其Python实现
感知器是由美国计算机科学家罗森布拉特(F.Roseblatt)于1957年提出的.感知器可谓是最早的人工神经网络.单层感知器是一个具有一层神经元.采用阈值激活函数的前向网络.通过对网络权值的训练,可以 ...
tensorflow学习笔记——自编码器及多层感知器
1,自编码器简介传统机器学习任务很大程度上依赖于好的特征工程,比如对数值型,日期时间型,种类型等特征的提取.特征工程往往是非常耗时耗力的,在图像,语音和视频中提取到有效的特征就更难了,工程师必须在这 ...
python机器学习——感知器
最近在看机器学习相关的书籍,顺便把每天阅读的部分写出来和大家分享,共同学习探讨一起进步!作为机器学习的第一篇博客,我准备从感知器开始,之后会慢慢更新其他内容. 在实现感知器算法前,我们需要先了解一下神 ...

随机推荐

git 忽略无效解决办法
有时候发现git提交了一些我们不需要提交的内容,这时候第一反应是加个忽略: https://github.com/github/gitignore 宇宙神器VS: https://github.com ...
LOJ2527 HAOI2018 染色容斥、生成函数、多项式求逆
传送门调了1h竟然是因为1004535809写成了998244353 "恰好有\(K\)种颜色出现了\(S\)次"的限制似乎并不容易达到,考虑容斥计算. 令\(c_j\)表示强制 ...
JVM-Java内存区域
JVM虚拟机运行时数据区结构分为: 其中方法区和堆是所有线程共享的内存区域,而Java栈.本地方法栈.程序计数器是线程私有的. 我们详细介绍运行时数据区的各个区域及其作用. 程序计数器: 一块较小的内 ...
redis底层设计（三）——redis数据类型
今天我们来看一下redis的数据类型.既然redis的键值对可以保存不同类型的值,那么很自然就需要对键值对的类型进行检查以及多态处理.下面我们将对redis所使用的对象系统进行了解,并分别观察字符串. ...
Linux或Windows上实现端口映射
通常服务器会有许多块网卡,因此也可能会连接到不同的网络,在隔离的网络中,某些服务可能会需要进行通信,此时服务器经过配置就可以承担起了转发数据包的功能. 一.Windows下实现端口映射 1. 查询端口 ...
[C#]关于DataDirectory的一些思考
笔者在使用Entity Framework中的Scaffolding机制自动创建拓展名为mdf的数据库及表单时,遇到如下的错误: A file activation error occurred. T ...
Django Restframework 过滤器
一.基本配置: 1.安装:pip install django-filter 2.将 django_filters 配置到INSTALLED-APPS中 3.对 REST_FRAMEWORK 配置: ...
阿里云服务器使用镜像市场上的环境以后sql不能远程问题
关于阿里云的服务器,首先要说的就是买了以后是没有环境的,什么都需要自己配置,也是在这个上面栽了很多跟头最后去的镜像市场买的一个IIS8+SQL2016的asp.net环境怎么说呢,感觉有些问题的本源 ...
单列模式，装饰器、new方法、类/静态方法实现单列模式
一.单列模式单例模式(Singleton Pattern)是一种常用的软件设计模式,该模式的主要目的是确保某一个类只有一个实例存在. 如,某个服务器程序的配置信息存放在一个文件中,客户端通过一个 C ...
Redis集群搭建过程
我在搭建Redis集群过程中遇到了一些问题,现记录下来. Redis搭建需要在系统中安装好ruby.gem.zlib等工具,可参考https://www.cnblogs.com/wuxl360/p/5 ...

sklearn训练感知器用iris数据集

sklearn训练感知器用iris数据集的更多相关文章

随机推荐

热门专题