Python | 使用SVM支持向量机进行鸢尾花分类

运行环境

Python: 3.7.1

库: sklearn (Python的机器学习工具箱)

目的：

根据鸢尾花的四个特征，对三种鸢尾花进行分类

数据（共150行，这里截取前6行，完整数据以及代码的下载链接见文末）：

方法：调用内部SVM库进行鸢尾花分类

特征1	特征2	特征3	特征4	鸢尾花类型
5.1	3.5	1.4	0.2	Iris-setosa
4.9	3	1.4	0.2	Iris-setosa
4.7	3.2	1.3	0.2	Iris-setosa
4.6	3.1	1.5	0.2	Iris-setosa
5	3.6	1.4	0.2	Iris-setosa
5.4	3.9	1.7	0.4	Iris-setosa

代码如下：

from sklearn.model_selection import train_test_split

from sklearn import svm

data_Set = []

data_Set_x = []

data_Set_y = []

#打开数据集,字符串前加r表示raw string,防止路径字符串中存在的反斜杠带来的转义

data_file = open(r"D:\\Coding\\Py\\Machine-Learning\\SVM_OLD\\Data_SVM.csv")

#拆分数据集，取前四列为x，第五列为y

for line in data_file.readlines():

    lineArr = line.strip().split(',')

    data_Set.append(lineArr)

    data_Set_x.append(lineArr[0:4])

    data_Set_y.append(lineArr[4])

#按照7:3的比例分割训练集和测试集

data_train_x, data_test_x = train_test_split(data_Set_x,

                                             test_size=0.3,

                                             random_state=55)

data_train_y, data_test_y = train_test_split(data_Set_y,

                                             test_size=0.3,

                                             random_state=55)

"""

分别利用四种核函数进行训练，这些核函数都可以设置参数，例如

decision_function_shape='ovr'时，为one v rest，即一个类别与其他类别进行划分，

decision_function_shape='ovo'时，为one v one，即将类别两两之间进行划分，用二分类的方法模拟多分类的结果。

不设置的话会使用默认参数设置

"""

#使用linear线性核函数，C越大分类效果越好，但是可能过拟合

clf1 = svm.SVC(C=1, kernel='linear',

               decision_function_shape='ovr').fit(data_train_x, data_train_y)

#使用rbf径向基核函数,gamma值越小，分类界面越连续；gamma值越大，分类界面越“散”，分类效果越好，但有可能会过拟合。

clf2 = svm.SVC(C=1, kernel='rbf', gamma=1).fit(data_train_x, data_train_y)

#使用poly多项式核函数

clf3 = svm.SVC(kernel='poly').fit(data_train_x, data_train_y)

#使用sigmoid神经元激活核函数

clf4 = svm.SVC(kernel='sigmoid').fit(data_train_x, data_train_y)

#打印使用不同核函数进行分类时，训练集和测试集分类的准确率

print("linear线性核函数-训练集：", clf1.score(data_train_x, data_train_y))

print("linear线性核函数-测试集：", clf1.score(data_test_x, data_test_y))

print("rbf径向基核函数-训练集：", clf2.score(data_train_x, data_train_y))

print("rbf径向基函数-测试集：", clf2.score(data_test_x, data_test_y))

print("poly多项式核函数-训练集：", clf3.score(data_train_x, data_train_y))

print("poly多项式核函数-测试集：", clf3.score(data_test_x, data_test_y))

print("sigmoid神经元激活核函数-训练集：", clf4.score(data_train_x, data_train_y))

print("sigmoid神经元激活核函数-测试集：", clf4.score(data_test_x, data_test_y))

# 使用decision_function()可以查看决策函数

print(clf1.decision_function(data_train_x))

# 使用predict()可以查看预测结果

print(clf1.predict(data_train_x))

运行结果：

分类准确率

linear线性核函数-训练集： 1.0

linear线性核函数-测试集： 0.9555555555555556

rbf径向基核函数-训练集： 0.9904761904761905

rbf径向基函数-测试集： 0.9555555555555556

poly多项式核函数-训练集： 1.0

poly多项式核函数-测试集： 0.9333333333333333

sigmoid神经元激活核函数-训练集： 0.34285714285714286

sigmoid神经元激活核函数-测试集： 0.3111111111111111

决策函数（仅截取部分，每一列的值代表到各类别的举例）

[[-0.18006398  1.06550708  2.1145569 ]

 [-0.2266221   1.07558987  2.15103223]

 [-0.16806693  1.08720057  2.08086637]

 [ 2.07795355  1.29285195 -0.3708055 ]

 [-0.18840558  1.05553666  2.13286892]

 [-0.20384     1.10258546  2.10125453]

分类结果（仅截取部分）

['Iris-virginica' 'Iris-virginica' 'Iris-virginica' 'Iris-setosa'

 'Iris-virginica' 'Iris-virginica' 'Iris-setosa' 'Iris-versicolor'

 'Iris-virginica' 'Iris-versicolor' 'Iris-setosa' 'Iris-setosa'

代码以及数据集下载：

链接：https://pan.baidu.com/s/1iZo472Ynvav0mQK3VvpJFQ

提取码：ovri

参考文章：

Python | 使用SVM支持向量机进行鸢尾花分类的更多相关文章

Python实现SVM(支持向量机)
Python实现SVM(支持向量机) 运行环境 Pyhton3 numpy(科学计算包) matplotlib(画图所需,不画图可不必) 计算过程 st=>start: 开始 e=>end ...
python机器学习——SVM支持向量机
背景与原理: 支持向量机是一种用来解决分类问题的算法,其原理大致可理解为:对于所有$n$维的数据点,我们希望能够找到一个$n$维的直线(平面,超平面),使得在这个超平面一侧的点属于同一类,另一侧的点属 ...
机器学习之路: python k近邻分类器 KNeighborsClassifier 鸢尾花分类预测
使用python语言学习k近邻分类器的api 欢迎来到我的git查看源代码: https://github.com/linyi0604/MachineLearning from sklearn.da ...
python构建bp神经网络_鸢尾花分类(一个隐藏层)__2.代码实现
IDE:jupyter 数据集请查看:鸢尾花数据集测试效果预览成功率96.7% 代码已上传到码云
python构建bp神经网络_鸢尾花分类(一个隐藏层)__1.数据集
IDE:jupyter 目前我知道的数据集来源有两个,一个是csv数据集文件另一个是从sklearn.datasets导入 1.1 csv格式的数据集(下载地址已上传到博客园----数据集.rar) ...
pytorch解决鸢尾花分类
半年前用numpy写了个鸢尾花分类200行..每一步计算都是手写的 python构建bp神经网络_鸢尾花分类现在用pytorch简单写一遍,pytorch语法解释请看上一篇pytorch搭建简单网 ...
[Python]基于K-Nearest Neighbors[K-NN]算法的鸢尾花分类问题解决方案
看了原理,总觉得需要用具体问题实现一下机器学习算法的模型,才算学习深刻.而写此博文的目的是,网上关于K-NN解决此问题的博文很多,但大都是调用Python高级库实现,尤其不利于初级学习者本人对模型的理 ...
python机器学习之支持向量机SVM
支持向量机SVM(Support Vector Machine) 关注公众号"轻松学编程"了解更多. [关键词]支持向量,最大几何间隔,拉格朗日乘子法一.支持向量机的原理 Sup ...
SVM 支持向量机算法-实战篇
公号:码农充电站pro 主页:https://codeshellme.github.io 上一篇介绍了 SVM 的原理和一些基本概念,本篇来介绍如何用 SVM 处理实际问题. 1,SVM 的实现 SV ...
动手造轮子自己实现人工智能神经网络(ANN)，解决鸢尾花分类问题Golang1.18实现
人工智能神经网络( Artificial Neural Network,又称为ANN)是一种由人工神经元组成的网络结构,神经网络结构是所有机器学习的基本结构,换句话说,无论是深度学习还是强化学习都是基 ...

随机推荐

【python】无法安装pip，报错ImportError: No module named 'pip'解决方案
命令提示符输入以下代码即可 python -m ensurepip
AntDesignBlazor示例——创建列表页
本示例是AntDesign Blazor的入门示例,在学习的同时分享出来,以供新手参考. 示例代码仓库:https://gitee.com/known/AntDesignDemo 1. 学习目标使用 ...
nginx的keepalive和keepalive_requests(性能测试TPS波动)
当使用nginx作为反向代理时,为了支持长连接,需要做到两点: 从client到nginx的连接是长连接从nginx到server的连接是长连接保持和client的长连接: http { keep ...
09 - Shell流程控制语句
1. if-else语句能够使用if条件语句进行条件判断 1.1 if 语法 if 条件 then 命令 fi if 条件; then 命令; fi 1.2 if-else 语法 if 条件 the ...
UI自动化测试框架：数据驱动
一.UI自动化框架介绍测试框架使用了Po设计模式(Page Object),每一个页面用一个类来对应,这个类里面要实现所有核心页面元素的获取方法,类里面提供操作页面元素的所有方法. 这个框架实现几点 ...
后端程序员必会的前端知识-03：Vue2
三. Vue 2 1. Vue 基础 1) 环境准备安装脚手架 npm install -g @vue/cli -g 参数表示全局安装,这样在任意目录都可以使用 vue 脚本创建项目创建项目 vu ...
nginx+lua+redis实现灰度发布
前言: 授人以鱼不如授人以渔.先学会用,在学原理,在学创造,可能一辈子用不到这种能力,但是不能不具备这种能力.这篇文章主要是沉淀使用nginx+lua+redis实现灰度,当我们具备了这种能力,随时可 ...
JavaScript 文件优化指南
本文将探讨实用的 JavaScript 文件优化技术.如何处理与 JavaScript 文件相关的性能问题以及帮助优化过程的工具.你将获得提升web应用程序速度的相关知识,从而为你的用户提供无缝体验. ...
【Python】【OpenCV】Cameo项目（一）实时显示摄像头帧
Cameo项目介绍: 1.实时捕获并显示摄像头帧. 2.具备截图.保存视频和退出三个功能键. 要求存在文件:manager.py 和 cameo.py 一.manager.py 两个类:Capture ...
nodejs 中npm下载依赖速度慢的问题
已解决:nodejs 中npm下载依赖速度慢的问题强烈建议不要用直接使用 cnpm 安装,会有各种诡异的 bug 可以通过重新指定 registry 来解决 npm 安装速度慢的问题点击查看代码 ...

Python | 使用SVM支持向量机进行鸢尾花分类

Python | 使用SVM支持向量机进行鸢尾花分类的更多相关文章

随机推荐

热门专题