机器学习：Python中如何使用支持向量机(SVM)算法

(简单介绍一下支持向量机，详细介绍尤其是算法过程可以查阅其他资)

在机器学习领域，支持向量机SVM(Support Vector Machine)是一个有监督的学习模型，通常用来进行模式识别、分类(异常值检测)以及回归分析。

其具有以下特征：

(1)SVM可以表示为凸优化问题，因此可以利用已知的有效算法发现目标函数的全局最小值。而其他分类方法都采用一种基于贪心学习的策略来搜索假设空间，这种方法一般只能获得局部最优解。

(2) SVM通过最大化决策边界的边缘来实现控制模型的能力。尽管如此，用户必须提供其他参数，如使用核函数类型和引入松弛变量等。

(3)SVM一般只能用在二类问题，对于多类问题效果不好。

1. 下面是代码及详细解释(基于sklearn包)：

from sklearn import svm

import numpy as np

import matplotlib.pyplot as plt

#准备训练样本

x=[[1,8],[3,20],[1,15],[3,35],[5,35],[4,40],[7,80],[6,49]]

y=[1,1,-1,-1,1,-1,-1,1]

##开始训练

clf=svm.SVC()  ##默认参数：kernel='rbf'

clf.fit(x,y)

#print("预测...")

#res=clf.predict([[2,2]])  ##两个方括号表面传入的参数是矩阵而不是list

##根据训练出的模型绘制样本点

for i in x:

    res=clf.predict(np.array(i).reshape(1, -1))

    if res > 0:

        plt.scatter(i[0],i[1],c='r',marker='*')

    else :

        plt.scatter(i[0],i[1],c='g',marker='*')

##生成随机实验数据(15行2列)

rdm_arr=np.random.randint(1, 15, size=(15,2))

##回执实验数据点

for i in rdm_arr:

    res=clf.predict(np.array(i).reshape(1, -1))

    if res > 0:

        plt.scatter(i[0],i[1],c='r',marker='.')

    else :

        plt.scatter(i[0],i[1],c='g',marker='.')

##显示绘图结果

plt.show()

结果如下图：

从图上可以看出，数据明显被蓝色分割线分成了两类。但是红色箭头标示的点例外，所以这也起到了检测异常值的作用。

2.在上面的代码中提到了kernel='rbf',这个参数是SVM的核心：核函数

重新整理后的代码如下：

from sklearn import svm

import numpy as np

import matplotlib.pyplot as plt

##设置子图数量

fig, axes = plt.subplots(nrows=2, ncols=2,figsize=(7,7))

ax0, ax1, ax2, ax3 = axes.flatten()

#准备训练样本

x=[[1,8],[3,20],[1,15],[3,35],[5,35],[4,40],[7,80],[6,49]]

y=[1,1,-1,-1,1,-1,-1,1]

'''

    说明1：

       核函数(这里简单介绍了sklearn中svm的四个核函数，还有precomputed及自定义的)

    LinearSVC：主要用于线性可分的情形。参数少，速度快，对于一般数据，分类效果已经很理想

    RBF:主要用于线性不可分的情形。参数多，分类结果非常依赖于参数

    polynomial:多项式函数,degree 表示多项式的程度-----支持非线性分类

    Sigmoid：在生物学中常见的S型的函数，也称为S型生长曲线

    说明2：根据设置的参数不同，得出的分类结果及显示结果也会不同

'''

##设置子图的标题

titles = ['LinearSVC (linear kernel)',

          'SVC with polynomial (degree 3) kernel',

          'SVC with RBF kernel',      ##这个是默认的

          'SVC with Sigmoid kernel']

##生成随机试验数据(15行2列)

rdm_arr=np.random.randint(1, 15, size=(15,2))

def drawPoint(ax,clf,tn):

    ##绘制样本点

    for i in x:

        ax.set_title(titles[tn])

        res=clf.predict(np.array(i).reshape(1, -1))

        if res > 0:

           ax.scatter(i[0],i[1],c='r',marker='*')

        else :

           ax.scatter(i[0],i[1],c='g',marker='*')

     ##绘制实验点

    for i in rdm_arr:

        res=clf.predict(np.array(i).reshape(1, -1))

        if res > 0:

           ax.scatter(i[0],i[1],c='r',marker='.')

        else :

           ax.scatter(i[0],i[1],c='g',marker='.')

if __name__=="__main__":

    ##选择核函数

    for n in range(0,4):

        if n==0:

            clf = svm.SVC(kernel='linear').fit(x, y)

            drawPoint(ax0,clf,0)

        elif n==1:

            clf = svm.SVC(kernel='poly', degree=3).fit(x, y)

            drawPoint(ax1,clf,1)

        elif n==2:

            clf= svm.SVC(kernel='rbf').fit(x, y)

            drawPoint(ax2,clf,2)

        else :

            clf= svm.SVC(kernel='sigmoid').fit(x, y)

            drawPoint(ax3,clf,3)

    plt.show()

结果如图：

由于样本数据的关系，四个核函数得出的结果一致。在实际操作中，应该选择效果最好的核函数分析。

3.在svm模块中还有一个较为简单的线性分类函数：LinearSVC()，其不支持kernel参数，因为设计思想就是线性分类。如果确定数据

可以进行线性划分，可以选择此函数。跟kernel='linear'用法对比如下：

from sklearn import svm

import numpy as np

import matplotlib.pyplot as plt

##设置子图数量

fig, axes = plt.subplots(nrows=1, ncols=2,figsize=(7,7))

ax0, ax1 = axes.flatten()

#准备训练样本

x=[[1,8],[3,20],[1,15],[3,35],[5,35],[4,40],[7,80],[6,49]]

y=[1,1,-1,-1,1,-1,-1,1]

##设置子图的标题

titles = ['SVC (linear kernel)',

          'LinearSVC']

##生成随机试验数据(15行2列)

rdm_arr=np.random.randint(1, 15, size=(15,2))

##画图函数

def drawPoint(ax,clf,tn):

    ##绘制样本点

    for i in x:

        ax.set_title(titles[tn])

        res=clf.predict(np.array(i).reshape(1, -1))

        if res > 0:

           ax.scatter(i[0],i[1],c='r',marker='*')

        else :

           ax.scatter(i[0],i[1],c='g',marker='*')

    ##绘制实验点

    for i in rdm_arr:

        res=clf.predict(np.array(i).reshape(1, -1))

        if res > 0:

           ax.scatter(i[0],i[1],c='r',marker='.')

        else :

           ax.scatter(i[0],i[1],c='g',marker='.')

if __name__=="__main__":

    ##选择核函数

    for n in range(0,2):

        if n==0:

            clf = svm.SVC(kernel='linear').fit(x, y)

            drawPoint(ax0,clf,0)

        else :

            clf= svm.LinearSVC().fit(x, y)

            drawPoint(ax1,clf,1)

    plt.show()

结果如图所示：

机器学习：Python中如何使用支持向量机(SVM)算法的更多相关文章

一步步教你轻松学支持向量机SVM算法之案例篇2
一步步教你轻松学支持向量机SVM算法之案例篇2 (白宁超 2018年10月22日10:09:07) 摘要:支持向量机即SVM(Support Vector Machine) ,是一种监督学习算法,属于 ...
一步步教你轻松学支持向量机SVM算法之理论篇1
一步步教你轻松学支持向量机SVM算法之理论篇1 (白宁超 2018年10月22日10:03:35) 摘要:支持向量机即SVM(Support Vector Machine) ,是一种监督学习算法,属于 ...
4、2支持向量机SVM算法实践
支持向量机SVM算法实践利用Python构建一个完整的SVM分类器,包含SVM分类器的训练和利用SVM分类器对未知数据的分类, 一.训练SVM模型首先构建SVM模型相关的类 class SVM: ...
Spark机器学习系列之13：支持向量机SVM
Spark 优缺点分析以下翻译自Scikit. The advantages of support vector machines are: (1)Effective in high dimensi ...
spark机器学习从0到1支持向量机SVM(五）
分类分类旨在将项目分为不同类别. 最常见的分类类型是二元分类,其中有两类,通常分别为正数和负数. 如果有两个以上的类别,则称为多类分类. spark.mllib支持两种线性分类方法:线性支持 ...
吴恩达机器学习笔记（六） —— 支持向量机SVM
主要内容: 一.损失函数二.决策边界三.Kernel 四.使用SVM (有关SVM数学解释:机器学习笔记(八)震惊!支持向量机(SVM)居然是这种机) 一.损失函数二.决策边界对于: 当C非常 ...
机器学习(四)：通俗理解支持向量机SVM及代码实践
上一篇文章我们介绍了使用逻辑回归来处理分类问题,本文我们讲一个更强大的分类模型.本文依旧侧重代码实践,你会发现我们解决问题的手段越来越丰富,问题处理起来越来越简单. 支持向量机(Support Vec ...
python中的MRO和C3算法
一. 经典类和新式类 1.python多继承在继承关系中,python子类自动用友父类中除了私有属性外的其他所有内容.python支持多继承.一个类可以拥有多个父类 2.python2和python ...
机器学习-Python中训练模型的保存和再使用
模型保存 BP:model.save(save_dir) SVM: from sklearn.externals import joblib joblib.dump(clf, save_dir) 模型 ...

随机推荐

安卓UDP通信
功能: 实现了单次一发一收: import java.net.*; import java.io.*; public class udpRecv { /* * 创建UDP传输的接收端 * 1.建立ud ...
Unity预计算光照的学习(速度优化,LightProb,LPPV)
1.前言写这篇文章一方面是因为unity的微博最近出了关于预计算光照相关的翻译文章,另一方面一些美术朋友一直在抱怨烘培速度慢所以抱着好奇的心态来学习一下unity5的PRGI预计算实时光照 2.基 ...
Redis参数配置和运维说明
开发过程中使用缓存的情况还是比较多的,记录一下Redis的参数说明以备以后查看: #Redis Config daemonize yes pidfile /var/run/redis.pid port ...
C# 基础控制台程序的创建，输出，输入，定义变量，变量赋值，值覆盖，值拼接，值打印
基础学习内容有 Console.WriteLine("要输出的内容");//往外输出内容的 Console.ReadLine(); //等待用户输入,按回车键结束,防止程序闪退控 ...
对象this的引用
this关键字的最大作用就是让类中一个方法,访问该类里的另一个方法或者实例变量. public class Dog {//定义一个方法 public void jump() { System.out. ...
js设计模式--工厂模式
工厂模式: 工厂模式的目的是为了创建对象,它经常是在类和类的方法中实现.简单的工厂模式是由一个方法来决定到底要创建哪类的实例,这些实例经常拥有相同的接口,这种模式在所实例化的类型在编译期并不确定,而是 ...
KMP算法的正确性证明及一个小优化
直接把作业帖上来是不是有点不太公道呀... 无所谓啦反正各位看着开心就行 KMP算法对于模式串$P$,建立其前缀函数$ N$ ,其中$N [q] $ 表示在$P$中,以$q$位置为结束的可以匹配到前 ...
【转载】HTTP Cookie学习笔记
什么是cookie? cookie是什么?是饼干,小甜点? No! No! No! 我今天要总结的cookie并不是你所想的小甜心,我这里要说的cookie是Web开发中的一个重要的"武器& ...
angular : ng-animate : ng-show 原理，详解
这是我第一次写博客,请大家多多指教^^ 拷贝试试 <!DOCTYPE html> <html> <head> <meta http-equiv="C ...
Cocos2dx热更新遇到的那些坑
1.Cocos2dx热更新因为文件名含有空格,ios下载失败bug修改问题描述: 项目中偶尔遇到美术图片命名时不规范,导致图片名字含有空格.导致ios热更新时,遇到下载失败. 解决方案: 1.从新改 ...

机器学习：Python中如何使用支持向量机(SVM)算法

机器学习：Python中如何使用支持向量机(SVM)算法的更多相关文章

随机推荐

热门专题