机器学习笔记—svm算法（上）

本文申明：本文原创，如转载请注明原文出处。

引言：上一篇我们讲到了logistic回归，今天我们来说一说与其很相似的svm算法，当然问题的讨论还是在线性可分的基础下讨论的。

很多人说svm是目前最好的分类器，那我们就来看看我们的svm好在哪里。

一：初识svm

问题：用一条直线把下图的圆球和五角星分离开来。

解答：有N种分法，如下图：

附加题：找出最佳分类？

解答：如图：

Exe me?鬼知道哪一条是最佳？？

等等这个最佳分类是不是等价于，地主让管家给两个儿子分地，是不是只要让两家之间一样多就可以了？那是不是就是那根红线让两家距离之和离分界线最远就可以了？

恭喜你，猜对了。

现在我们把问题上升到N维，就是说，我也不知道这个N维是什么样子，但是，我要在N维中把这两个东东分离开来。那么从直线ax+b就可以表示成超平面W^Tx+b去分开。示意图如下：

其中W=(W₁;W₂;…;W_d)为法向量，决定了这个超平面的方向，b为位移项，决定了超平面与原点之间的距离。显然这个超平面就是被W和b确定的。那求出这个超平面这个分类模型不就建立了吗。那就是最优化求最大间隔的问题。

说到间隔（margin）问题，我们来科普下函数间隔和几何间隔。

1.1函数间隔（functional margin）

假设图中A,B,C表示三个实例，A离超平面最近，那么预测正确的可能性就比较低，但是C离超平面H最远，那么预测正确的概率就比较高，B介于两者之间。

一般来说，一个点到一个超平面的距离可以表示为这个点预测的确信程度。这就是函数间隔。

对于给定的训练数据集T和超平面(w,b)，定义超平面关于样本点(x_i,y_i)的函数间隔为：

1.2 几何间隔

函数间隔可以表示预测的正确性以及确信度，但是当我们选择最优的超平面的时候，只有函数间隔还不够，主要按照比例改变W和b那么超平面没有变，但是函数间隔却变成了原来的两倍，我们可以对分离超平面的法向量进行约束，例如规范化，||w||=1,这样就使得间隔是确定的，这样函数间隔就变成了几何间隔。

假设B在这条分割线面上，分割线外的一点，到这个平面的距离用表示，任何一个点在这个超平面分割面上都有一个投影，现在假设，A的投影就是B，那么BA就是A到B的距离，w就是它的法向量,其中w/||w||为单位向量，假设A（xⁱ,yⁱ）那么B的x坐标为xⁱ- w/||w||。把B的横坐标带入wTX+b=0,得到：

进一步化简：

所以当||w||=1的时候，无乱扩大几倍，对距离都没有影响，这叫做几何距离。

1.3间隔最大化

现在我们知道分离超平面有无数个，但是几何间隔最大化只有一个，而SVM的思想就是寻找这个能让间隔最大化的超平面，把这个作为分类的标准。那么这个问题就可以表示成约束最优化问题：

s.t.

||w||=1

这里用||w||=1 规约 w，使得 + 是几何间隔,考虑到函数间隔和几何间隔的关系：

所以上述公式可以改写为：

s.t.

求上述的最大值，就等价于求||w||的最小值问题。等价于：

Min (w,b)

s.t.

好了终于到这一步了。

接下来介绍的是手工求解的方法了，一种更优的求解方法。

二：学习的对偶算法

为了求解线性可分的支持向量机的最优化问题，将它作为原始最优化问题，应用拉格朗日对偶性，求解对偶性问题去得到原始问题，这就是线性可分支持向量机的对偶算法。思想如图所示：

我想大家一看就会明白了。。。

补充（来自维基百科）：

首先，我们定义拉格朗日函数，对每一个不等式的约束条件引进拉格朗日乘子aⁱ>=0,i=1,2,3..,N,.则函数1为：

。

根据拉格朗日对偶性，原始问题的对偶问题是极大极小值问题：

那么为了得到对偶问题的解，需要先求L(w,b,a)的极小，再求对a的极大。

2.1求min L(w,b,a)

首先对函数1 分别对w,b求偏导并令其为0.

那么：

将上述两式带入到函数1可得：

即：

2.2求min L(w,b,a)对a的极大，即使对偶问题

。

这样就可以得到与之等价的对偶最优化问题：

。

现在对上式中a的解为a^*=( a₁^*, a₂^*,…a_n^*)^T,因为满足KKT条件那么就可以求得最优化问题的解w^*,b^*.

综上，分类决策函数可以写成：

下期预告：下期将会为大家带来线性不可分的情况，也是SVM最核心的“核武器”以及svm的优缺点，敬请关注！

机器学习笔记—svm算法（上）的更多相关文章

机器学习笔记——SVM
SVM(Support Vector Machine).中文名为支持向量机.就像自己主动机一样.听起来异常神气.最初总是纠结于不是机器怎么能叫"机",后来才知道事实上此处的&qu ...
机器学习笔记----- ID3算法的python实战
本文申明:本文原创,如有转载请申明.数据代码来自实验数据都是来自[美]Peter Harrington 写的<Machine Learning in Action>这本书,侵删. Hell ...
机器学习笔记--KNN算法2-实战部分
本文申明:本系列的所有实验数据都是来自[美]Peter Harrington 写的<Machine Learning in Action>这本书,侵删. 一案例导入:玛利亚小姐最近寂寞了, ...
机器学习笔记--KNN算法1
前言 Hello ,everyone. 我是小花.大四毕业,留在学校有点事情,就在这里和大家吹吹我们的狐朋狗友算法---KNN算法,为什么叫狐朋狗友算法呢,在这里我先卖个关子,且听我慢慢道来. 一 K ...
机器学习笔记—EM 算法
EM 算法所面对的问题跟之前的不一样,要复杂一些. EM 算法所用的概率模型,既含有观测变量,又含有隐变量.如果概率模型的变量都是观测变量,那么给定数据,可以直接用极大似然估计法,或贝叶斯估计法来估计 ...
机器学习之SVM算法
1.知识点 """ SVM,也称支持向量机:其优化核心为求取点到平面的距离最大化,主要是解决二分类问题 y = wx+b ,且 yi * y(i) >0 恒成立思 ...
Andrew Ng机器学习笔记+Weka相关算法实现（五）SVM最优间隔和核方法
这一章主要解说Ng的机器学习中SVM的兴许内容.主要包括最优间隔分类器求解.核方法. 最优间隔分类器的求解利用以一篇讲过的的原始对偶问题求解的思路,我们能够将相似思路运用到SVM的求解上来. 详细的 ...
机器学习中的算法(2)-支持向量机(SVM)基础
版权声明:本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请联系wheeleast@gma ...
转：机器学习中的算法(2)-支持向量机(SVM)基础
机器学习中的算法(2)-支持向量机(SVM)基础转:http://www.cnblogs.com/LeftNotEasy/archive/2011/05/02/basic-of-svm.html 版 ...

随机推荐

SQL Server 2012 The report server cannot open a connection to the report server database
案例环境: 操作系统版本: Windows Server 2012 R2 Standard 数据库版本 : SQL SERVER 2012 SP2 案例介绍: 今天进入一台新安装的SQL ...
css3【语法要点】
语法要点 display: -webkit-box; /* 老版本语法: Safari, iOS, Android browser, older WebKit browsers. */ display ...
ORA-01033因误删表空间文件导致的解决方案
该类问题通常是由于表空间操作不当引起的.解决方法: SQL*Plus无法连接,显示以下错误:ORA-01033:ORACLE initialization or shutdown in progres ...
如何穿越到android底层
对于android开发,实际上大部分工作都是在应用层,但为了体现"技术含量",以及"知其所以然",以便在遇到问题是不至于束手无策.因此有必要了解底层的工作机制. ...
对iOS后台模式最多10分钟运行时间的进一步理解
在app进入后台时,系统初始默认是只有10s的处理时间,但如果10s不够,我们可以主动申请,网上流传最多的一个说法是10分钟. 但这种说法有个前提: 那就是iOS7之前,是这样但从iOS7开始,我们 ...
JavaScript根据文件名后缀判断是否图片文件
//JavaScript根据文件名后缀判断是否图片文件 //图片文件的后缀名 var imgExt = new Array(".png",".jpg",&quo ...
解决Android Graphical Layout 界面效果不显示
解决Android Graphical Layout 界面效果不显示 qq463431476
[C#] 逆袭——自制日刷千题的AC自动机攻克HDU OJ
前言做过杭电.浙大或是北大等ACM题库的人一定对“刷题”不陌生,以杭电OJ为例:首先打开首页(http://acm.hdu.edu.cn/),然后登陆,接着找到“Online Exercise”下的 ...
简易的轮廓边生成（N和V dot点乘方式）（surface方式和vs ps 方式的分别实现）
一.前面心情 1.公司我的架构发生变动,从技术中心到项目组了,但不管怎么样,该看的还要看,总会用到二.实现三.参考: http://blog.csdn.net/cubesky/article/de ...
js阿拉伯数字转中文大写
function DX(n) { if (!/^(0|[1-9]\d*)(\.\d+)?$/.test(n)) return "数据非法"; var unit = "千百 ...

机器学习笔记—svm算法（上）

机器学习笔记—svm算法（上）的更多相关文章

随机推荐

热门专题