SVM学习笔记-线性支撑向量机

　　对于PLA算法来说，最终得到哪一条线是不一定的，取决于算法scan数据的过程。
　　
　　从VC bound的角度来说，上述三条线的复杂度是一样的
　　
　　Eout(w)≤Ein0+Ω(H)dvc=d+1
　　
　　直观来看，最右边的线是比较好的hyperplane。
　　
　　为什么最右边的分隔面最好？
　　
　　对于测量误差的容忍度是最好的。例如对于每张图片中左下角的样本点，当未来要判定与该点非常接近的点（有可能它们的feature本来就是一样的，只不过因为测量的误差的存在，所以feature变得有点不同了）的label的时候，最右边的hyperplane对这些误差会有最大的容忍度。
　　
　　tolerate more noise ⟶ more robust to overfitting
　　
　　当对测量误差有更大的容忍度的时候，就能更加避免过拟合的情况出现。
　　
　　所以我们想要找的超平面就是能够更大的容忍测量误差的超平面。直观上来说，就是找这样的一个超平面，离这个超平面最近的点的到这个超平面的距离也是很大的。
　　
　　这里写图片描述
　　
　　“胖”分割面
　　
　　如下图所以，我们想要找的是“最胖”的那条线。
　　
　　这里写图片描述
　　
　　最大间隔分类超平面
　　
　　maxwsubject to fatness(w)w classifies every (xn,yn) correctlyfatness(w)=minn−1,⋯,N distance(xn,w)
　　
　　即我们要找一条线w，首先这条线要正确的划分每一个实例(w classifies every (xn,yn) correctly)。其次这条线要是最”胖”的(maxw fatness(w))。线w的”胖”的衡量方法是:到所有的点中距离最近的点的长度作为该w的fatness(胖瘦程度)。一句话:找能正确划分数据的最胖的线。
　　
　　fatness: 正式的表达为margin
　　
　　correctness: 要求yn=sign(wTxn)
　　
　　上述的表达可以进一步数学化为：
　　
　　maxwsubject to margin(w) every ynwTxn>0margin(w)=minn−1,⋯,N distance(xn,w)
　　
　　goal: 找最大间隔（margin）的分类超平面
　　
　　最大间隔问题
　　
　　点到超平面的距离
　　
　　上面提到了我们要找最“胖”的线，这里涉及到了一个距离的计算。那么怎么算一个点x到平面wTx+b=0的距离。
　　
　　这里写图片描述
　　
　　考虑在平面上的两个点x′,x′′, 那么有
　　
　　wTx′=−b, wTx′′=−b
　　
　　两式相减：
　　
　　wT(x′′−x′)vector www.txfenfenc11.cn on hyperplane=0
　　
　　所以可以得到w是该平面的法向量。（x′′−x′是该平面的任意向量，w和该平面的任意向量垂直）。
　　
　　那么x到平面的距离公式如下（投影）：
　　
　　distance(x,b,w)=|wT||w||(x−x′)|=1||w|||wTx+b|
　　
　　其中，b,w代表平面。距离即是求x−x′在w上投影的长度。第二步化简用到wTx′=−b。
　　
　　到分隔超平面的距离
　　
　　上一节中推导了点到平面的距离计算方法，
　　
　　distance(x,b,w)=1||w|||wTx+b|
　　
　　对于我们最终想要得到的分隔超平面，我们可以得到如下的结果：
　　
　　yn(wTxn+b)>0
　　
　　那么任意一个点到分隔超平面的距离可以变为：
　　
　　distance(xn,b,w)=1||w||yn(wTxn+b)
　　
　　即我们想要做的事情变为：
　　
　　maxw.bsubject to margin(w,b) every yn(wTxn+b)>0margin(w,b)=minn=1,⋯,N 1||w||yn(wTxn+b)
　　
　　我们最终想要找的是一个hyperplane，也就是wTx+b=0(我们现在在选择它的系数w和b)。情况是这样的： wTx+b=0和3wTx+3b=0是没有什么差别的，只是进行了系数的放缩，其实是一个超平面，在二维就表示一条直线。那么在这里我们考虑一个很特别的放缩使得：
　　
　　minn=1,⋯,N yn(wTxn+b)=1
　　
　　这样的放缩总是可以做到的。这样的话：
　　
　　margin(w,b)=1||w||
　　
　　原来的问题变为：
　　
　　maxw.bsubject to 1||w|| every yn(wTxn+b)>0minn=1,⋯,N yn(wTxn+b)=1
　　
　　进一步可以变为：
　　
　　maxw.bs.t. 1||w|| minn=1,⋯,N yn(wTxn+b)=1
　　
　　条件minn=1,⋯,N yn(wTxn+b) www.wmyl11.com =1包括every www.zbcppt.com yn(wTxn+b)>0，所以后者可以去掉。
　　
　　最大间隔问题
　　
　　我们进一步得到了描述比较简单的间隔最大化问题的需求。
　　
　　maxw.bs.t. 1||w|| www.caihonyule.com/ minn=1,⋯,N www.chushiyl.cn/ yn(wTxn+b)=1
　　
　　现在的目标是要把条件中的min操作去掉。我们将条件minn=1,⋯,N yn(wTxn+b)=1放宽至：for all n都有yn(wTxn+b)≥1。现在我们担心的问题是：原来的条件要求最小的yn(wTxn+b)等于1，而现在要求所有的yn(wTxn+b)大于等于1。那么在新的条件下会不会正好存在这样的w使得所有的yn(wTxn+b)都大于1了，这样我们放宽条件就出了问题，因为求得的解不在满足原来的条件了。
　　
　　以下将证明，即使放宽了条件，最佳解依然满足
　　
　　反证法：
　　
　　如果最佳解使得所有的都是大于1的，例如，那么我们进行一下缩放可知也是放松后问题的解。但是此时显然比会有更大的。所以假设：最佳解使得所有的都是大于1，是错误的。
　　
　　现在问题的形式变为：
　　
　　变为最小为问题：
　　
　　支撑向量机
　　
　　一个特例
　　
　　这里写图片描述
　　
　　图中的样本点和信息如下：
　　
　　根据最优化问题的要求我们需要满足一下4个条件：
　　
　　根据以上的两个式子可以得到：
　　
　　所以我们可以令。这样的话不仅仅满足了条件，也使得target function取得了最小的值。其中b的值可以通过计算一个范围得到。这样我们就得到了我们最想要的hyperplane：。这就是我们想要找的支撑向量机。
　　
　　此时。
　　
　　这里写图片描述
　　
　　我们可以看到有一些离hyperplane很近的点，也就是如图用方框框起来的那些点。这些点就可以确定我们想要的hyperplane，我们把这些点叫做Support Vector。可以理解为这些支撑向量就可以确定我们想要的分割超平面，而不需要其他的点。
　　
　　SVM的一般解法
　　
　　通过分析可知，我们想要最小化的问题是个的二次函数，该问题的条件是的线性一次式。我们把这样的问题叫做二次规划（Quadratic programming）
　　
　　所以我们的一个解法是将我们的问题表示为二次规划的标准形式，然后就可以调用二次规划的包进行运算。
　　
　　标准的二次规划问题
　　
　　所以我们要确定其中的系数
　　
　　线性可分的硬间隔SVM算法
　　
　　使用二次规划解决SVM
　　
　　表示为规范的问题，
　　
　　return as
　　
　　note：
　　
　　hard-margin：表明我们坚持要将正例和负例完全的分开。
　　
　　linear：表明我们是在使用来训练SVM，我们得到的是在空间中的分割超平面。而没有经过任何的特转换
　　
　　所以如果我们想要一个非线性的hyperplane，可以使用

SVM学习笔记-线性支撑向量机的更多相关文章

统计学习方法：支撑向量机（SVM）
作者:桂. 时间:2017-05-13 21:52:14 链接:http://www.cnblogs.com/xingshansi/p/6850684.html 前言主要记录SVM的相关知识,参考 ...
8.支撑向量机SVM
1.什么是SVM 下面我们就来介绍一些SVM(Support Vector Machine),首先什么是SVM,它是做什么的?SVM,中文名是支撑向量机,既可以解决分类问题,也可以解决回归问题,我们来 ...
走过路过不要错过包你一文看懂支撑向量机SVM
假设我们要判断一个人是否得癌症,比如下图:红色得癌症,蓝色不得. 看一下上图,要把红色的点和蓝色的点分开,可以画出无数条直线.上图里黄色的分割更好还是绿色的分割更好呢?直觉上一看,就是绿色的线更好.对 ...
支撑向量机（SVM）
转载自http://blog.csdn.net/passball/article/details/7661887,写的很好,虽然那人也是转了别人的做了整理(最原始文章来自http://www.blog ...
SVM支撑向量机原理
转自:http://blog.csdn.net/v_july_v/article/details/7624837 目录(?)[-] 支持向量机通俗导论理解SVM的三层境界前言第一层了解SVM 1分 ...
SVM学习笔记（一）
支持向量机即Support Vector Machine,简称SVM.一听这个名字,就有眩晕的感觉.支持(Support).向量(Vector).机器(Machine),这三个毫无关联的词,硬生生地凑 ...
SVM学习笔记
一.SVM概述支持向量机(support vector machine)是一系列的监督学习算法,能用于分类.回归分析.原本的SVM是个二分类算法,通过引入“OVO”或者“OVR”可以扩展到多分类问题 ...
模式识别笔记3-支持向量机SVM
1. 线性SVM 对两类点的划分问题,这里对比下逻辑回归和SVM的区别: 逻辑回归的思想是,将所有点到决策平面的距离作为损失来进行训练,目标是到决策平面的距离和最小 SVM的思想是,只关注支持向量(图 ...
第11章支撑向量机SVM
Support Vector Machine , 问题:如果决策边界不唯一 , , , , , , , , s.t.(such that):之前都是全局最优化问题,这次是有条件的最优化问题 har ...

随机推荐

CF487E Tourists 圆方树、树链剖分
传送门注意到我们需要求的是两点之间所有简单路径中最小值的最小值,那么对于一个点双联通分量来说,如果要经过它,则一定会经过这个点双联通分量里权值最小的点注意:这里不能缩边双联通分量,样例\(2\)就 ...
Luogu T29912 fuck
这是QZEZ的Luogu团队中的一道难得的水题,题面和数据都是CJJ dalao出的,然后我就没有太看懂题意. 也是一道经典的割点好题,但需要一定的思维. 首先对于题意,它只需要得到切断的作用就可以了 ...
retinex图像增强算法的研究
图像增强方面我共研究了Retinex.暗通道去雾.ACE等算法.其实,它们都是共通的.甚至可以说,Retinex和暗通道去雾就是同一个算法的两个不同视角,而ACE算法又是将Retinex和灰度世界等白 ...
自己动手写把”锁”---LockSupport深入浅出
本篇是<自己动手写把"锁">系列技术铺垫的最后一个知识点.本篇主要讲解LockSupport工具类,它用来实现线程的挂起和唤醒. LockSupport是Java6引入 ...
React.js 开发参见问题 Q&A
文章中我整理了 React.js 开发过程中一些参见问题的解答汇总,供大家参考. 1. 一些课程资源课程完整的思维导图请查考文章:React.js 入门与实战课程思维导图,我使用的思维导图软件是 M ...
安装zkpython出错
pip3 install zkpython==0.4.2 提示:zookeeper.c:20:23: 致命错误:zookeeper.h:没有那个文件或目录解决: 1.是否安装python-devel ...
kvm虚拟化管理平台WebVirtMgr部署-完整记录(1)
公司机房有一台2U的服务器(64G内存,32核),由于近期新增业务比较多,测试机也要新增,服务器资源十分有限.所以打算在这台2U服务器上部署kvm虚拟化,虚出多台VM出来,以应对新的测试需求.当KVM ...
Node 系列之url模块
引入 url: const url = require("url"); 用于URL解析.处理等操作的解决方案 1.url.parse(urlStr[, parseQueryStri ...
UVA - 116 Unidirectional TSP 多段图的最短路 dp
题意略分析因为字典序最小,所以从后面的列递推,每次对上一列的三个方向的行排序就能确保,数字之和最小DP就完事了代码因为有个地方数组名next和里面本身的某个东西冲突了,所以编译错了,后来改成 ...
NEWBE CRALWER 产品需求文档
1.产品概述本产品是学霸软件系统的爬虫部分,由NEWBE团队负责.主要任务是从网上爬取出相关数据后提供给C705组使用. 2.产品的发展经历 2.1 产品的发展经历本产品从2014.10.29开始 ...

SVM学习笔记-线性支撑向量机

SVM学习笔记-线性支撑向量机的更多相关文章

随机推荐

热门专题