支持向量机(Support Vector Machine, SVM)本身是一个二元分类算法,是对感知器算法模型的一种扩展。

1. 铺垫 感知器算法模型

什么是感知器算法模型?

感知器算法是最古老的分类算法之一,原理比较简单,不过模型的分类泛化能力比较弱,不过感知器模型是SVM、神经网络、深度学习等算法的基础。

感知器的思想很简单:在任意空间中,感知器模型寻找的就是一个超平面,能够把所有的二元类别分割开。感知器模型的前提是:数据是线性可分的。



找到这样的参数θ: 让一个类别的样本满足:θx>0 ;另外一个类别的满足:θx<0

正确分类:yθx>0,

错误分类:yθx<0

所以我们可以定义我们的损失函数为:期望使分类错误的所有样本到超平面的距离之和最小。

参考下逻辑回归:

逻辑回归的几何意义,又何尝不是向量空间找到一个超平面,超平面一侧的点计算分数结果为负,另一侧结果分数为正(感知器算法模型),只不过最后不直接看sign符号,而是根据sigmoid函数将分数映射到0-1之间通过最大似然来赋予概率意义。

感知器算法模型:向量空间找到一个超平面,超平面一侧的点计算分数结果为负,另一侧结果分数为正, sign(θx)

几何距离:

高维空间中,任意一个点 X0 其对应标签为 y0,到某平面的距离



对于那些正确分类的点,将距离表示为:

分子部分

称为函数距离

损失函, 对于分类错误的点,

要想使得损失函数是大于 0 的,所以分类错误的点距离在前面加个负号



当分子扩大 N 倍的时候,分母也会随之扩大,也就是说分子和分母之间存在倍数关系,所以可以固定分子或者分母为 1, 我们固定分母为1;



不过由于这里的 m 是分类错误的样本点集合,不是固定的,所以我们不能使用批量梯度下降法(BGD)求解

2. SVM 算法思想

SVM 也是通过寻找超平面,用于解决二分类问题的分类算法

超平面一侧的点计算分数结果为负是负例,另一侧结果分数为正是正例

与感知机相同,通过 sign 给出预测标签,正例为+1,负例为-1,模型判别式同样:

不同点:

感知器 是通过 判断错误的点 寻找超平面

逻辑回归 是通过 输出概率的 最大似然 来求解参数

SVM是通过寻找 支撑向量 来寻找 超平面

通过寻找支撑向量来寻找超平面??? 什么意思? 不太懂?后文 还回继续讲解

感知器算法模型 寻找 超平面 将 正例 负例 区分开来即可 所以新来的样本泛华能力 表现一般。

这些分界线哪个更好,这便是 SVM 要解决的问题

实际上离超平面足够远的点基本上都是被正确分类的,

所以这个是没有意义的;反而比较关心那些离超平面很近的点,这些点比较容易分错



假设未来拿到的数据含有一部分噪声,那么不同的超平面对于噪声的容忍度是不同的,

最右边的线是最 robust 的。

换一种角度考虑,找到最胖的超平面--换句话说 就是:只要让离超平面比较近的点尽可能的远离这个超平面, 那么我们的模型分类

效果应该就会比较不错。离超平面比较近的点 就是需要寻找的支撑向量

距离超平面最近的且满足一定条件的几个训练样本点被称为支持向量

一句话总结:SVM 尝试找到一个决策边界,距离两个类别最近的样本最远, 这样的超平面 则是符合条件的 超平面!!

需要找到一个超平面:

  1. 能够完美分类正负例
  2. 距离最近的点越远越好

    正确分类的平面中,距离越近的点越远越好

    也就是说,找到一组最好的 w 和 b 固定一个超平面,使这个超平面在能完美区分正负例的

    基础上,距离最近的点间隔最大

转化成数学描述:



一个超平面对应无数个 w,b,只要找到其中任意一个 w 符合条件的 w 就可以了选择最好求的



等价于:



本质上这里 不就是L2范数最小

铺垫 拉格朗日函数

原始问题:

约束条件表述为 k 个不等式约束条件,和 L 个等式约束条件

转化成拉格朗日函数:



其中 ci 是第 i 个不等式约束函数(需要整理),bj 是第 j 个等式约束函数αi 和βi 是拉格朗日乘子

原始问题:

构建拉个朗日函数:



对偶原理:

转化成:

下面就开始求解对偶函数的第一步

拉格朗日函数分别求 w 和 b 的偏导:

将 w 反代回原来的拉格朗日函数中就可

以进行第二步求关于α的极大了

第二步对对偶函数的优化问题

去掉负号转换为求极小问题

只要解决了这个问题,svm 的学习问题就完成了

通常使用 SMO 算法进行求解,可以求得一组α* 使得函数最优化

smo算法 后面再讲, 假设我们已经得到α*

将xi yi带入就能求得w*

b*怎么求解?对于支持向量 上的点 满足:

如何寻找 支持向量?

ktt条件:

那么所有α>0 时后面一项需要=0 也就是

支持向量

求 b 的过程:找到所有个支持向量带进去求出所有个 b,然后求平均这样我们就得到了分割超平面

这样我们就得到了分割超平面

3. 硬分割SVM总结

1:目标: 求得一组 w 和 b 使得分隔 margin 最大

2. 通过拉格朗日函数构造目标函数,问题由求得 n 个 w 和 1 个 b 转换为求得

m 个α



3. 利用 smo 算法求得 m 个α*

4. 利用求得的 m 个α求得 w和 b*

机器学习-线性分类-SVM支持向量机算法-12的更多相关文章

  1. SVM 支持向量机算法-实战篇

    公号:码农充电站pro 主页:https://codeshellme.github.io 上一篇介绍了 SVM 的原理和一些基本概念,本篇来介绍如何用 SVM 处理实际问题. 1,SVM 的实现 SV ...

  2. 机器学习(七):梯度下降解决分类问题——perceptron感知机算法与SVM支持向量机算法进行二维点分类

    实验2 感知机算法与支持向量机算法 一.预备知识 1.感知机算法 二.实验目的 掌握感知机算法的原理及设计: 掌握利用感知机算法解决分类问题. 三.实验内容 设计感知机算法求解, 设计SVM算法求解( ...

  3. SVM(支持向量机)算法

    第一步.初步了解SVM 1.0.什么是支持向量机SVM 要明白什么是SVM,便得从分类说起. 分类作为数据挖掘领域中一项非常重要的任务,它的目的是学会一个分类函数或分类模型(或者叫做分类器),而支持向 ...

  4. 深入浅出理解SVM支持向量机算法

      支持向量机是Vapnik等人于1995年首先提出的,它是基于VC维理论和结构风险最小化原则的学习机器.它在解决小样本.非线性和高维模式识别问题中表现出许多特有的优势,并在一定程度上克服了" ...

  5. SVM 支持向量机算法介绍

    转自:https://zhuanlan.zhihu.com/p/21932911?refer=baina 参考:http://www.cnblogs.com/LeftNotEasy/archive/2 ...

  6. SVM 支持向量机算法-原理篇

    公号:码农充电站pro 主页:https://codeshellme.github.io 本篇来介绍SVM 算法,它的英文全称是 Support Vector Machine,中文翻译为支持向量机. ...

  7. SVM支持向量机算法

    支持向量机(SVM)是另一类的学习系统,其众多的优点使得他成为最流行的算法之一.其不仅有扎实的理论基础,而且在许多应用领域比大多数其他算法更准确.  1.线性支持向量机:可分情况 根据公式(1)< ...

  8. 跟我学算法-svm支持向量机算法推导

    Svm算法又称为支持向量机,是一种有监督的学习分类算法,目的是为了找到两个支持点,用来使得平面到达这两个支持点的距离最近. 通俗的说:找到一条直线,使得离该线最近的点与该线的距离最远. 我使用手写进行 ...

  9. 机器学习(Machine Learning)算法总结-决策树

    一.机器学习基本概念总结 分类(classification):目标标记为类别型的数据(离散型数据)回归(regression):目标标记为连续型数据 有监督学习(supervised learnin ...

  10. 支持向量机 (一): 线性可分类 svm

    支持向量机(support vector machine, 以下简称 svm)是机器学习里的重要方法,特别适用于中小型样本.非线性.高维的分类和回归问题.本系列力图展现 svm 的核心思想和完整推导过 ...

随机推荐

  1. flask上下文、g变量、current_app

    在flask中的上下文分为两种 : 请求上下文 (request context) 也就是和请求相关的上下文,记录一些请求相关的数据. 包含: 1.request请求对象 2.session会话 应用 ...

  2. IIS下使用SSL证书

    IIS下使用SSL证书 本文介绍windowsServer下SSL证书配置及IIS站点配置 1.    生成SSL证书 在阿里云申请免费SSL证书 登录阿里云管理控制台,打开SSL证书管理 选择免费证 ...

  3. 华企盾DSC导致金蝶导入Excel导入不了的问题

    需要把Excel的OLE控制关掉,并且金蝶的进程和Excel的进程高级设置要么都启用重定向,要么都不启用重定向

  4. SpringCloud OpenFeign的使用

    SpringCloud OpenFeign的使用 是什么: 声明式http客户端. 目的: 使远程调用更简单 作用: 提供了http请求模板,仅需编写简单接口和插入注解,就可以定义好原始http请求的 ...

  5. 使用gradle的方式进行Springboot3的web开发(微服务版)

    简要: 最近看了很多的Springboot3的项目,但是发现很多都是用maven来进行版本管理的,很少有用gradle来管理的,通过网上查找资料,看视频,终于自己写一个gradle管理的Springb ...

  6. 使用Bot Framework建立你的第一个聊天机器人

    今天微软给我推送了一个邮件,大概是微软近期开发了很多人工智能相关的API,无意中看到了Bot Framework,就点进去看了看似乎还蛮有意思的.于是准备搭建一个环境试试. 第一步需要下载Bot Ap ...

  7. 斯坦福 UE4 C++ ActionRoguelike游戏实例教程 12.认识GamePlayTag, 实现技能的互斥

    斯坦福课程 UE4 C++ ActionRoguelike游戏实例教程 0.绪论 概述 本篇文章对应Lecture 17 - GameplayTags, 67.67节.本文将会讲述UE4中Gamepl ...

  8. DWS临时内存不可用报错: memory temporarily unavailable

    本文分享自华为云社区<DWS临时内存不可用报错: memory temporarily unavailable>,作者:漫天. 1.定位报错的DN/CN 当出现memory tempora ...

  9. CANN开发实践:4个DVPP内存问题的典型案例解读

    摘要:由于DVPP媒体数据处理功能对存放输入.输出数据的内存有更高的要求(例如,内存首地址128字节对齐),因此需调用专用的内存申请接口,那么本期就分享几个关于DVPP内存问题的典型案例,并给出原因分 ...

  10. MySQL 数据库救火:磁盘爆满了,怎么办?

    摘要:当磁盘空间爆满后,MySQL会发生什么事呢?又应该怎么应对? 本文分享自华为云社区<[MySQL 数据库救火]- 磁盘突然爆满的处理方式>,原文作者:技术火炬手 . 大多数用户在对于 ...