机器学习-线性分类-SVM支持向量机算法-12
支持向量机(Support Vector Machine, SVM)本身是一个二元分类算法,是对感知器算法模型的一种扩展。
1. 铺垫 感知器算法模型
什么是感知器算法模型?
感知器算法是最古老的分类算法之一,原理比较简单,不过模型的分类泛化能力比较弱,不过感知器模型是SVM、神经网络、深度学习等算法的基础。
感知器的思想很简单:在任意空间中,感知器模型寻找的就是一个超平面,能够把所有的二元类别分割开。感知器模型的前提是:数据是线性可分的。

找到这样的参数θ: 让一个类别的样本满足:θx>0 ;另外一个类别的满足:θx<0
正确分类:yθx>0,
错误分类:yθx<0
所以我们可以定义我们的损失函数为:期望使分类错误的所有样本到超平面的距离之和最小。
参考下逻辑回归:
逻辑回归的几何意义,又何尝不是向量空间找到一个超平面,超平面一侧的点计算分数结果为负,另一侧结果分数为正(感知器算法模型),只不过最后不直接看sign符号,而是根据sigmoid函数将分数映射到0-1之间通过最大似然来赋予概率意义。
感知器算法模型:向量空间找到一个超平面,超平面一侧的点计算分数结果为负,另一侧结果分数为正, sign(θx)

几何距离:
高维空间中,任意一个点 X0 其对应标签为 y0,到某平面
的距离


对于那些正确分类的点,将距离表示为:

分子部分
称为函数距离
损失函, 对于分类错误的点,
要想使得损失函数是大于 0 的,所以分类错误的点距离在前面加个负号

当分子扩大 N 倍的时候,分母也会随之扩大,也就是说分子和分母之间存在倍数关系,所以可以固定分子或者分母为 1, 我们固定分母为1;

不过由于这里的 m 是分类错误的样本点集合,不是固定的,所以我们不能使用批量梯度下降法(BGD)求解

2. SVM 算法思想
SVM 也是通过寻找超平面,用于解决二分类问题的分类算法
超平面一侧的点计算分数结果为负是负例,另一侧结果分数为正是正例
与感知机相同,通过 sign 给出预测标签,正例为+1,负例为-1,模型判别式同样:

不同点:
感知器 是通过 判断错误的点 寻找超平面
逻辑回归 是通过 输出概率的 最大似然 来求解参数
SVM是通过寻找 支撑向量 来寻找 超平面
通过寻找支撑向量来寻找超平面??? 什么意思? 不太懂?后文 还回继续讲解
感知器算法模型 寻找 超平面 将 正例 负例 区分开来即可 所以新来的样本泛华能力 表现一般。

这些分界线哪个更好,这便是 SVM 要解决的问题
实际上离超平面足够远的点基本上都是被正确分类的,
所以这个是没有意义的;反而比较关心那些离超平面很近的点,这些点比较容易分错

假设未来拿到的数据含有一部分噪声,那么不同的超平面对于噪声的容忍度是不同的,
最右边的线是最 robust 的。
换一种角度考虑,找到最胖的超平面--换句话说 就是:只要让离超平面比较近的点尽可能的远离这个超平面, 那么我们的模型分类
效果应该就会比较不错。离超平面比较近的点 就是需要寻找的支撑向量

距离超平面最近的且满足一定条件的几个训练样本点被称为支持向量

一句话总结:SVM 尝试找到一个决策边界,距离两个类别最近的样本最远, 这样的超平面 则是符合条件的 超平面!!
需要找到一个超平面:
- 能够完美分类正负例
- 距离最近的点越远越好
正确分类的平面中,距离越近的点越远越好
也就是说,找到一组最好的 w 和 b 固定一个超平面,使这个超平面在能完美区分正负例的
基础上,距离最近的点间隔最大
转化成数学描述:

一个超平面对应无数个 w,b,只要找到其中任意一个 w 符合条件的 w 就可以了选择最好求的



等价于:

本质上这里 不就是L2范数最小
铺垫 拉格朗日函数
原始问题:

约束条件表述为 k 个不等式约束条件,和 L 个等式约束条件
转化成拉格朗日函数:

其中 ci 是第 i 个不等式约束函数(需要整理),bj 是第 j 个等式约束函数αi 和βi 是拉格朗日乘子
原始问题:

构建拉个朗日函数:

对偶原理:

转化成:

下面就开始求解对偶函数的第一步

拉格朗日函数分别求 w 和 b 的偏导:

将 w 反代回原来的拉格朗日函数中就可
以进行第二步求关于α的极大了


第二步对对偶函数的优化问题

去掉负号转换为求极小问题

只要解决了这个问题,svm 的学习问题就完成了
通常使用 SMO 算法进行求解,可以求得一组α* 使得函数最优化
smo算法 后面再讲, 假设我们已经得到α*

将xi yi带入就能求得w*
b*怎么求解?对于支持向量 上的点 满足:

如何寻找 支持向量?
ktt条件:

那么所有α>0 时后面一项需要=0 也就是
支持向量
求 b 的过程:找到所有个支持向量带进去求出所有个 b,然后求平均这样我们就得到了分割超平面
这样我们就得到了分割超平面

3. 硬分割SVM总结
1:目标: 求得一组 w 和 b 使得分隔 margin 最大
2. 通过拉格朗日函数构造目标函数,问题由求得 n 个 w 和 1 个 b 转换为求得
m 个α

3. 利用 smo 算法求得 m 个α*
4. 利用求得的 m 个α求得 w和 b*
机器学习-线性分类-SVM支持向量机算法-12的更多相关文章
- SVM 支持向量机算法-实战篇
公号:码农充电站pro 主页:https://codeshellme.github.io 上一篇介绍了 SVM 的原理和一些基本概念,本篇来介绍如何用 SVM 处理实际问题. 1,SVM 的实现 SV ...
- 机器学习(七):梯度下降解决分类问题——perceptron感知机算法与SVM支持向量机算法进行二维点分类
实验2 感知机算法与支持向量机算法 一.预备知识 1.感知机算法 二.实验目的 掌握感知机算法的原理及设计: 掌握利用感知机算法解决分类问题. 三.实验内容 设计感知机算法求解, 设计SVM算法求解( ...
- SVM(支持向量机)算法
第一步.初步了解SVM 1.0.什么是支持向量机SVM 要明白什么是SVM,便得从分类说起. 分类作为数据挖掘领域中一项非常重要的任务,它的目的是学会一个分类函数或分类模型(或者叫做分类器),而支持向 ...
- 深入浅出理解SVM支持向量机算法
支持向量机是Vapnik等人于1995年首先提出的,它是基于VC维理论和结构风险最小化原则的学习机器.它在解决小样本.非线性和高维模式识别问题中表现出许多特有的优势,并在一定程度上克服了" ...
- SVM 支持向量机算法介绍
转自:https://zhuanlan.zhihu.com/p/21932911?refer=baina 参考:http://www.cnblogs.com/LeftNotEasy/archive/2 ...
- SVM 支持向量机算法-原理篇
公号:码农充电站pro 主页:https://codeshellme.github.io 本篇来介绍SVM 算法,它的英文全称是 Support Vector Machine,中文翻译为支持向量机. ...
- SVM支持向量机算法
支持向量机(SVM)是另一类的学习系统,其众多的优点使得他成为最流行的算法之一.其不仅有扎实的理论基础,而且在许多应用领域比大多数其他算法更准确. 1.线性支持向量机:可分情况 根据公式(1)< ...
- 跟我学算法-svm支持向量机算法推导
Svm算法又称为支持向量机,是一种有监督的学习分类算法,目的是为了找到两个支持点,用来使得平面到达这两个支持点的距离最近. 通俗的说:找到一条直线,使得离该线最近的点与该线的距离最远. 我使用手写进行 ...
- 机器学习(Machine Learning)算法总结-决策树
一.机器学习基本概念总结 分类(classification):目标标记为类别型的数据(离散型数据)回归(regression):目标标记为连续型数据 有监督学习(supervised learnin ...
- 支持向量机 (一): 线性可分类 svm
支持向量机(support vector machine, 以下简称 svm)是机器学习里的重要方法,特别适用于中小型样本.非线性.高维的分类和回归问题.本系列力图展现 svm 的核心思想和完整推导过 ...
随机推荐
- 文心一言 VS 讯飞星火 VS chatgpt (155)-- 算法导论12.3 2题
二.用go语言,假设通过反复向一棵树中插人互不相同的关键字来构造一棵二叉搜索树.证明:在这棵树中查找关键字所检查过的结点数目等于先前插入这个关键字所检查的结点数目加 1. 文心一言: 为了证明这个结论 ...
- Android联系人增删改查
1:申请权限 <uses-permission android:name="android.permission.READ_CONTACTS"/> <uses-p ...
- Javascript Ajax总结——XMLHttpRequest对象
Ajax技术能向服务器异步请求额外的数据,会带来更好的用户体验.Ajax技术核心:XMLHttpRequest对象(简称XHR).XHR为向服务器发送请求和解析服务器响应提供了流畅的接口.1.创建XM ...
- NetCore高级系列文章04---async、await原理揭秘
async.await本质上是C#提供的语法糖,编译器编译后是状态机的调用. 先看如下的一段代码,要main方法中调用了三个await方法 将此dll进行反编译为4.0的代码如下: 可见到两个Main ...
- 设置CentOS7使用代理服务器上网
用三种方法设置CentOS7使用代理服务器上网 https://zhangyujia.cn/?p=1206 https://www.cnblogs.com/a-du/p/8964048.html 一. ...
- 使用Spring AI让你的Spring Boot应用快速拥有生成式AI能力
之前分享了关于Spring新项目Spring AI的介绍视频.视频里演示了关于使用Spring AI将Open AI的能力整合到Spring应用中的操作,但有不少读者提到是否有博客形式的学习内容.所以 ...
- 斯坦福 UE4 C++ ActionRoguelike游戏实例教程 13.使用GameplayTag实现使用钥匙卡打开箱子
斯坦福课程 UE4 C++ ActionRoguelike游戏实例教程 0.绪论 概述 本篇文章将会展示Gameplay另一个用法,也就是我们最常见的使用特定道具交互特定的机关.例如本文要实现的,获得 ...
- GaussDB技术解读系列之应用无损透明(ALT)
本文作者 :华为云GaussDB研发高级工程师 藏琦 1.背景 GaussDB作为一款企业级分布式数据库,提供了"同城跨AZ双活.两地三中心.双集群强一致"等极致的高可用容灾能力. ...
- 你应该知道的数仓安全——默认权限实现共享schema
摘要: 一种典型客户场景是一些用户是数据的生产方,需要在schema中创建表并写入数据:而另一些用户是数据的消费方,读取schema中的数据做分析.使用Alter default privilege语 ...
- 浅谈DWS函数出参方式
摘要:DWS的PL/pgSQL函数/存储过程中有一个特殊的语法PERFORM语法,用于执行语句但是丢弃执行结果的场景,常用于一些状态判断的场景. 本文分享自华为云社区<GassDB(DWS)功能 ...