SVM（支持向量机）之Hinge Loss解释

Hinge Loss 解释

　　SVM 求解使通过建立二次规划原始问题，引入拉格朗日乘子法，然后转换成对偶的形式去求解，这是一种理论非常充实的解法。这里换一种角度来思考，在机器学习领域，一般的做法是经验风险最小化 ERM ，即构建假设函数为输入输出间的映射，然后采用损失函数来衡量模型的优劣。求得使损失最小化的模型即为最优的假设函数，采用不同的损失函数也会得到不同的机器学习算法，比如这里的主题 SVM 采用的是 Hinge Loss ，Logistic Regression 采用的则是负 $\log$ 损失，

\[L(Y,P(Y|X)) = - \log P(Y|X)\]

　　从二项分布的角度来考虑 Logistic 回归：

\begin{aligned}
P(Y=1|X) &= \frac{1}{1 + e^{- \theta x}}\\
P(Y=0|X) &= 1- P(Y=1|X)
\end{aligned}

　　这里另 $z = \theta^Tx$ , $\delta$ 为 sigmod 映射，则：

\[E(z) = - \log (\delta(z)) \]

　　$E(z)$ 的图形如下图的红色曲线，可见 $z$ 越接近 1 ， $E(z)$ 的取值越小，即损失越小。反之另：

\[E(z) = 1- \log (\delta(z)) \]

　　此时得到的图像应该为关于 $E(z)$ 对称的红色的线（没画出），此时 $z$ 越接近 -1，$E(z)$ 的取值越小，即损失越小。

　　注：图中绿色的线为 square loss ，蓝色的线为 hinge loss，红的的线为负 log 损失。

二分类问题

　　给定数据集 $T = \left \{ (x_i,y_i)\right \}_{i=1}^N $ ，要用这些数据做一个线性分类器，即求得最优分离超平面 $w\cdot x + b = 0$ 来将样本分为正负两类，给定数据集后只需求得最优的参数 $w , b$ 即可，为了解决这个问题，首先做出如下线性映射函数

\[y = w \cdot x + b\]

　　根据经验风险最小化原则，这里引入二分类的 Hinge Loss :

\[max(0, 1- y_i(w \cdot x_i + b))\]

　　上图中对应的 $E(z) = max(0,1-z)$ ，所以SVM可以通过直接最小化如下损失函数二求得最优的分离超平面：

\[ \min_{w,b} \sum_{i=1}^N max(0, 1- y_i(w \cdot x_i + b)) + \lambda ||w||^2 \]

多分类问题

对于多分类问题，现在要用这些数据做一个 k 类的线性分类器 ,现在需要优化的参数变为 $W ,b$ ，此时的 $W \in \mathbb{R} ^{k \times n}$，为一个 $k \times n$ 的矩阵，$b \in \mathbb{R}^k$ 为一个向量，现在的映射关系如下：$s =W x_i +b$，此时有 $s \in \mathbb{R}^k$ ，$s$ 中的每个分量代表分类器在该类别的得分，样本 $x_i$ 的标签 $y_i \in \mathbb{R}^k$ , 这里若 $x_i$ 属于类别 $k$ ，则 $y_i$ 中除了第 $k$ 个分量外其余元素全为 0 ，比如 5 分类问题， $x_i$ 属于第 3 类，则有 $y_i = [0,0,1,0,0]$ , 用 $s_j$ 表示得分向量 $s$ 中的第 $j$ 个分量， $s_{y_i}$ 表示对应 $y_i = 1$ 的分量，则单个样本多分类的Hinge Loss可表示为：

\[\sum_{j \ne y_i} max(0,s_j - s_{y_i} + 1)\]，

所以 $k$ 分类线性分类SVM 的 Hinge Loss表示为：

\[\min_{W,b} \sum_{i=1}^N\sum_{j \ne y_i} max(0,s_j - s_{y_i} + 1) + \lambda \sum_k \sum_nW_{k,n}^2\]

SVM（支持向量机）之Hinge Loss解释的更多相关文章

支持向量机之Hinge Loss 解释
Hinge Loss 解释 SVM 求解使通过建立二次规划原始问题,引入拉格朗日乘子法,然后转换成对偶的形式去求解,这是一种理论非常充实的解法.这里换一种角度来思考,在机器学习领域,一般的做法是经验风 ...
logistic regression svm hinge loss
二类分类器svm 的loss function 是 hinge loss:L(y)=max(0,1-t*y),t=+1 or -1,是标签属性. 对线性svm,y=w*x+b,其中w为权重,b为偏置项 ...
损失函数 hinge loss vs softmax loss
1. 损失函数损失函数(Loss function)是用来估量你模型的预测值 f(x) 与真实值 Y 的不一致程度,它是一个非负实值函数,通常用 L(Y,f(x)) 来表示. 损失函数越小,模型的鲁 ...
机器学习中的损失函数（着重比较：hinge loss vs softmax loss）
https://blog.csdn.net/u010976453/article/details/78488279 1. 损失函数损失函数(Loss function)是用来估量你模型的预测值 f( ...
Hinge Loss、交叉熵损失、平方损失、指数损失、对数损失、0-1损失、绝对值损失
损失函数(Loss function)是用来估量你模型的预测值 f(x) 与真实值 Y 的不一致程度,它是一个非负实值函数,通常用 L(Y,f(x)) 来表示.损失函数越小,模型的鲁棒性就越好. 损失 ...
SVM | 支持向量机原理讲解（二）
一.线性可分的支持向量机存在的问题在支持向量机一中,我们介绍了当数据集是线性可分的时候,我们可以使用线性可分的支持向量机将数据进行分类(由于隔了很长时间才更新,因此忘记了支持向量机一的读者可以回看支 ...
机器学习实战 - 读书笔记(06) – SVM支持向量机
前言最近在看Peter Harrington写的"机器学习实战",这是我的学习笔记,这次是第6章:SVM 支持向量机. 支持向量机不是很好被理解,主要是因为里面涉及到了许多数学知 ...
SVM 支持向量机算法-实战篇
公号:码农充电站pro 主页:https://codeshellme.github.io 上一篇介绍了 SVM 的原理和一些基本概念,本篇来介绍如何用 SVM 处理实际问题. 1,SVM 的实现 SV ...
Python实现SVM(支持向量机)
Python实现SVM(支持向量机) 运行环境 Pyhton3 numpy(科学计算包) matplotlib(画图所需,不画图可不必) 计算过程 st=>start: 开始 e=>end ...

随机推荐

phpstudy 上怎么运行 thinkPHP ?
最近在学习 thinkPHP ,但是本地使用的是 phpstudy ,就想在 phpstudy 中使用 thinkPHP ,这样我的环境就不用再改变也可以学习. 首先,先要下载 thinkPHP , ...
【数据分析】线性回归与逻辑回归（R语言实现）
文章来源:公众号-智能化IT系统. 回归模型有多种,一般在数据分析中用的比较常用的有线性回归和逻辑回归.其描述的是一组因变量和自变量之间的关系,通过特定的方程来模拟.这么做的目的也是为了预测,但有时也 ...
Linux16.04 LTS 环境下将cmake的项目转换成eclipse可导入可调试的工程项目
Linux作为一个开源系统,其中的一个优势就是有效的将各种源码编译得到的库集合在一起,为项目的使用创建了便捷.通常情况下,我们在开发自己的开源项目时,喜欢使用cmake调用各种三方库,如opencv ...
HDU 1086
You can Solve a Geometry Problem too Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/3 ...
Winform调用webapi
/// <summary> /// 调用api返回json /// </summary> /// <param name="url">api地址 ...
SQL Server 锁实验（UPDATE加锁探究）
update语句: 本例中由于看到的是update执行完的锁情况,因此无法看到IU锁,但其实针对要修改的数据页和索引页会先加IU锁,记录和键先加U锁,然后再转化为IX和X锁. 如果想要看到IU锁和U锁 ...
Linux核心调度器之周期性调度器scheduler_tick--Linux进程的管理与调度(十八）
我们前面提到linux有两种方法激活调度器:核心调度器和周期调度器一种是直接的, 比如进程打算睡眠或出于其他原因放弃CPU 另一种是通过周期性的机制, 以固定的频率运行, 不时的检测是否有必要因 ...
Debian9安装vim和vim无法右键鼠标粘贴解决方法
问题描述: Debian9有时候安装的时候没有vim,在centos用习惯了vim 1.Debian安装vim: root@kvm1:/etc/network# apt-get install vim ...
Vue学习之路6-条件渲染
条件指令所谓条件指令是指满足某个条件时执行哪部分代码,不满足条件时执行哪部分条件代码.vue条件指令有v-if,v-else-if,v-else三个,v-if条件渲染用来指示元素是否移除或者插入,根 ...
tomcat启动超过时间
Server Tomcat v9.0 Server at localhost was unable to start within 45 seconds. 运行超时最近我切换了JDK版本之后,将10 ...

SVM（支持向量机）之Hinge Loss解释

SVM（支持向量机）之Hinge Loss解释的更多相关文章

随机推荐

热门专题