吴恩达机器学习笔记（六） —

主要内容：

一.损失函数

二.决策边界

三.Kernel

四.使用SVM

（有关SVM数学解释：机器学习笔记（八）震惊！支持向量机（SVM）居然是这种机）

一.损失函数

二.决策边界

对于：

当C非常大时，括号括起来的部分就接近于0，所以就变成了：

非常有意思的是，在最小化 1/2*∑θj^2的时候，最小间距也达到最大。原因如下：

所以：

即：如果我们要最小化1/2*∑θj^2，就要使得||θ||尽量小，而当||θ||最小时，又因为，所以p(i)最大，即间距最大。

注意：C可以看成是正则项系数λ的倒数。所以，当C越大时（可以看成是λ越小），则曲线对于数据越敏感。如下：

三.Kernel

上面介绍的都是线性可分的情况，当线性不可分时，或许我们可以用多项式进行拟合，如下：

但是多项式的次数太高，计算成本就会很大，有没有更好的办法？那就是SVM带核的方法。

我们将上面的多项式改为：

然后f的公式为：

这个f函数就是高斯核函数。

我们在坐标轴上选取三个地标

其中f1就是坐标轴上某一点到L(1)距离的远近，离得近则f1 = 1，离得远则f1 = 0，f2、f3等以此类推。

对于高斯核函数，σ对整体分布的影响为：σ越大，分布越扁平：

于是新的决策方法就变为：

那么如何选取地标L呢？那就是数据集的每一点都作为地标，如下：

综上，带核的SVM可以描述为：

四.使用SVM

支持向量机较为复杂，一般而言，我们都不会自己去实现算法，而是直接调用。但是我们需要做两点工作，那就是：1.选择C的值（cost function上的那个系数C），2.选择核函数（或者直接使用无核），具体步骤如下：

吴恩达机器学习笔记（六） —— 支持向量机SVM的更多相关文章

[吴恩达机器学习笔记]12支持向量机5SVM参数细节
12.支持向量机觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考资料斯坦福大学 2014 机器学习教程中文笔记 by 黄海广 12.5 SVM参数细节标记点选取标记点(landma ...
[吴恩达机器学习笔记]12支持向量机2 SVM的正则化参数和决策间距
12.支持向量机觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考资料斯坦福大学 2014 机器学习教程中文笔记 by 黄海广 12.2 大间距的直观理解- Large Margin I ...
[吴恩达机器学习笔记]12支持向量机1从逻辑回归到SVM/SVM的损失函数
12.支持向量机觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考资料斯坦福大学 2014 机器学习教程中文笔记 by 黄海广 12.1 SVM损失函数从逻辑回归到支持向量机为了描述 ...
[吴恩达机器学习笔记]12支持向量机3SVM大间距分类的数学解释
12.支持向量机觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考资料斯坦福大学 2014 机器学习教程中文笔记 by 黄海广 12.3 大间距分类背后的数学原理- Mathematic ...
[吴恩达机器学习笔记]12支持向量机6SVM总结
12.支持向量机觉得有用的话,欢迎一起讨论相互学习~Follow Me 12.6SVM总结推荐使用成熟的软件包用以解决 SVM 最优化问题的软件很复杂,且已经有研究者做了很多年数值优化.因此强烈 ...
[吴恩达机器学习笔记]12支持向量机4核函数和标记点kernels and landmark
12.支持向量机觉得有用的话,欢迎一起讨论相互学习~Follow Me 12.4 核函数与标记点- Kernels and landmarks 问题引入如果你有以下的训练集,然后想去拟合其能够分开 ...
吴恩达机器学习笔记45-使用支持向量机（Using A SVM）
本篇我们讨论如何运行或者运用SVM. 在高斯核函数之外我们还有其他一些选择,如:多项式核函数(Polynomial Kernel)字符串核函数(String kernel)卡方核函数( chi-squ ...
吴恩达机器学习笔记43-SVM大边界分类背后的数学（Mathematics Behind Large Margin Classification of SVM）
假设我有两个向量,
Machine Learning——吴恩达机器学习笔记（酷
[1] ML Introduction a. supervised learning & unsupervised learning 监督学习:从给定的训练数据集中学习出一个函数(模型参数), ...

随机推荐

算法-search
O(big o) 是上限,是我们关注的算法的时间复杂度.数据量大,数据量涨一千倍,lgn的算法就是耗费的时间就是10倍,o(n)就是一千倍,o(n2)就是一百万倍的差距例一:Sequential ...
ThinkPHP第一课环境搭建
第一课环境搭建 1.说明: ThinkPHP是一个开源的国产PHP框架,是为了简化企业级应用开发和敏捷WEB应用开发而诞生的. 最早诞生于2006年初.原名FCS.2007年元旦正式更名为Think ...
自定义序列化技术3 （.net 序列化技术） C++ 调用C# DLL
打开SerializableAttribute利用里面的函数进行编辑. // sparse.cpp : 定义控制台应用程序的入口点. // #include "stdafx.h" ...
Linux ps 命令查看进程启动及运行时间
引言同事问我怎样看一个进程的启动时间和运行时间,我第一反应当然是说用 ps 命令啦.ps aux或ps -ef不就可以看时间吗? ps aux选项及输出说明我们来重新复习下ps aux的选项,这是 ...
ubantu 彻底卸载mysql
卸载mysql 第一步 1 sudo apt-get autoremove --purge mysql-server-5.0 2 sudo apt-get remove mysql-server 3 ...
HDFS源码分析数据块汇报之损坏数据块检测checkReplicaCorrupt()
无论是第一次,还是之后的每次数据块汇报,名字名字节点都会对汇报上来的数据块进行检测,看看其是否为损坏的数据块.那么,损坏数据块是如何被检测的呢?本文,我们将研究下损坏数据块检测的checkReplic ...
erlang的RSA签名与验签
1.RSA介绍 RSA是目前最有影响力的公钥加密算法,该算法基于一个十分简单的数论事实:将两个大素数相乘十分容易,但那时想要对其乘积进行因式分解却极其困难,因此可以将乘积公开作为加密密钥,即公钥,而 ...
特权级概述（哥子就想知道CPU是如何验证特权级的）GATE+TSS
[0]README text description from orange's implemention of a os . [1]特权级概述当当前代码段试图访问一个段或者门时,目标段的DPL将会 ...
Little-endian和Big-endian模式
这段C程序的结果是多少? 嵌入式系统开发者应该对Little-endian和Big-endian模式非常了解.采用Little-endian模式的CPU对操作数的存放方式是从低字节到高字节,而Big- ...
【BZOJ4276】[ONTAK2015]Bajtman i Okrągły Robin 线段树优化建图+费用流
[BZOJ4276][ONTAK2015]Bajtman i Okrągły Robin Description 有n个强盗,其中第i个强盗会在[a[i],a[i]+1],[a[i]+1,a[i]+2 ...

吴恩达机器学习笔记（六） —— 支持向量机SVM

吴恩达机器学习笔记（六） —— 支持向量机SVM的更多相关文章

随机推荐

热门专题