SVM: 使用kernels(核函数)的整个SVM算法过程

将所有的样本都选做landmarks

一种方法是将所有的training data都做为landmarks,这样就会有m个landmarks(m个trainnign data),这样features就是某个x(可以是trainning data/cross validation data/test data里面的)与这些landmarks之间的距离的远近程度的描述。

landmarks选定后得出新的features向量

给出一个x,则通过这些landmarks来计算features向量，和之前的类似，将f₀=1;

对于在training data里面的x⁽ⁱ⁾则通过kernel函数映射后变为f₁⁽ⁱ⁾,f₂⁽ⁱ⁾.....f_m⁽ⁱ⁾(m个trainning data,m个landmarks),对于f_i⁽ⁱ⁾,由高斯核函数计算得出1

如何minimize cost function得出parameters-- θ

我们根据核函数计算出new features f(有m+1维):m个landmarks(m个data set),+1是f₀=1

cost function与之前的有些不同，因为我们用了新的features,所以z不是θ^Tx⁽ⁱ⁾而是θ^Tf⁽ⁱ⁾；后面的正则化项因为θ为m+1维，不对θ₀正则化，即从θ1-m进行累加

这儿需要注意的是在使用SVM与核函数时，不是使用θ^Tθ来表示parameters的平方的累加,而是使用θ^TMθ（M为依赖于采用的某个核函数的矩阵）,为另一种略有区别的距离度量方式，不使用||θ||²进行最小化，而是最小化另一种类型的度量（参数向量θ的变尺度形式，这种变化和核函数有关），这样使得SVM有效率的运行，之所以这样做是为了适应大的数据集，因为当我们的数据集很大的时，landmarks就会很多，θ的维数也会很大，这样计算θ就会很慢，所以做了这样的优化。

kernels能应用到其它算法吗？如logistic regression等？可以将kernels应用到其它算法，但是用于SVM的计算技巧却不能较好的推广到其它算法（如logistic regression）,所以将kernels应用到logistic regression时，会变得非常慢。

SVM与kernels是相配的，而logistic regression与kernels会十分慢。

一些计算小技巧是人们专门为使用kernels的SVM来开发的

如何确定SVM的一些参数(如C与高斯核函数的σ²)--bias与variance之间的权衡

C=1/λ,λ为正则化参数，当C大时，表示λ小，则会high variance,low bias(overfitting)

当C小是，表示λ大，则会high bias, low variance(underfitting)

σ²为高斯核函数的参数，用来表示f(新的features)与x之间变化是平缓的还是急剧的。

大的σ²，表示参数的值随着x的变化而变化平缓,所以会出现underfitting(high bias,lower variance)

小的σ²，表示参数的值随着x的变化而变化急剧所以会出现overfitting(high variance,lower bias)

SVM: 使用kernels(核函数)的整个SVM算法过程的更多相关文章

SVM: 用kernels(核函数)来定义新的features,避免使用多项式,高斯kernel
应用kernels来进行非线性分类非线性分类:是否存在好的features的选择(而不是多项式)--f1,f2,f3.... 上图是一个非线性分类的问题,前面讲过,我们可以应用多项式(feature ...
（转载）python应用svm算法过程
除了在Matlab中使用PRTools工具箱中的svm算法,Python中一样可以使用支持向量机做分类.因为Python中的sklearn库也集成了SVM算法,本文的运行环境是Pycharm. 一.导 ...
解密SVM系列（四）：SVM非线性分类原理实验
前面几节我们讨论了SVM原理.求解线性分类下SVM的SMO方法.本节将分析SVM处理非线性分类的相关问题. 一般的非线性分类例如以下左所看到的(后面我们将实战以下这种情况): 能够看到在原始空间中你想 ...
解密SVM系列（二）：SVM的理论基础(转载)
解密SVM系列(二):SVM的理论基础原文博主讲解地太好了收藏下解密SVM系列(三):SMO算法原理与实战求解支持向量机通俗导论(理解SVM的三层境界) 上节我们探讨了关于拉格朗日乘 ...
牛客网Java刷题知识点之垃圾回收算法过程、哪些内存需要回收、被标记需要清除对象的自我救赎、对象将根据存活的时间被分为：年轻代、年老代（Old Generation）、永久代、垃圾回收器的分类
不多说,直接上干货! 首先,大家要搞清楚,java里的内存是怎么分配的.详细见牛客网Java刷题知识点之内存的划分(寄存器.本地方法区.方法区.栈内存和堆内存) 哪些内存需要回收其实,一般是对堆内 ...
【机器学习算法-python实现】svm支持向量机(3)—核函数
版权声明:本文为博主原创文章,未经博主同意不得转载. https://blog.csdn.net/gshengod/article/details/24983333 (转载请注明出处:http://b ...
SVM（三）—Kernels(核函数)
(整理自AndrewNG的课件,转载请注明.整理者:华科小涛@http://www.cnblogs.com/hust-ghtao/) 内容整理中...
SVM为什么需要核函数
生存?还是毁灭?——哈姆雷特可分?还是不可分?——支持向量机之前一直在讨论的线性分类器,器如其名(汗,这是什么说法啊),只能对线性可分的样本做处理.如果提供的样本线性不可分,结果很简单,线性分类器 ...
SVM入门（十）将SVM用于多类分类
源地址:http://www.blogjava.net/zhenandaci/archive/2009/03/26/262113.html 从 SVM的那几张图可以看出来,SVM是一种典型的两类分类器 ...

随机推荐

vscode添加vue文件模板
文件->首选项->用户代码片段->输入vue,打开vue.json 添加模板json "Print to console": { "prefix&quo ...
java8新特性六-Optional 类
Optional 类是一个可以为null的容器对象.如果值存在则isPresent()方法会返回true,调用get()方法会返回该对象. Optional 是个容器:它可以保存类型T的值,或者仅仅保 ...
Java语言中null与" "的区别
null是空对象,没有地址,可以赋值给任何对象:""是空字符串,有地址但是里面的内容是空的,只能赋值给字符串对象. 如:String s;//分配了一个内存空间,没存入任何对象 ...
[案例一] Spring中的事件驱动模型(机制)
事件驱动模型是观察者模式的另一种形态,观察者相当于监听器,被观察者相当于事件源事件源产生事件,监听器监听事件以用户注册时候,要发送邮件和发送短信举例说明定义一个事件 /** * spring会自 ...
Mysql中MVCC的使用及原理详解
准备测试环境:Mysql 5.7.20-log 数据库默认隔离级别:RR(Repeatable Read,可重复读),MVCC主要适用于Mysql的RC,RR隔离级别创建一张存储引擎为test ...
poj 1095 题解（卡特兰数+递归
题目题意:给出一个二叉树的编号,问形态. 编号依据 1:如果二叉树为空,则编号为0: 2:如果二叉树只有一个节点,则编号为1: 3:所有含有m个节点的二叉树的编号小于所有含有m+1个节点的二叉树的编 ...
char * const * (*a) (int b)
char * const * (*a) (int b), 按照c++ program language的读法,从右往左读,* 读作pointer to 把(*a) (int b看作整体, (*a) ( ...
array_walk、array_map、array_filter 的用法
array_walk.array_map.array_filter 和 foreach 都有循环对数组元素进行处理的功能. 一.array_walk 用法 1.循环数组,回调处理(并不修改数组元素的 ...
SpringBoot 返回Json实体类属性大小写问题
今天碰到的问题,当时找了半天为啥前台传参后台却接收不到,原来是返回的时候返回小写,但是前台依旧大写传参. 查了很多后发现其实是json返回的时候把首字母变小写了,也就是Spring Boot中Jack ...
Harbor 企业级私有仓库 Ubuntu16.04 搭建及使用
一.Harbor简介 1.1.什么是Harbor 几个VMware中国的人搞了一个容器镜像仓库.Harbor是一个用于存储和分发Docker镜像的企业级Registry服务器. 1.2.Harbor架 ...

SVM: 使用kernels(核函数)的整个SVM算法过程

SVM: 使用kernels(核函数)的整个SVM算法过程的更多相关文章

随机推荐

热门专题