SVM: 实际中使用SVM的一些问题

使用SVM包来求θ,选择C与核函数

我们使用已经编写好的软件包（这些软件包效率高，用得多，是经无数人证明已经很好的可以使用的软件包）来求θ，而不是自己去编写软件来求它们（就像我们现在很少编写软件来求x^½）.经常使用的是liblinear和libsvm

虽然不用我们自己来写optimize函数，但是需要我们确定的是要选择C（cost function里面bias与variance权衡的参数=1/λ）,以及选择什么样的kernel函数。

一种选择是不使用kernel(也称为linear kernel),直接使用x: 这种情况是当我们的n很大（即维度很高，features很多）但是训练样本却很少的情况下，我们一般不希望画出很复杂的边界线(因为样本很少，画出很复杂的边界线就会过拟合)，而是用线性的边界线。

一种选择是使用Gaussian kernel：这种情况需要确定σ²(平衡bias还是variance)。这种情况是当x的维度不高，但是样本集很多的情况下。如上图中，n=2,但是m却很多，需要一个类似于圆的边界线。(即需要一个复杂的边界)

如果features的范围差别很大，在执行kernel之前要使用feature scaling

我们需要自己编写kernel函数，当然许多SVM都包含了高斯kernel和linear kernel(因为这两个是最常见的)；自己编写kernel函数时，将x1,x2(landmarks)做为输入，输出features f(f1,f2.........fm)

在使用高斯kernel时，如果features之间的范围相差太大，要先做feature scaling。因为如果不做feature scaling 的话，在求范数时，则范数主要取决于大的数值的features，而不会去关注小数值的features,这样导致不均衡。如房子价格的预测，有面积与房间个数的话，则范数主要与房子的面积相关，因为房间个数对于范数的贡献太小。

成为有效的kernels需要满足的条件以及其它的一些kernel函数

我们最常用的是高斯kernel和linear kernel(即不使用kernel),但是需要注意的是不是任何相似度函数都是有效的核函数，它们(包括我们常使用的高斯kernel)需要满足一个定理（默塞尔定理）,这是因为SVM有很多数值优化技巧，为了有效地求解参数Θ，需要相似度函数满足默塞尔定理，这样才能确保SVM包能够使用优化的方法来求解参数Θ。

一些其它可能会被用到的kernels（很少使用）: 多项式核函数,将x与l(landmark)的内积做为一种相似度的度量，如上图所示，它的一般形式为(x^Tl+constant)^degree,有两个参数，一个是constant,一个是degree。多项式核函数一般会要求x与l都是非负的，这样它们的内积才是正的

一些更少用到的核函数：字符串核函数-如果你输入的数据为字符串的话，有时会用到这个核函数，来比较两个对象之间的相似度。卡方核函数，直方图交叉核函数。

我们基本上很少用到这些核函数（用得最多的是高斯kernel与linear kernel），但是碰到它们时，要知道它们为核函数的定义.

SVM中的多分类问题

当我们遇到多分类的问题时，如何有效地画出多分类的边界呢？

大多数的SVM都已经内置了多分类问题的软件包，我们可以直接使用。

另一种方法时使用one-vs.-all方法（参考之前的），训练K个SVM（如果有K个分类的话），这样得出K个参数θ向量（每一个参数θ都是将这一类与其它类分别时所求的θ），然后预测时选择最大时的θ^Tx所表示的那个class

logistic regression/SVM/神经网络比较

我们将logistic regression的cost function进行了修改得出了SVM，那么我们在什么情况下应该使用什么算法呢？

如果我们的features要比样本数要大的话（如n=10000,m=10-1000）,我们使用logistic regression或者linear kernel,因为在样本较少的情况下，我们使用线性分类效果已经很好了，我们没有足够多的样本来支持我们进行复杂的分类。

如果n较小，m大小适中的话，使用SVM with Gaussion kernel.如我们之前讲的有一个二维（n=2）的数据集，我们可以使用高斯核函数很好的将正负区分出来.

如果n较小，m非常大的话，会创建一些features,然后再使用logistic regeression 或者linear kernel。因为当m非常大的话，使用高斯核函数会较慢

logistic regeression 与linear kernel是非常相似的算法，如果其中一个适合运行的话，那么另一个也很有可能适合运行。

我们使用高斯kernel的范围很大，当m多达50000,n在1-1000(很常见的范围)，都可以使用SVM with 高斯kernel,可以解决很多logistic regression不能解决的问题。

神经网络在任何情况下都适用，但是有一个缺点是它训练起来比较慢，相对于SVM来说

SVM求的不是局部最优解，而是全局最优解

相对于使用哪种算法来说，我们更重要的是掌握更多的数据，如何调试算法（bias/variance），如何设计新的特征变量，这些都比是使用SVM还是logistic regression重要。

但是SVM是一种被广泛使用的算法，并且在某个范围内，它的效率非常高，是一种有效地学习复杂的非线性问题的学习算法。

logistic regression,神经网络，SVM这三个学习算法使得我们可以解决很多前沿的机器学习问题。

SVM: 实际中使用SVM的一些问题的更多相关文章

【OpenCV】opencv3.0中的SVM训练 mnist 手写字体识别
前言: SVM(支持向量机)一种训练分类器的学习方法 mnist 是一个手写字体图像数据库,训练样本有60000个,测试样本有10000个 LibSVM 一个常用的SVM框架 OpenCV3.0 中的 ...
OpenCV中的SVM參数优化
SVM(支持向量机)是机器学习算法里用得最多的一种算法.SVM最经常使用的是用于分类,只是SVM也能够用于回归,我的实验中就是用SVM来实现SVR(支持向量回归). 对于功能这么强的算法,opencv ...
[笔记]关于支持向量机（SVM）中 SMO算法的学习（一）理论总结
1. 前言最近又重新复习了一遍支持向量机(SVM).其实个人感觉SVM整体可以分成三个部分: 1. SVM理论本身:包括最大间隔超平面(Maximum Margin Classifier),拉格朗日 ...
sklearn中的SVM
scikit-learn中SVM的算法库分为两类,一类是分类的算法库,包括SVC, NuSVC,和LinearSVC 3个类.另一类是回归算法库,包括SVR, NuSVR,和LinearSVR 3个类 ...
OpenCV中的SVM参数优化
OpenCV中的SVM参数优化 svm参数优化opencv SVMSVR参数优化CvSVMopencv CvSVM SVM(支持向量机)是机器学习算法里用得最多的一种算法.SVM最常用的 ...
支持向量机（SVM）中的 SMO算法
1. 前言最近又重新复习了一遍支持向量机(SVM).其实个人感觉SVM整体可以分成三个部分: 1. SVM理论本身:包括最大间隔超平面(Maximum Margin Classifier),拉格朗日 ...
机器学习：SVM（scikit-learn 中的 SVM：LinearSVC）
一.基础理解 Hard Margin SVM 和 Soft Margin SVM 都是解决线性分类问题,无论是线性可分的问题,还是线性不可分的问题: 和 kNN 算法一样,使用 SVM 算法前,要对数 ...
opencv中的SVM图像分类（二）
opencv中的SVM图像分类(二) 标签: svm图像 2015-07-30 08:45 8296人阅读评论(35) 收藏举报分类: [opencv应用](5) 版权声明:本文为博主原创文 ...
【笔记】sklearn中的SVM以及使用多项式特征以及核函数
sklearn中的SVM以及使用多项式特征以及核函数 sklearn中的SVM的使用 SVM的理论部分需要注意的是,使用SVM算法,和KNN算法一样,都是需要做数据标准化的处理才可以,因为不同尺度的 ...

随机推荐

1206 雅礼集训D2题解
A $two$ $1.1$ $Description$ 你有两棵有根树,每棵各有 n 个顶点.让我们用整数 1 到 n 给每棵树的顶点编号.两棵树的根都是顶点 1.第一棵树的边都都是蓝色 ...
PHP设计模式 - 桥接模式
将抽象部分与它的实现部分分离,使他们都可以独立的变抽象与它的实现分离,即抽象类和它的派生类用来实现自己的对象桥接与适配器模式的关系(适配器模式上面已讲解): 桥接属于聚合关系,两者关联但不继承适 ...
【Linux】多线程同步的四种方式
背景问题:在特定的应用场景下,多线程不进行同步会造成什么问题? 通过多线程模拟多窗口售票为例: #include <iostream> #include<pthread.h> ...
3. Spark SQL解析
3.1 新的起始点SparkSession 在老的版本中,SparkSQL提供两种SQL查询起始点,一个叫SQLContext,用于Spark自己提供的SQL查询,一个叫HiveContext,用于连 ...
SpringBoot--整合Mybatis+druid
分为两部分,首先替换默认数据源为阿里德鲁伊并添加监控,其次是SpringBoot下使用Mybatis 替换数据源为德鲁伊首先在配置文件里配置好数据库连接的基本信息,如username passwor ...
WPF 的 Application.Current.Dispatcher 中，为什么 Current 可能为 null
原文:WPF 的 Application.Current.Dispatcher 中,为什么 Current 可能为 null 在 WPF 程序中,可能会存在 Application.Current.D ...
Libev库学习
Libev库学习 https://www.cnblogs.com/wunaozai/p/3950249.html Libev库学习(1)https://www.cnblogs.com/wunaozai ...
Linux ass2srt
Linux ass2srt bash script #! /usr/bin/env bash ] then echo "USAGE: $0 <directory> <fro ...
配置CTS+
Please let me know if below SAP KBA could help you: 1739340 - ESR/ID Export Using CTS+ option is dis ...
分布式系统session一致性解决方案
在单机系统中,不存在Session共享问题,但是在分布式系统中,我们必须实现session共享机制,使得多台应用服务器之间会话统一,如果不进行Session共享会出现数据不一致,比如:会导致请求落到不 ...

SVM: 实际中使用SVM的一些问题

SVM: 实际中使用SVM的一些问题的更多相关文章

随机推荐

热门专题