转：SVM与SVR支持向量机原理学习与思考（一）

SVM与SVR支持向量机原理学习与思考（一）

转：http://tonysh-thu.blogspot.com/2009/07/svmsvr.html

弱弱的看了看老掉牙的支持向量机(Support Vector Machine, SVM)与支持向量回归(Support Vector Regression, SVR)，发现知道的太少太弱了，基础知识要好好补一补。

SVM的原理参考
http://en.wikipedia.org/wiki/Support_vector_machine
http://zh.wikipedia.org/wiki/%E6%94%AF%E6%8C%81%E5%90%91%E9%87%8F%E6%9C%BA
下标用_表示，上标用^表示

SVM中对k类即多类问题的处理，有几种方法（节选自一本烂书：方瑞明《支持向量机理论及其应用分析》）：
(1)     One against all：设计k个SVM两类分类器；
(2)     All against all/one against one: 设计两两k(k-1)/2个SVM两类分类器。
(3)     Error correcting output codes(ECOCs)：大约是利用类似Hanming码的方式，去除输出的错误，没有太仔细研究，但这种方法可能将来对我有用。p.s. Hanming编码：用多位编码少位的数据，采取处理避免信道噪声引起的信号错误，采用Hanming矩阵，大致参考(2005)A study on Error Correcting Output Codes.pdf，说了一点点。
(4)     一次性分类：采用一次优化求解解决问题。对于每一类，设计w_i与b_i，约束真实类别对应的w_i x + b_i大于其他类别的w_i x + b_i进行训练，求解目标是所有w_i的范数之和最小，也可以引入样本数乘以类别数个松驰变量。
LIBSVM采用的是(2)，并且投票的方法，如果两类投票相同，它选择标号小的一类-_-b。

SVR（support vector regression）的主要思想：
(1)     所谓回归（regression），基本上就是拟合，用一个函数拟合x与y的关系。对于SVR来说，x是向量，y是标量，拟合的函数形式为y=W^T*g(x)+b，其中g(x)为核函数对应的特征空间向量。
(2)     SVR认为，只要估计的y在实际的y的两侧一个固定的范围(epsilon)之内，就认为是估计正确，没有任何损失；
(3)     SVR的优化目标，是|W|最小，这样y-x曲线的斜率最小，这个function最flat，这样据说可以增加估计的鲁棒性。
(4)     之后的事情就很自然了，和SVM一样：可以有soft margin，用一个小正数控制。用对偶式来解；
(5)     但有一个不同，控制范围的epsilon的值难于确定，在最小优化目标中加入一项C*\nu*\epsilon，其中epsilon是一个变量，nu是一个预先给定的正数。

SVM中的增量学习，可以采用的有几种方式：
(1)     基于KKT条件方法，在新的训练样本中选择不符合已训练分类器的KKT（Karush-Kuhn-Tucker）条件的样本与原支持向量组成新的训练集，如此反复。
(2)     Batch-SVM：原支持向量+新训练样本进行训练；
(3)     渐进增量学习方法：这个复杂一点，要求比较多的迭代次数。

关于SVM的一些其他事情：
(1) 去掉训练数据中的非支持向量（包括软间隔问题中的在间隔带外的正确分类样本），优化的结果不变，因为那些是原优化问题中的不起作用约束，同时又有全局最优解；
(2) 硬间隔SVM与二范数软间隔SVM(L2SVM)有唯一解，一范数软间隔SVM(L1SVM)不一定有唯一解。

转：SVM与SVR支持向量机原理学习与思考（一）的更多相关文章

机器学习--支持向量机（SVM）算法的原理及优缺点
一.支持向量机 (SVM)算法的原理支持向量机(Support Vector Machine,常简称为SVM)是一种监督式学习的方法,可广泛地应用于统计分类以及回归分析.它是将向量映射到一个更高维的 ...
【机器学习】从SVM到SVR
注:最近在工作中,高频率的接触到了SVM模型,而且还有使用SVM模型做回归的情况,即SVR.另外考虑到自己从第一次知道这个模型到现在也差不多两年时间了,从最开始的腾云驾雾到现在有了一点直观的认识,花费 ...
支持向量机原理(四)SMO算法原理
支持向量机原理(一) 线性支持向量机支持向量机原理(二) 线性支持向量机的软间隔最大化模型支持向量机原理(三)线性不可分支持向量机与核函数支持向量机原理(四)SMO算法原理支持向量机原理(五) ...
从感知机到 SVM，再到深度学习（三）
这篇博文详细分析了前馈神经网络的内容,它对应的函数,优化过程等等. 在上一篇博文中已经完整讲述了 SVM 的思想和原理.讲到了想用一个高度非线性的曲线作为拟合曲线.比如这个曲线可以是: ...
从感知机到 SVM，再到深度学习（二）
这篇博文承接上一篇,详细推导了 SVM 算法,包括对偶算法,SMO 优化算法,核函数技巧等等,最后还提到用高度非线性的曲线代替超平面,就是神经网络的方法. 在第一篇中已经得到了最优间隔 ...
IIS原理学习
IIS 原理学习首先声明以下内容是我在网上搜索后整理的,在此只是进行记录,以备往后查阅只用. IIS 5.x介绍 IIS 5.x一个显著的特征就是Web Server和真正的ASP.NET Appl ...
关于分布式锁原理的一些学习与思考-redis分布式锁，zookeeper分布式锁
首先分布式锁和我们平常讲到的锁原理基本一样,目的就是确保,在多个线程并发时,只有一个线程在同一刻操作这个业务或者说方法.变量. 在一个进程中,也就是一个jvm 或者说应用中,我们很容易去处理控制,在j ...
zookkeper原理学习
zookkeper原理学习 https://segmentfault.com/a/1190000014479433 https://www.cnblogs.com/felixzh/p/58692 ...
GIS原理学习目录
GIS原理学习目录内容提要本网络教程是教育部“新世纪网络课程建设工程”的实施课程.系统扼要地阐述地理信息系统的技术体系,重点突出地理信息系统的基本技术及方法. 本网络教程共分八章:第一章绪论,重点 ...

随机推荐

日志采集框架 Flume
日志采集框架 Flume 1 概述 Flume是一个分布式.可靠.和高可用的海量日志采集.聚合和传输的系统. Flume可以采集文件,socket数据包等各种形式源数据,又可以将采集到的数据输出到H ...
MyBatis.Net 配置
假设我们现在有这样的需求,要对学生信息进行管理学生表有要以下要求字段名称数据类型说明 stuNo 字符学号,该列必填,为主键递增 stuName 字符学生姓名,该列必填,要考虑姓氏可能是两 ...
Saving James Bond - Easy Version （MOOC）
06-图2 Saving James Bond - Easy Version (25 分) This time let us consider the situation in the movie & ...
Java Basic&Security Tools
JDK Tools and Utilities Basic Tools These tools are the foundation of the JDK. They are the tools yo ...
如何更改Arcmap里经纬度小数点后面的位数?
customize>arcmap option>data view >round coordinate to 改成想要显示的小数位数
Cube Stacking P0J 1988（加权并查集）
Description Farmer John and Betsy are playing a game with N (1 <= N <= 30,000)identical cubes ...
Android开发第二阶段（5）
今天:对图片的替换修改,使整个app的图案化更美观. 明天:对Android的对sdcard的操作学习
css全局样式基础代码
body{ font-size:12px; font-family:"宋体",Arial, Helvetica, sans-serif;color:#363636;backgrou ...
java下执行mongodb
1.1连单台mongodb Mongo mg = newMongo();//默认连本机127.0.0.1 端口为27017 Mongo mg = newMongo(ip);//可以指定ip 端口默认 ...
lilntcode-508-摆动排序
508-摆动排序给你一个没有排序的数组,请将原数组就地重新排列满足如下性质 nums[0] <= nums[1] >= nums[2] <= nums[3].... 注意事项请就 ...

转：SVM与SVR支持向量机原理学习与思考（一）

SVM与SVR支持向量机原理学习与思考（一）

转：SVM与SVR支持向量机原理学习与思考（一）的更多相关文章

随机推荐

热门专题