8.SVM用于多分类

从前面SVM学习中可以看出来，SVM是一种典型的两类分类器。而现实中要解决的问题，往往是多类的问题。如何由两类分类器得到多类分类器，就是一个值得研究的问题。

以文本分类为例，现成的方法有很多，其中一劳永逸的方法，就是真的一次性考虑所有样本，并求解一个多目标函数的优化问题，一次性得到多个分类面，就像下图这样：

多个超平面把空间划分为多个区域，每个区域对应一个类别，给一篇文章，看它落在哪个区域就知道了它的分类。只可惜这种算法还基本停留在纸面上，因为一次性求解的方法计算量实在太大，大到无法实用的地步。

目前，存在的方法主要有：

1. “1-V-R方式”，就是每次仍然解一个两类分类的问题。比如我们有5个类别，首先把类别1的样本定为正样本，其余的样本合起来定为负样本，得到一个两类分类器，它能够指出新的样本是不是第1类的；然后我们把类别2的样本定为正样本，把1、3、4、5的样本合起来定为负样本，得到一个分类器，如此下去，最终可以得到5个这样的两类分类器。这种方法的好处是每个优化问题的规模比较小，而且分类的时候速度很快（对于k类问题，把其中某一类的n个训练样本视为一类，所有其他类别归为另一类，因此只有k个分类器）。

但有时可能会出现两种特殊情况，某样本属于多个类别（分类重叠现象）或者是某样本没有判别为任何类别（不可分类现象）。而且，如果各个类别的样本数目是差不多的，“其余”那一类样本数总是要数倍于正类，这就人为的造成了上一节所说的“数据集偏斜”问题。

2. “1-V-1方式”，也就是我们所说的one-against-one方式。这种方法把其中的任意两类构造一个分类器，共有(k-1)×k/2个分类器。虽然分类器的数目多了，但是在训练阶段所用的总时间却比“一类对其余”方法少很多。

最后预测中如果出现分类重叠现象，可以采用竞争方式（各个分类器向k个类别投票，取得票最高类）。但是如果类别数非常大时，要调用的分类器数目会达到类别数的平方量级，预测的运算量不可小觑。

3. “有向无环图（DAG-SVM）”，该方法在训练阶段采用1-V-1方式，而判别阶段采用一种两向无环图的方式。

如果类别数是k，则只调用k-1个分类器即可。但是如果开始的分类器回答错误，那么后面的分类器是无论如何也无法纠正它的错误的，其实对下面每一层的分类器都存在这种错误向下累积的现象。也有一些方法可以改善整体效果，我们总希望根节点少犯错误为好，因此参与第一次分类的两个类别，最好是差别特别大，或者取在两类分类中正确率最高的那个分类器作根节点，或者我们让两类分类器在分类的时候，不光输出类别的标签，还输出一个类似“置信度”，当它对自己的结果不太自信的时候，我们就不光按照它的输出走，它可会按照一定的概率走向另一分支。

LibSVM采用的是1-V-1方式，因为这种方式思路简单，并且许多实践证实效果比1-V-R方式要好。对于 nr_class 个类的组合方式为：

for(i=;i<nr_class;i++)

{

    for(j=i+;i<nr_class;j++)

    {类i–V–类j}

}

8.SVM用于多分类的更多相关文章

SVM用于线性回归
SVM用于线性回归方法分析在样本数据集()中,不是简单的离散值,而是连续值.如在线性回归中,预测房价.与线性回归类型,目标函数是正则平方误差函数: 在SVM回归算法中,目的是训练出超平面,采用作为 ...
SVM 实现多分类思路
svm 是针对二分类问题, 如果要进行多分类, 无非就是多训练几个svm呗 OVR (one versus rest) 对于k个类别(k>2) 的情况, 训练k个svm, 其中, 第j个svm用 ...
用于文本分类的RNN-Attention网络
用于文本分类的RNN-Attention网络 https://blog.csdn.net/thriving_fcl/article/details/73381217 Attention机制在NLP上最 ...
将迁移学习用于文本分类《 Universal Language Model Fine-tuning for Text Classification》
将迁移学习用于文本分类 < Universal Language Model Fine-tuning for Text Classification> 2018-07-27 20:07:4 ...
SVM入门（十）将SVM用于多类分类
源地址:http://www.blogjava.net/zhenandaci/archive/2009/03/26/262113.html 从 SVM的那几张图可以看出来,SVM是一种典型的两类分类器 ...
将SVM用于多类分类
转自:http://www.lining0806.com/%E5%B0%86svm%E7%94%A8%E4%BA%8E%E5%A4%9A%E7%B1%BB%E5%88%86%E7%B1%BB/ SVM ...
SVM实现多分类的三种方案
SVM本身是一个二值分类器 SVM算法最初是为二值分类问题设计的,当处理多类问题时,就需要构造合适的多类分类器. 目前,构造SVM多类分类器的方法主要有两类 (1)直接法,直接在目标函数上进行修改,将 ...
SVM处理多分类问题（one-versus-rest和one-versus-one的不同）
SVM算法最初是为二值分类问题设计的,当处理多类问题时,就需要构造合适的多类分类器. 目前,构造SVM多类分类器的方法主要有两类:一类是直接法,直接在目标函数上进行修改,将多个分类面的参数求解合并到一 ...
SVM实现邮件分类
首先学习一下svm分类的使用. 主要有以下步骤: Loading and Visualizing Dataj Training Linear SVM Implementing Gaussian Ker ...

随机推荐

你知道C#中的Lambda表达式的演化过程吗？
那得从很久很久以前说起了,记得那个时候... 懵懂的记得从前有个叫委托的东西是那么的高深难懂. 委托的使用例一: 什么是委托? 个人理解:用来传递方法的类型.(用来传递数字的类型有int.float ...
千呼万唤始出来，微软Power BI简体中文版官网终于上线了，中文文档也全了。。
前几个月时间,研究微软Power BI技术,由于没有任何文档和资料,只能在英文官网瞎折腾,同时也发布了英文文档的相关文章:系列文章,刚好上周把文章发布完,结果简体中文版上线了.哈哈,心里有苦啊,早知道 ...
一个技术汪的开源梦 —— 公共组件缓存之分布式缓存 Redis 实现篇
Redis 安装 & 配置本测试环境将在 CentOS 7 x64 上安装最新版本的 Redis. 1. 运行以下命令安装 Redis $ wget http://download.redi ...
WPF CheckBox 样式
<Style x:Key="FocusVisual"> <Setter Property="Control.Template"> < ...
Tomcat启动报错org.springframework.web.context.ContextLoaderListener类配置错误——SHH框架
SHH框架工程,Tomcat启动报错org.springframework.web.context.ContextLoaderListener类配置错误 1.查看配置文件web.xml中是否配置.or ...
Java实现FTP文件与文件夹的上传和下载
Java实现FTP文件与文件夹的上传和下载 FTP 是File Transfer Protocol(文件传输协议)的英文简称,而中文简称为"文传协议".用于Internet上的控制 ...
初识npm
一.npm简介: npm全称为Node Package Manager,是一个基于Node.js的包管理器,也是整个Node.js社区最流行.支持的第三方模块最多的包管理器. npm的初衷:JavaS ...
第14章 Linux启动管理（3）_系统修复模式
3. 系统修复模式 3.1 单用户模式 (1)在grub界面中选择第2项,并按"e键"进入编辑.并在"-quiet"后面加入" 1",即&q ...
Linux不能上网ping:unknown host问题怎么解决？
Linux不能上网提示ping:unknown host 检查步骤 Linux系统跟windows平台有所不同的是,为了更好的做网络服务应用.Linux下多用于网络服务器,而且操作界面是字符界面.对于 ...
WCF : 修复 Security settings for this service require Windows Authentication but it is not enabled for the IIS application that hosts this service 问题
摘要 : 最近遇到了一个奇怪的 WCF 安全配置问题, WCF Service 上面配置了Windows Authentication. IIS上也启用了 Windows Authentication ...

8.SVM用于多分类

8.SVM用于多分类的更多相关文章

随机推荐

热门专题