利用libsvm-mat建立分类模型model参数解密[zz from faruto]

本帖子主要就是讲解利用libsvm-mat工具箱建立分类（回归模型）后，得到的模型model里面参数的意义都是神马？以及如果通过model得到相应模型的表达式，这里主要以分类问题为例子。

测试数据使用的是libsvm-mat自带的heart_scale.mat数据（270*13的一个属性据矩阵，共有270个样本，每个样本有13个属性），方便大家自己测试学习。

首先上一个简短的测试代码：

%% ModelDecryption

% by faruto @ faruto's Studio~

% http://blog.sina.com.cn/faruto

% Email:faruto@.com

% http://www.matlabsky.com

% http://www.mfun.la

% http://video.ourmatlab.com

% last modified by 2011.01.

%% a litte clean work

tic;

close all;

clear;

clc;

format compact;

%%

% 首先载入数据

load heart_scale;

data = heart_scale_inst;

label = heart_scale_label;

% 建立分类模型

model = svmtrain(label,data,'-s 0 -t 2 -c 1.2 -g 2.8');

model

% 利用建立的模型看其在训练集合上的分类效果

[PredictLabel,accuracy] = svmpredict(label,data,model);

accuracy

%%

toc;

运行结果：

model =

    Parameters: [5x1 double]

      nr_class:

       totalSV:

           rho: 0.0514

         Label: [2x1 double]

         ProbA: []

         ProbB: []

           nSV: [2x1 double]

       sv_coef: [259x1 double]

           SVs: [259x13 double]

Accuracy = 99.6296% (/) (classification)

accuracy =

   99.6296

    0.0148

    0.9851

Elapsed time is 0.040155 seconds.

这里面为了简单起见没有将测试数据进行训练集和测试集的划分，这里仅仅是为了简单明了而已，分类结果估计可以不要管，参数优化也不要管，另有帖子讲解。

下面我们就看看 model这个结构体里面的各种参数的意义都是神马，model如下：

model =
Parameters: [5x1 double]
   nr_class: 2
   totalSV: 259
         rho: 0.0514
      Label: [2x1 double]
      ProbA: []
      ProbB: []
         nSV: [2x1 double]
   sv_coef: [259x1 double]
         SVs: [259x13 double]

model.Parameters

我们先来看一下model.Parameters里面承装的都是什么：

>> model.Parameters

ans =

    2.0000

    3.0000

    2.8000

重要知识点：

model.Parameters参数意义从上到下依次为：
-s svm类型：SVM设置类型(默认0)
-t 核函数类型：核函数设置类型(默认2)
-d degree：核函数中的degree设置(针对多项式核函数)(默认3)
-g r(gama)：核函数中的gamma函数设置(针对多项式/rbf/sigmoid核函数) (默认类别数目的倒数)
-r coef0：核函数中的coef0设置(针对多项式/sigmoid核函数)((默认0)

即在本例中通过model.Parameters我们可以得知 –s 参数为0；-t 参数为 2；-d 参数为3；-g 参数为2.8（这也是我们自己的输入）；-r 参数为0。

关于libsvm参数的一点小说明：

Libsvm中参数设置可以按照SVM的类型和核函数所支持的参数进行任意组合，如果设置的参数在函数或SVM类型中没有也不会产生影响，程序不会接受该参数；如果应有的参数设置不正确，参数将采用默认值。

model.Label model.nr_class

>> model.Label

ans =

    -

>> model.nr_class

ans =

重要知识点：

model.Label表示数据集中类别的标签都有什么，这里是 1，-1；
model.nr_class表示数据集中有多少类别，这里是二分类。

model.totalSV model.nSV

>> model.totalSV

ans =

>> model.nSV

ans =

重要知识点：

model.totalSV代表总共的支持向量的数目，这里共有259个支持向量；
model.nSV表示每类样本的支持向量的数目，这里表示标签为1的样本的支持向量有118个，标签为-1的样本的支持向量为141。
注意：这里model.nSV所代表的顺序是和model.Label相对应的。

model.ProbA model.ProbB

关于这两个参数这里不做介绍，使用-b参数时才能用到，用于概率估计。

-b probability_estimates: whether to train a SVC or SVR model for probability estimates, 0 or 1 (default 0)

model.sv_coef model.SVs model.rho

       sv_coef: [259x1 double]

           SVs: [259x13 double]

                model.rho =  0.0514

重要知识点：

model.sv_coef是一个259*1的矩阵，承装的是259个支持向量在决策函数中的系数；
model.SVs是一个259*13的稀疏矩阵，承装的是259个支持向量。
model.rho是决策函数中的常数项的相反数（-b）

在这里首先我们看一下通过 –s 0 参数（C-SVC模型）得到的最终的分类决策函数的表达式是怎样的？
这里如果有关于C-SVC模型不懂的地方，请看这个pdf文件：

libsvm_library.pdf
附件：
libsvm_library.pdf (316.82 KB)

最终的决策函数为：

在由于我们使用的是RBF核函数（前面参数设置 –t 2），故这里的决策函数即为：

其中|| x-y ||是二范数距离 ;

这里面的

b就是-model.rho（一个标量数字）;
b = -model.rho;
n代表支持向量的个数即 n = model.totalSV（一个标量数字）；

对于每一个i：
wi =model.sv_coef(i); 支持向量的系数（一个标量数字）
xi = model.SVs(i,:) 支持向量（1*13的行向量）

x 是待预测标签的样本（1*13的行向量）
gamma 就是 -g 参数

好的下面我们通过model提供的信息自己建立上面的决策函数如下：

%% DecisionFunction

function plabel = DecisionFunction(x,model)

gamma = model.Parameters();

RBF = @(u,v)( exp(-gamma.*sum( (u-v).^) ) );

len = length(model.sv_coef);

y = ;

for i = :len

    u = model.SVs(i,:);

    y = y + model.sv_coef(i)*RBF(u,x);

end

b = -model.rho;

y = y + b;

if y >=

    plabel = ;

else

    plabel = -;

end

有了这个决策函数，我们就可以自己预测相应样本的标签了：

%%

plable = zeros(,);

for i = :

    x = data(i,:);

    plabel(i,) = DecisionFunction(x,model);

end

%% 验证自己通过决策函数预测的标签和svmpredict给出的标签相同

flag = sum(plabel == PredictLabel)

over = ;

最终可以看到 flag = 270 ，即自己建立的决策函数是正确的，可以得到和svmpredict得到的一样的样本的预测标签，事实上svmpredict底层大体也就是这样实现的。

最后我们来看一下，svmpredict得到的返回参数的意义都是什么

在下面这段代码中 :

%%

% 首先载入数据

load heart_scale;

data = heart_scale_inst;

label = heart_scale_label;

% 建立分类模型

model = svmtrain(label,data,'-s 0 -t 2 -c 1.2 -g 2.8');

model

% 利用建立的模型看其在训练集合上的分类效果

[PredictLabel,accuracy] = svmpredict(label,data,model);

accuracy

运行可以看到

model =

    Parameters: [5x1 double]

      nr_class:

       totalSV:

           rho: 0.0514

         Label: [2x1 double]

         ProbA: []

         ProbB: []

           nSV: [2x1 double]

       sv_coef: [259x1 double]

           SVs: [259x13 double]

Accuracy = 99.6296% (/) (classification)

accuracy =

   99.6296

    0.0148

    0.9851

这里面要说一下返回参数accuracy的三个参数的意义。

重要的知识点：

返回参数accuracy从上到下依次的意义分别是：
分类准率（分类问题中用到的参数指标）
平均平方误差（MSE (mean squared error)） [回归问题中用到的参数指标]
平方相关系数（r2 (squared correlation coefficient)）[回归问题中用到的参数指标]

其中mse 和r2的计算公式分别为：

插图：
<ignore_js_op>

写在后面的话，至此关于model中相应参数的一些意义，以及到底如果得到决策函数的表达式或者计算方式的就算是说的很明了了。

可能还有的同学会问，如何得到分类决策函数中的那个alpha系数【这个肯定会有人问】，还是再磨叽说一下吧：

上面的wi其实是alpha和支持向量的类别标签（1或-1的乘积），原始决策函数的表达式如下：
插图：
<ignore_js_op>

上面的yi是支持向量的类别标签（1或者-1），在libsvm中将yi和alpha的乘积放在一起用model.sv_coef（w）来承装。
都说到这份上，应该能明白了吗？

再说点废话：就是在关于SVM的学习中，我发现很多朋友都不主动思考和尝试，老是在问，这样很不好，这样很被动，上面这些也没有人教我，都是我自己思考出来，然后编程验证，如果出现不合理的地方就再继续思考，反正道理和书籍里面都有讲解，总能洞穿的啊。O(∩_∩)O•

Anyway，有关于SVM的问题还是可以一起探讨的，但您首先要独立思考一下下才好，您说是不是~

PS：预祝大家春节愉快

by faruto 2011.01.06

利用libsvm-mat建立分类模型model参数解密[zz from faruto]的更多相关文章

利用CART算法建立分类回归树
常见的一种决策树算法是ID3,ID3的做法是每次选择当前最佳的特征来分割数据,并按照该特征所有可能取值来切分,也就是说,如果一个特征有四种取值,那么数据将被切分成4份,一旦按某特征切分后,该特征在之后 ...
LiBsvm用于多分类时训练模型参数含义
The 'svmtrain' function returns a model which can be used for futureprediction. It is a structure a ...
libsvm 训练后的模型参数讲解（转）
主要就是讲解利用libsvm-mat工具箱建立分类(回归模型)后,得到的模型model里面参数的意义都是神马?以及如果通过model得到相应模型的表达式,这里主要以分类问题为例子.测试数据使用的是li ...
[转]libsvm 训练后的模型参数讲解
http://blog.sina.com.cn/s/blog_6646924501018fqc.html 主要就是讲解利用libsvm-mat工具箱建立分类(回归模型)后,得到的模型model里面参数 ...
使用libsvm实现文本分类
@Hcy(黄灿奕) 文本分类,首先它是分类问题,应该对应着分类过程的两个重要的步骤,一个是使用训练数据集训练分类器,另一个就是使用测试数据集来评价分类器的分类精度.然而,作为文本分类,它还具有文本这样 ...
利用ARIMA算法建立短期预测模型
周五福利日活动是电信为回馈老用户而做的活动,其主要回馈老用户的方式是让用户免费领取对应的优惠券,意在提升老用户的忠诚度和活跃度.今日,为保证仓库备货优惠券资源充足,特别是5元话费券等,需要对该类优惠券 ...
使用PyTorch建立你的第一个文本分类模型
概述学习如何使用PyTorch执行文本分类理解解决文本分类时所涉及的要点学习使用包填充(Pack Padding)特性介绍我总是使用最先进的架构来在一些比赛提交模型结果.得益于PyTorch ...
利用tensorboard可视化checkpoint模型文件参数分布
写在前面: 上周微调一个文本检测模型seglink,将特征提取层进行冻结,只训练分类回归层,然而查看tensorboard发现里面有histogram显示模型各个参数分布,看了目前这个训练模型参数分布 ...
分类模型的性能评价指标（Classification Model Performance Evaluation Metric）
二分类模型的预测结果分为四种情况(正类为1,反类为0): TP(True Positive):预测为正类,且预测正确(真实为1,预测也为1) FP(False Positive):预测为正类,但预测错 ...

随机推荐

angularjs的config和interceptor - session注入
config 这个要从config的正确使用说起,也许你想在config某个provider的时候注入$rootscope, 但是这是不允许的,我们细看下面的特性 session注入每个请求自带se ...
Linux使用笔记
1:Ubuntu系统获取超级权限: 在终端输入:sudo passwd,重置uinx密码.然后输入 su ,输入密码,即可进入root权限. 2:更改文件属性 Linux文件的基本权限有九个,分别是o ...
图解Ajax工作原理
转载请注明原文地址:http://www.cnblogs.com/ygj0930/p/6126542.html Ajax指Asynchronous JavaScript and XML(异步的 Jav ...
Qt Installer Framework 使用说明（三）
目录 6.Qt Installer Framework 示例 7.参考 Reference 配置文件 Configuration File 配置文件元素的简要说明 Summary of Configu ...
ssh无法登录,提示Pseudo-terminal will not be allocated because stdin is not a terminal.
当远程通过ssh登录主机时出现Pseudo-terminal will not be allocated because stdin is not a terminal. 错误字面意思是伪终端将 ...
Dubbo架构设计详解（转收藏）
转自:http://shiyanjun.cn/archives/325.html Dubbo是Alibaba开源的分布式服务框架,它最大的特点是按照分层的方式来架构,使用这种方式可以使各个层之间解耦合 ...
Redis C客户端Hiredis代码分析
初始化 redisContext - Redis连接的上下文 /* Context for a connection to Redis */ typedef struct redisContext { ...
Swoole源代码学习记录（十三）——Server模块具体解释（上）
Swoole版本号:1.7.5-stable Github地址:https://github.com/LinkedDestiny/swoole-src-analysis 最终能够正式进入Server. ...
According to TLD or attribute directive in tag file, attribute items does not accep t any expressions
According to TLD or attribute directive in tag file, attribute items does not accep t any expression ...
docker-compose 管理多个docker容器实例
Compose 安装运行此命令下载最新版本的Docker Compose $ curl -L https://github.com/docker/compose/releases/download/ ...

利用libsvm-mat建立分类模型model参数解密[zz from faruto]

利用libsvm-mat建立分类模型model参数解密[zz from faruto]的更多相关文章

随机推荐

热门专题