【模式识别】CART和GML AdaBoost MATLAB TOOLBOX

GML AdaBoost Matlab Toolbox是一款很优秀的AdaBoost工具箱，内部实现了Real AdaBoost, Gentle AdaBoost和Modest AdaBoost三种方法。

AdaBoost的训练和分类的结构都是类似的，能够參考前一篇《Boosting》。仅仅简单介绍一下GML。GML内部弱分类器使用的CART决策树。决策树的叶子表示决策，内部每一个分支都是决策过程。

从根部開始，每一个决策结果指向下一层决策，最后到达叶子，得到终于的决策结果。一个比較简单的示意例如以下图所看到的：

对于特征{x1,x2,x3}值为{4,-1,2}的样本，上图决策树的终于决策为y=-1，而对于{3,-2,3}的样本预測值为+1。
工具箱中CART根的构造算法例如以下：

1. 对于n为特征的每一个维度，分别找到阈值使得分类错误率最小
2. 选择错误率最小的第i维构造根节点：
a) 预測xi>Θ
b) 分别构造true/false子树分支。各自的分类结果作为叶子

在树中移动并终于到达叶子，我们把得到的预測结果错误分类一个样本的概率作为“树叶的错误率”。

整颗决策树的构造使用例如以下规则：

1. 构造根节点
2. 选择错误率最小的叶子
3. 仅适用于和所选叶子相关的训练数据构造节点
4. 使用构造的节点取代所选的叶子
5. 反复2-4步直到全部的叶子错误率为0，或者到达循环结束的循环次数。

其实，工具箱使用中，CART树的构造过程仅仅有树深一个可调參数，使用：

function tree_node = tree_node_w(max_splits)

函数初始化最大树深，之后就是将构造的弱分类器传给对应的AdaBoost函数。以下是一个使用演示样例：

% Step1: reading Data from the file

clear

clc

file_data = load('Ionosphere.txt');

Data = file_data(:,1:10)';

Labels = file_data(:,end)';

Labels = Labels*2 - 1;

MaxIter = 200; % boosting iterations

% Step2: splitting data to training and control set

TrainData   = Data(:,1:2:end);

TrainLabels = Labels(1:2:end);

ControlData   = Data(:,2:2:end);

ControlLabels = Labels(2:2:end);

% Step3: constructing weak learner

weak_learner = tree_node_w(3); % pass the number of tree splits to the constructor

% Step4: training with Gentle AdaBoost

[GLearners GWeights] = GentleAdaBoost(weak_learner, TrainData, TrainLabels, MaxIter);

% Step5: training with Modest AdaBoost

[MLearners MWeights] = ModestAdaBoost(weak_learner, TrainData, TrainLabels, MaxIter);

% Step5: training with Modest AdaBoost

[RLearners RWeights] = RealAdaBoost(weak_learner, TrainData, TrainLabels, MaxIter);

% Step6: evaluating on control set

ResultG = sign(Classify(GLearners, GWeights, ControlData));

ResultM = sign(Classify(MLearners, MWeights, ControlData));

ResultR = sign(Classify(RLearners, RWeights, ControlData));

% Step7: calculating error

ErrorG  = sum(ControlLabels ~= ResultG) / length(ControlLabels)

ErrorM  = sum(ControlLabels ~= ResultM) / length(ControlLabels)

ErrorR  = sum(ControlLabels ~= ResultR) / length(ControlLabels)

以上代码构造深度为3的CART决策树作为弱分类器。分别使用GentleAdaBoost，ModestAdaBoost和RealAdaBoost迭代200次训练AdaBoost分类器。

以上代码直接使用MaxIter调用函数训练与以下方法是等价的：

% Step4: iterativly running the training

for lrn_num = 1 : MaxIter

    clc;

    disp(strcat('Boosting step: ', num2str(lrn_num),'/', num2str(MaxIter)));

    %training gentle adaboost

    [GLearners GWeights] = GentleAdaBoost(weak_learner, TrainData, TrainLabels, 1, GWeights, GLearners);

    %evaluating control error

    GControl = sign(Classify(GLearners, GWeights, ControlData));

    GAB_control_error(lrn_num) = GAB_control_error(lrn_num) + sum(GControl ~= ControlLabels) / length(ControlLabels);

    %training real adaboost

    [RLearners RWeights] = RealAdaBoost(weak_learner, TrainData, TrainLabels, 1, RWeights, RLearners);

    %evaluating control error

    RControl = sign(Classify(RLearners, RWeights, ControlData));

    RAB_control_error(lrn_num) = RAB_control_error(lrn_num) + sum(RControl ~= ControlLabels) / length(ControlLabels);

    %training modest adaboost

    [NuLearners NuWeights] = ModestAdaBoost(weak_learner, TrainData, TrainLabels, 1, NuWeights, NuLearners);

    %evaluating control error

    NuControl = sign(Classify(NuLearners, NuWeights, ControlData));

    MAB_control_error(lrn_num) = MAB_control_error(lrn_num) + sum(NuControl ~= ControlLabels) / length(ControlLabels);

end

可是第二段代码每次显示使用了上一次的训练结果，实际执行速度更快。

（转载请注明作者和出处：http://blog.csdn.net/xiaowei_cqu 未经同意请勿用于商业用途）

【模式识别】CART和GML AdaBoost MATLAB TOOLBOX的更多相关文章

几个模式识别和计算机视觉相关的Matlab工具箱
模式识别.计算机视觉.图像处理等领域大部分是对一些图像等数据的处理,比较常用的语言是C++和Matlab,相应也对应很多库,象opencv等,都是很好用功能也很强大,但是对于数据处理更方便的应该还是M ...
MATLAB Toolbox Path Cache is out of date and is not being used的解决
作者:朱金灿来源:http://blog.csdn.net/clever101 使用mcc编译MATLAB\R2009a\extern\examples\compiler目录下的hello.m,编译 ...
matlab 工具函数、matlab toolbox（工具箱）
minimize.m:最小化可微多元函数 minimize.m:最小化一个可微的多元函数: Minimize a differentiable multivariate function,函数接口说明 ...
Mike post process with Matlab toolbox
表怕,这个博客只有题目是英文的-- Matlab toolbox 安装去DHI官网下载最新的MikeSDK2014与Matlab toolbox,下载好后安装MikeSDK2014,注意电脑上不能有 ...
可视化利器 —— t-SNE（matlab toolbox 的使用与解释）
t-SNE – Laurens van der Maaten(感谢学术男神们的无私开源) User_guide.pdf(用户指南) 1. tsne 函数 mappedX = tsne(X, label ...
【模式识别】Boosting
Boosting简单介绍分类中通常使用将多个弱分类器组合成强分类器进行分类的方法,统称为集成分类方法(Ensemble Method).比較简单的如在Boosting之前出现Bagging的方法,首 ...
混淆矩阵在Matlab中PRtools模式识别工具箱的应用
声明:本文用到的代码均来自于PRTools(http://www.prtools.org)模式识别工具箱,并以matlab软件进行实验. 混淆矩阵是模式识别中的常用工具,在PRTools工具箱中有直接 ...
Matlab Robotics Toolbox 仿真计算：Kinematics, Dynamics, Trajectory Generation
1. 理论知识理论知识请参考: 机器人学导论++(原书第3版)_(美)HLHN+J.CRAIG著++贠超等译机器人学课程讲义(丁烨) 机器人学课程讲义(赵言正) 2. Matlab Robotic ...
matlab中文论坛视频谷普教程MATLAB压缩包介绍
matlab中文论坛视频谷普教程MATLAB压缩包介绍我也正在学习这个软件 ,看到这个教程就在这里分享了,希望大家喜欢!Matlab 初学者视频教学1. Matlab视频:Matlab中文论坛为新手 ...

随机推荐

Linux Ubuntu下Dropbox图标消失
Linux下的Dropbox是支持命令行模式的.,在terminal中输入dropbox后,如下提示: Dropbox command-line interface commands: Note: u ...
倍福TwinCAT(贝福Beckhoff)基础教程松下伺服驱动器报错 21.0怎么办
编码器通讯断线异常保护,一般就是通讯线松动或者受干扰(最难以排查的情况是,我接了六套驱动器和伺服,比如J0的线是随便做的,其他五套都是西门子的合格网线,我运行程序的时候,J0如果单关节运动没任何问题, ...
Cache和Buffer的区别(转载)
1. Cache:缓存区,是高速缓存,是位于CPU和主内存之间的容量较小但速度很快的存储器,因为CPU的速度远远高于主内存的速度,CPU从内存中读取数据需等待很长的时间,而 Cache保存着CPU刚 ...
ACM-百度之星资格赛之Labyrinth——hdu4826
Labyrinth Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others) Total ...
magento安装wordpress
说起来事实上很easy,如今简诉一下安装过程 1.到magento connect界面安装magento扩展,地址:http://www.magentocommerce.com/magento-con ...
Android--Handler的用法：在子线程中更新界面
本文主要介绍Android的Handler的用法.Handler能够发送Messsage和Runnable对象到与其相关联的线程的消息队列. 每一个Handler对象与创建它的线程相关联.而且每一个H ...
使用浏览器地址栏调用CXF Webservice的写法
/* * 通过url调用 * http://localhost:8080/EFP/webService/TestWebservice/testOut/arg0/liuyx */ http://loca ...
curl测试Docker容器连通性
通过curl来测试docker对外访问是否正常,这里测试Docker tomcat容器访问: [root@mysqlserver ~]# curl http://172.17.0.8:8080 < ...
Windows2008RC2 IIS配置php执行环境
1:下载一个php manager,安装.打开IIS管理器后,点击计算机,就能够看到右边PHPManager 静静地躺在那儿了.双击PHPManager 后我们就能够開始对PHP进行配置了. 2 ...
Android新浪微博client（一）——主框架搭建
原文出自:方杰| http://fangjie.sinaapp.com/?p=62 转载请注明出处该项目代码已经放到github:https://github.com/JayFang1993/Sin ...

【模式识别】CART和GML AdaBoost MATLAB TOOLBOX

（转载请注明作者和出处：http://blog.csdn.net/xiaowei_cqu 未经同意请勿用于商业用途）

【模式识别】CART和GML AdaBoost MATLAB TOOLBOX的更多相关文章

随机推荐

热门专题