14103983

集成方法在函数模型上等价于一个多层神经网络，两种常见的集成方法为Adaboost模型和RandomTrees模型。其中随机森林可被视为前馈神经网络，而Adaboost模型则等价于一个反馈型多层神经网络。

一.引入

对于Adaboost，可以说是久闻大名，据说在Deep Learning出来之前，SVM和Adaboost是效果最好的两个算法，而Adaboost是提升树(boosting tree)，所谓“ 提升树 ” 就是把“弱学习算法”提升(boost)为“强学习算法”(语自《统计学习方法》)，而其中最具代表性的也就是Adaboost了，貌似Adaboost的结构还和Neural Network有几分神似，我倒没有深究过，不知道是不是有什么干货。

二.过程

（from PRML）

这就是Adaboost的结构，最后的分类器YM是由数个弱分类器（weak classifier）组合而成的,相当于最后m个弱分类器来投票决定分类，而且每个弱分类器的“话语权”α不一样。

这里阐述下算法的具体过程：

1.初始化所有训练样例的权重为1 / N,其中N是样例数

2.for m=1,……M:

a).训练弱分类器ym()，使其最小化权重误差函数（weighted error function）：

b)接下来计算该弱分类器的话语权α：

c)更新权重：

其中Zm：

是规范化因子，使所有w的和为1。(这里公式稍微有点乱)

3.得到最后的分类器：

三.原理

可以看到整个过程就是和最上面那张图一样，前一个分类器改变权重w，同时组成最后的分类器

如果一个训练样例在前一个分类其中被误分，那么它的权重会被加重，相应地，被正确分类的样例的权重会降低

使得下一个分类器会更在意被误分的样例，那么其中那些α和w的更新是怎么来的呢？

下面我们从前项分步算法模型的角度来看看Adaboost：

直接将前项分步加法模型具体到adaboost上：

其中 fm是前m个分类器的结合

此时我们要最小化E，同时要考虑α和yl，

但现在我们假设前m-1个α和y都已经fixed了：那么

其中

，可以被看做一个常量，因为它里面没有αm和ym：

接下来：

其中Tm表示正分类的集合，Mm表示误分类的集合，这一步其实就是把上面那个式子拆开，没什么复杂的东西

然后就是找ym了，就是最小化下式的过程，其实就是我们训练弱分类器

有了ym，α也就可以找了，然后继续就可以找到更新w的公式了(注意这里得到的w公式是没有加规范化因子Z的公式，为了计算方便我们加了个Z进去)

因为这里算出来直接就是上面过程里的公式，就不再赘述了，有兴趣你可以自己算一算

四.实现

终于到实现了，本次实现代码基本基于《统计学习方法》，比如有些符号(弱分类器是G(x),训练样例的目标是y而不是上文所述的t)差异

所有的代码你可以在我写的toy toolkit里面找到：DML ( 你都看到这了，给个star好不好

)

    # coding: UTF-8

    from __future__ import division

    import numpy as np

    import scipy as sp

    from weakclassify import WEAKC

    from dml.tool import sign

    class ADABC:

        def __init__(self,X,y,Weaker=WEAKC):

            '''''

                Weaker is a class of weak classifier

                It should have a    train(self.W) method pass the weight parameter to train

                                    pred(test_set) method which return y formed by 1 or -1

                see detail in <统计学习方法>

            '''

            self.X=np.array(X)

            self.y=np.array(y)

            self.Weaker=Weaker

            self.sums=np.zeros(self.y.shape)

            self.W=np.ones((self.X.shape[1],1)).flatten(1)/self.X.shape[1]

            self.Q=0

            #print self.W

        def train(self,M=4):

            '''''

                M is the maximal Weaker classification

            '''

            self.G={}

            self.alpha={}

            for i in range(M):

                self.G.setdefault(i)

                self.alpha.setdefault(i)

            for i in range(M):

                self.G[i]=self.Weaker(self.X,self.y)

                e=self.G[i].train(self.W)

                #print self.G[i].t_val,self.G[i].t_b,e

                self.alpha[i]=1/2*np.log((1-e)/e)

                #print self.alpha[i]

                sg=self.G[i].pred(self.X)

                Z=self.W*np.exp(-self.alpha[i]*self.y*sg.transpose())

                self.W=(Z/Z.sum()).flatten(1)

                self.Q=i

                #print self.finalclassifer(i),'==========='

                if self.finalclassifer(i)==0:  

                    print i+1," weak classifier is enough to  make the error to 0"

                    break

        def finalclassifer(self,t):

            '''''

                the 1 to t weak classifer come together

            '''

            self.sums=self.sums+self.G[t].pred(self.X).flatten(1)*self.alpha[t]

            #print self.sums

            pre_y=sign(self.sums)

            #sums=np.zeros(self.y.shape)

            #for i in range(t+1):

            #   sums=sums+self.G[i].pred(self.X).flatten(1)*self.alpha[i]

            #   print sums

            #pre_y=sign(sums)

            t=(pre_y!=self.y).sum()

            return t

        def pred(self,test_set):

            sums=np.zeros(self.y.shape)

            for i in range(self.Q+1):

                sums=sums+self.G[i].pred(self.X).flatten(1)*self.alpha[i]

                #print sums

            pre_y=sign(sums)

            return pre_y

看train里面的过程和上文阐述的一模一样，finalclassifier()函数是用来判断是否已经无误分类的点的

当然这里用的Weak Classifier是比较基础的Decision Stump，是根据x>v和x<v来分类的，这个代码稍微烦一点，就不贴到这里了，在DML里也有

先试验下《统计学习方法》里面那个最简单的例子：

可以看到也是三个分类器就没有误分点了，权值的选择也是差不多的

其中后面那个-1 表示大于threshold分为负类，小于分为正类。1则相反

加一些其它数据试试：

结果：

我们把图画出来就是：

基本还是正确的，这是四个子分类器的图，不是最后总分类器的图啊~~~

（实验的代码你也可以在DML里面找到，你都看到这了，给个star好不好~~~~~

）

Reference：

【1】《Pattern Recognition And Machine Learning》

【2】《统计学习方法》

AdaBoost--从原理到实现（Code：Python）的更多相关文章

集成学习值Adaboost算法原理和代码小结(转载)
在集成学习原理小结中,我们讲到了集成学习按照个体学习器之间是否存在依赖关系可以分为两类: 第一个是个体学习器之间存在强依赖关系: 另一类是个体学习器之间不存在强依赖关系. 前者的代表算法就是提升(bo ...
决策树ID3原理及R语言python代码实现（西瓜书）
决策树ID3原理及R语言python代码实现(西瓜书) 摘要: 决策树是机器学习中一种非常常见的分类与回归方法,可以认为是if-else结构的规则.分类决策树是由节点和有向边组成的树形结构,节点表示特 ...
paip.日志中文编码原理问题本质解决python
paip.日志中文编码原理问题本质解决python 默认的python日志编码仅仅gbk...保存utf8字符错误..输出到个eric5的控制台十默认好像十unicode的,要是有没显示出来的字符,大 ...
AdaBoost算法原理简介
AdaBoost算法原理 AdaBoost算法针对不同的训练集训练同一个基本分类器(弱分类器),然后把这些在不同训练集上得到的分类器集合起来,构成一个更强的最终的分类器(强分类器).理论证明,只要每个 ...
集成学习之Adaboost算法原理
在boosting系列算法中,Adaboost是最著名的算法之一.Adaboost既可以用作分类,也可以用作回归. 1. boosting算法基本原理集成学习原理中,boosting系列算法的思想:
VS Code Python 全新发布！Jupyter Notebook 原生支持终于来了！
VS Code Python 全新发布!Jupyter Notebook 原生支持终于来了! 北京时间 2019 年 10 月 9 日,微软发布了全新的 VS Code Python 插件,带来了众多 ...
官宣！VS Code Python 全新功能在 PyCon China 全球首发！
北京时间 2019 年 9 月 21 日,PyCon China 2019 在上海举行. 在下午的演讲中,来自微软开发工具事业部的资深研发工程师在演讲中,我们看到了 Azure Notebook 与 ...
MAC+VS Code+Python+Markdown调试配置
目录 VS Code官网下载 VS Code插件推荐 VS Code Python环境配置 Markdown配置 VS Code官方文档 VS Code官网下载 VS Code官网下载地址 VS Co ...
基于单层决策树的AdaBoost算法原理+python实现
这里整理一下实验课实现的基于单层决策树的弱分类器的AdaBoost算法. 由于是初学,实验课在找资料的时候看到别人的代码中有太多英文的缩写,不容易看懂,而且还要同时看代码实现的细节.算法的原理什么的, ...
集成学习之Adaboost算法原理小结
在集成学习原理小结中,我们讲到了集成学习按照个体学习器之间是否存在依赖关系可以分为两类,第一个是个体学习器之间存在强依赖关系,另一类是个体学习器之间不存在强依赖关系.前者的代表算法就是是boostin ...

随机推荐

STM32窗口看门狗和独立看门狗的区别，看门狗介绍及代码演示
一.介绍: STM32看门狗分为独立看门狗和窗口看门狗两种,其两者使用调条件如下所示, IWDG和WWDG两者特点如下图所示: 独立看门狗的手册资料: 窗口看门狗的手册资料: ...
ZOJ 5579 Stean
Stean Time Limit: 1 Second Memory Limit: 65536 KB Special Judge Tom is good at making stea ...
hdu 3657最大点权独立集变形（方格取数变形）
/* 分奇偶为二部图,s与奇建图,t与偶建图,权值为当前数的值,如果遇到必取的权值置为inf. 奇偶建边为相邻的权值为2*(x&y):所有数的值-最小点全覆盖. 置为inf意为不能割掉.奇偶边 ...
【ACM】NYOJ_69_数的长度_20130725
数的长度时间限制:3000 ms | 内存限制:65535 KB 难度:1描述 N!阶乘是一个非常大的数,大家都知道计算公式是N!=N*(N-1)······*2*1.现在你的任务是计算出 ...
[bzoj4010][HNOI2015]菜肴制作_贪心_拓扑排序
菜肴制作 bzoj-4010 HNOI-2015 题目大意:给定一张n个点m条边的有向图,求一个toposort,使得:(1)满足编号为1的点尽量在前:(2)满足(1)的情况下编号为2的点尽量在前,以 ...
洛谷 P1041 传染病控制
P1041 传染病控制题目背景近来,一种新的传染病肆虐全球.蓬莱国也发现了零星感染者,为防止该病在蓬莱国大范围流行,该国政府决定不惜一切代价控制传染病的蔓延.不幸的是,由于人们尚未完全认识这种传染 ...
RPC服务框架探索之Thrift
前言架构服务化后,需要实现一套方便调用各服务的框架,现在开源如日中天,优先会寻找开源实现,如果没有合适自家公司业务的,才会考虑从零开发,尤其是一切以KPI为准绳的公司,谁会跟钱过不去?N个月之前,公司 ...
2.4－EN_STP
2.4-EN_STP 增强型生成树协议(EN_STP): Spannig Tree port states: blocking 20s+listening 15s+learning 15s最后 ...
反射调用android系统级API函数
try { Class<?> mClass = Class.forName("com.android.server.wifi.WifiSettingsStore"); ...
Light oj 1138 - Trailing Zeroes (III) 【二分查找 && N！中末尾连续0的个数】
1138 - Trailing Zeroes (III) problem=1138"> problem=1138&language=english&type=pdf&q ...

AdaBoost--从原理到实现（Code：Python）