Adaboost原理及相关推导

提升思想

一个概念如果存在一个多项式的学习算法能够学习它，并且正确率很高，那么，这个概率是强可学习的。一个概念如果存在一个多项式的学习算法能够学习它，并且学习的正确率仅比随机猜测略好，那么，这个概念是弱可学习的。强可学习与弱可学习是等价的。在学习中，如果已经发现了弱学习算法，那么是否能够将其提升为强学习算法呢？、

Adaboost

设训练数据集T={(x1,y1)，(x2,y2)，(xN,yN)}，对数据集进行初始化训练数据的权重分布：

对于m=1,2,3······M，步骤如下：

使用具有权值分布Dm的训练数据集学习，得到基本分类器：

计算Gm(x)在训练数据集上的分类误差率：

计算Gm(x)的系数：

更新训练数据集的权值分布：

这里，Zm是规范化因子：

这里的规范化因子仅仅是要归一化。

基本分类器的线性组合

最终得到的分类器为：

Adaboost中的误差上限

根据误差计算公式，有如下等式：

当G(xi)不等于yi时，yi*f(xi)<0，故exp(-yi*f(xi))>=1，前半部分得证，对于后面的等号，如下：

由此，可以计算得到训练的误差界，如下：

取r1,r2的最小值，记做r

Adaboost算法解释

Adaboost算法是模型为加法模型，损失函数为指示函数，学习算法为前向分布算法时的二分类学习算法

前向分步算法

对于下面加法模型：

其中，b()函数为基函数，bm为基函数系数，rm为基函数的参数

前向分步算法在给定训练数据及损失函数L(y，f(x))的条件下，学习加法模型f(x)成为经验风险极小化，即损失函数极小化问题：

算法简化：如果能够从前向后，每一步只学习一个基函数及其系数，逐步逼近上式，即每一步只优化：

前向分布算法框架

输入：

训练数据集T，损失函数L(y，f(x))，基函数集{b(x；r)}\

输出：

加法模型f(x)

算法步骤：

初始化f0(x)=0

对于m=1,2，·······M

极小化损失损失函数：

得到参数，b和r，在更新当前模型：

Adaboost算法是前向分布算法的特例，模型是由基本分类器组成的加法模型，损失函数是指数函数：

推导与证明

假设经过m-1轮迭代，前向分布算法已经得到fm-1(x)：

在第m轮迭代得到am，Gm(x)，fm(x)，目标是使前向分布算法得到的am和Gm(x)使fm(x)在训练数据集T上的指数损失最小：

wmi既不依赖α也不依赖G，所以与最小化无关。但依赖于fm-1(x)，所以，每轮迭代会发生变化。

首先求分类器G*(x)，对于任意α>0，是上式最小的G(x)由下式得到：

其中，

计算权值：

将G(x)带入

求导计算，得到：

分类错误率：

权值更新：

权值和错误率的关键解释：

二者做除，得到：

从而：

AdaBoost的训练误差是以指数速率下降的，AdaBoost算法不需要事先知道下界γ，AdaBoost具有自适应性，它能适应若分类器各自的训练误差率。（“适应”Adaptive的由来）

Adaboost原理及相关推导的更多相关文章

AdaBoost原理详解
写一点自己理解的AdaBoost,然后再贴上面试过程中被问到的相关问题.按照以下目录展开. 当然,也可以去我的博客上看 Boosting提升算法 AdaBoost 原理理解实例算法流程公式推导 ...
集成学习之Boosting —— AdaBoost原理
集成学习大致可分为两大类:Bagging和Boosting.Bagging一般使用强学习器,其个体学习器之间不存在强依赖关系,容易并行.Boosting则使用弱分类器,其个体学习器之间存在强依赖关系, ...
【Oracle 集群】ORACLE DATABASE 11G RAC 知识图文详细教程之RAC 工作原理和相关组件（三）
RAC 工作原理和相关组件(三) 概述:写下本文档的初衷和动力,来源于上篇的<oracle基本操作手册>.oracle基本操作手册是作者研一假期对oracle基础知识学习的汇总.然后形成体 ...
Adaboost原理及目标检测中的应用
Adaboost原理及目标检测中的应用 whowhoha@outlook.com Adaboost原理 Adaboost(AdaptiveBoosting)是一种迭代算法,通过对训练集不断训练弱分类器 ...
SSH深度历险（十一） AOP原理及相关概念学习+xml配置实例（对比注解方式的优缺点）
接上一篇 SSH深度历险(十) AOP原理及相关概念学习+AspectJ注解方式配置spring AOP,本篇我们主要是来学习使用配置XML实现AOP 本文采用强制的CGLB代理方式 Security ...
SSH深度历险（十） AOP原理及相关概念学习+AspectJ注解方式配置spring AOP
AOP(Aspect Oriented Programming),是面向切面编程的技术.AOP基于IoC基础,是对OOP的有益补充. AOP之所以能得到广泛应用,主要是因为它将应用系统拆分分了2个部分 ...
SpringBoot启动原理及相关流程
一.springboot启动原理及相关流程概览 springboot是基于spring的新型的轻量级框架,最厉害的地方当属自动配置.那我们就可以根据启动流程和相关原理来看看,如何实现传奇的自动配置二 ...
机器学习之AdaBoost原理与代码实现
AdaBoost原理与代码实现本文系作者原创,转载请注明出处: https://www.cnblogs.com/further-further-further/p/9642899.html 基本思路 ...
深度学习课程笔记（九）VAE 相关推导和应用
深度学习课程笔记(九)VAE 相关推导和应用 2018-07-10 22:18:03 Reference: 1. TensorFlow code: https://jmetzen.github.io/ ...

随机推荐

2019-2020-1 20199329《Linux内核原理与分析》第三周作业
<Linux内核原理与分析>第三周作业一.上周问题总结: 第二周头脑风暴完成较慢虚拟机libc配置错误书本知识使用不够熟练二.本周学习内容: 1.实验楼环境虚拟一个x86的CPU硬 ...
C#多线程(16)：手把手教你撸一个工作流
目录前言节点 Then Parallel Schedule Delay 试用一下顺序节点并行任务编写工作流接口构建器工作流构建器依赖注入实现工作流解析前言前面学习了很多多线程和任 ...
docker 部署FastDFS
教程:https://blog.csdn.net/fangchao2011/article/details/103202591 教程:https://www.jianshu.com/p/3f80cba ...
Eclipse插件svn和TortoiseSvn版本对应关系
2019独角兽企业重金招聘Python工程师标准>>> 先说一下今天碰到问题,自己在建svn仓库和导入,导出时因为版本不一致导致的错误. 因此一定要保证Eclipse中svn插件版本 ...
数学--数论-- HDU6298 Maximum Multiple 打表找规律
Given an integer nn, Chiaki would like to find three positive integers xx, yy and zzsuch that: n=x+y ...
图论--2-SAT--详解
问题描述: 现有一个由N个布尔值组成的序列A,给出一些限制关系,比如A[x]AND A[y]=0.A[x] OR A[y] OR A[z]=1等,要确定A[0..N-1]的值,使得其满足所有限制关系. ...
P5520 【[yLOI2019] 青原樱】
P5520 [[yLOI2019] 青原樱]题解整理博客的时候改了下分类标签,重新审一下题目传送门翻了翻题解区,发现基本没和我写的一样的(主要是都比我的写的简单看题目: 第一眼,数学题:第二眼 ...
mysql5.7 修改密码,修改权限
1.修改数据库对指定用户和ip权限 a. IP为192.168.0.1的用户jack拥有对数据库datebase的表table的增删改查权限, ,连接密码为password grant select ...
Shell脚本(一)入门
开始学习Shell脚本. #!/bin/bash ]; then echo "you are not root" else echo "you are root" ...
算法——Java实现栈
栈定义: 栈是一种先进后出的数据结构,我们把允许插入和删除的一端称为栈顶,另一端称为栈底,不含任何元素的栈称为空栈栈的java代码实现: 基于数组: import org.junit.jupite ...

Adaboost原理及相关推导

Adaboost原理及相关推导的更多相关文章

随机推荐

热门专题