关于Adaboost——样本抽样的权值的实际意义

看这篇文章的前提：已经看了PRML中的Adaboost的算法流程

看懂下面的内容必须牢牢记住：Adaboost使用的误差函数是指数误差

文章主要目的：理解样本抽样的权值是为什么那样变化的。

得出的结论：训练第m个基分类器y_m时，样本n的抽样权重是f_m-1在样本n上的指数误差

当y_m将第n个样本分对了时，则权值保持不变，否则权值增加exp{α_m}(>1)倍

（1）

（2）

（3）

(1)表示分类器f_m的误差函数是指数误差函数

(2)表示分类器f_m是一系列的基函数(y_l,即基分类器)的加权和，α_l是基分类器y_l的权重，l=1...m

(3)表示分类器f_m是二分类

Adaboost是选择恰当的α_l和y_l使得误差E最小，l=1...m

找到全局最优是件很麻烦的事，所以决定找到局部最优，采用了前向分步算法

前向分步算法

假设前m-1个基分类器y₁(x)...y_m-1(x)已经确定，且相应的权重α₁...α_m-1也已经确定，此时只需要寻找恰当的α_m和y_m使得E最小。

因此E可以转换为：

（4）

根据指数误差函数，我们可以知道，其实就是f_m-1在样本n上的误差，即训练y_m时，样本n的抽样权重是f_m-1在样本n上的误差。

（4）中右边的累加项是表示f_m在样本n上的误差，所以就有了下面的递推公式

（5）

（6）

公式6很容易得到，将（6）代入（5）中，可以得到（7）

（7）

而与n无关，即与样本(数据)无关，所以对样本的抽样没影响，可以去掉。

当y_m将第n个样本分对了，则权值保持不变，否则权值增加expα_m(>1)倍

接下来的内容是关于算法的三个主要部分的解释：

1、当考虑y_m的变化时，最小化分类器f_m的指数误差损失等价于最小化第m个基分类器y_m的加权的0-1损失

2、当只考虑α_m的变化时，最小化分类器f_m的指数误差损失，得到基分类器的权值α_m的值（与加权误差率的关系）

3、加权误差率

对（4）进行进一步的转换得到：

（8）

如果只考虑y_m的变化，最小化E等价于最小化（9）

（9）

（9）表示加权误差和

如果只考虑α_m的变化，最小化E得到

（10）

其中：

是加权误差率

补充AdaBoost算法框架

关于Adaboost——样本抽样的权值的实际意义的更多相关文章

【机器学习的Tricks】随机权值平均优化器swa与pseudo-label伪标签
文章来自公众号[机器学习炼丹术] 1 stochastic weight averaging(swa) 随机权值平均这是一种全新的优化器,目前常见的有SGB,ADAM, [概述]:这是一种通过梯度下 ...
51nod1459(带权值的dijkstra)
题目链接:https://www.51nod.com/onlineJudge/questionCode.html#!problemId=1459 题意:中文题诶- 思路:带权值的最短路,这道题数据也没 ...
caffe中权值初始化方法
首先说明:在caffe/include/caffe中的 filer.hpp文件中有它的源文件,如果想看,可以看看哦,反正我是不想看,代码细节吧,现在不想知道太多,有个宏观的idea就可以啦,如果想看代 ...
[NOIP2014]联合权值题解
题目大意: 有一棵树,求距离为2的点权的乘积的和以及最大值. 思路: 枚举每一个点,则与其相邻的点互为距离为2的点.该部分的最大值为点权最大的两个点的积,和为点的权值和的平方减去每个点的平方,这样每条 ...
Codevs 3728 联合权值
问题描述无向连通图G有n个点,n-1条边.点从1到n依次编号,编号为i的点的权值为Wi ,每条边的长度均为1.图上两点(u,v)的距离定义为u点到v点的最短距离.对于图G上的点对(u,v),若它 ...
css权值计算
外部样式表<内部样式表<内联样式: HTML 标签选择器的权值为 1: Class 类选择器的权值为 10: ID 选择器的权值为 100: 内联样式表的权值最高 1000: !impor ...
【树状数组套权值线段树】bzoj1901 Zju2112 Dynamic Rankings
谁再管这玩意叫树状数组套主席树我跟谁急明明就是树状数组的每个结点维护一棵动态开结点的权值线段树而已好吧,其实只有一个指针,指向该结点的权值线段树的当前结点每次查询之前,要让指针指向根结点不同结 ...
P1906联合权值
描述无向连通图 G 有 n 个点,n-1 条边.点从 1 到 n 依次编号,编号为 i 的点的权值为 WiWi, 每条边的长度均为 1.图上两点(u, v)的距离定义为 u 点到 v 点的最短距离. ...
hdu Caocao's Bridges(无向图边双连通分量，找出权值最小的桥)
/* 题意:给出一个无向图,去掉一条权值最小边,使这个无向图不再连同! tm太坑了... 1,如果这个无向图开始就是一个非连通图,直接输出0 2,重边(两个节点存在多条边, 权值不一样) 3,如果找到 ...

随机推荐

openstack安装指南和在centos7上的安装指南
openstack安装指南官网:http://docs.openstack.org/project-install-guide/newton/ openstack在centos7上的安装指南官网:ht ...
C#执行Sql 时，出现“算术运算导致溢出”问题,如何解决？
昨天在C#执行oracle的sql语句时,总是报错,原先在pl/sql 执行sql语句是可以的,在C#执行就报“算术运算导致溢出”问题 SQL语句 select A.SKU_ID 商品标识,A.COL ...
List.contains()与自动拆箱
最近项目引入sonarQube这种代码静态检查的东东,以前没有人力和精力review,现在只要扫描一下项目,就发现很多有趣的地方. 有这么一段代码: List<Long> list = L ...
python settings :RROR 1130: Host 'XXXXXX' is not allowed to connect to this MySQL server
pymysql.err.InternalError: (1130, u"Host '127.0.0.1' is not allowed to connect to this MySQL se ...
caffe，Inception v2 Check failed: top_shape[j] == bottom[i]->shape(j)
使用Caffe 跑 Google 的Inception V2 对输入图片的shape有要求,某些shape输进去可能会报错. Inception model中有从conv和pooling层concat ...
[leetcode整理]
=======简单 leetcode164 Maximum Gap sort两次 =======有参考 330 Patching Array 98 Validate Binary Search Tre ...
C++11智能指针 share_ptr,unique_ptr,weak_ptr用法
0x01 智能指针简介所谓智能指针(smart pointer)就是智能/自动化的管理指针所指向的动态资源的释放.它是存储指向动态分配(堆)对象指针的类,用于生存期控制,能够确保自动正确的销毁动 ...
DevExpress WinForms v18.2新版亮点（五）
行业领先的.NET界面控件2018年第二次重大更新——DevExpress v18.2日前正式发布,本站将以连载的形式为大家介绍各版本新增内容.本文将介绍了DevExpress WinForms v1 ...
HihoCoder - 1483 区间最值
给定n个数A1...An,小Ho想了解AL..AR中有多少对元素值相同.小Ho把这个数目定义为区间[L,R]的价值,用v[L,R]表示. 例如1 1 1 2 2这五个数所组成的区间的价值为4. 现在小 ...
理解mpvue的生命周期
mpvue是美团基于vue开发的一个开发小程序的框架,从而以vue的语法来开发小程序.在生命周期上,mpvue同时支持了vue的生命周期和小程序的生命周期,这可能让新上手的同学费解.这篇文章就来讲讲m ...

关于Adaboost——样本抽样的权值的实际意义

关于Adaboost——样本抽样的权值的实际意义的更多相关文章

随机推荐

热门专题