Gradient boosting

gradient boosting 是一种boosting(组合弱学习器得到强学习器)算法中的一种，可以把学习算法(logistic regression,decision tree)代入其中。

问题描述：

给定一组数据{(x,y)}i,i=1,2...,N,使用函数F(x)对数据进行拟合，使对于给定损失函数L(y,F(x))最小

（损失函数可以为$(y-F(x))^2,|y-F(x)|$[regression]，$log(1+e^{-2yF})$[classification]）

使用$F(x)=F_0(x)+\sum_{m=1}^{M}r_ih_m(x;\alpha_m)$(1)，

$F_0(x)=argmin_r\sum_{i=1}^N L(y_i,r)$为初始值；为常数;$r_i$为权重

$h_m(x;\alpha_m)$是某个弱学习算法(logistic regression,decision tree)，$\alpha_m$为算法的参数

算法描述：

首先选取一个常数作为F(x)的估计,最优的常数需要使损失函数最小

1.初始化$F_0(x)=argmin_r\sum_{i=1}^N L(y_i,r)$

现在已经有了$F_0(x)$作为$F(x)$的初始估计,考虑使用gredient decent方法，使损失函数减少

A.选取方向$g_m=-\left[\frac{\partial L(y,F(x))}{\partial F(x)}\right]_{F(x)=F_{m-1}(x)}$

B.选取方向后，选取步长，$\beta_m=argmin_{\beta}\sum_{i=1}^{N}L(y_i,F_{m-1}(x_i)+\beta g_m)$

对照(1)式，$g_m$(称为残差,residual)即为$h_m(x;\alpha_m)$；$\beta_m$即为$r_m$

2.计算$g_m$，使用$h_m(x;\alpha_m)$拟合${x,g_m}_1^N$，得到参数$\alpha_m$和$h_m(x)$的值

计算$r_m=argmin_r\sum_{i=1}^{N}L(y_i,F_{m-1}(x_i)+rh_m(x))$

3.更新$F_m(x)=F_{m-1}(x)+r_mh_m(x)$

4.循环2，3两步，得到F_M(x)

输出：算法结束后，得到以下参数$(r_0,r_1,r_2,...,r_M,\alpha_1,\alpha_2,...,\alpha_M)$

当作预测时：$F(c)=r_0+\sum_{i=1}^{M}r_ih_i(c;\alpha_i)$

Demo(程序，数据) matlab

程序中使用：

损失函数 $L(y,F(x))=\frac{1}{N}\sum_{i=1}{N}(y_i-F(x_i))^2$

弱学习算法 spline regression 参看Intro_to_splines(实际就是加了特征转换的regression)

注意：程序中的predict实现是错误的；程序没有计算步长$r_m$，而是使用常数

for i=1:nboost

    % 计算残差g_m，residual

    gradient = -2/nTrain * (f-y);

    % 用h_m拟合{(x,g_m)}

    submodel = boostedModel(X,gradient,options);

    % 作者实现中，对每个特征生成一个spline regression，下列代码选出表现最好的特征

    diff = (submodel - Y).^2;

    err = sum(diff,1)/nTrain;

    best(i) = find( err == min(err));

    f_i = submodel(:,best(i));

    % 如果需要预测，需要保存 spline regression 的两个参数，

    % 特征i和参数alpha(regression每个特征上的权重)

    %

    % 以及训练spline regression时用的knote及Degree参数

    % 没有计算步长（权重），直接使用常数，1-500次循环时，v=0.9

    if i>500

        v = 0.5;

    end

    %更新F_m(x)

    f = f + v*f_i;

    if mod(i,100) == 0

        n = n+1;

        error(n) = 1/nTrain * sum((y - f).^2);

    end

end

Gradient boosting的更多相关文章

Gradient Boosting Decision Tree学习
Gradient Boosting Decision Tree,即梯度提升树,简称GBDT,也叫GBRT(Gradient Boosting Regression Tree),也称为Multiple ...
A Gentle Introduction to the Gradient Boosting Algorithm for Machine Learning
A Gentle Introduction to the Gradient Boosting Algorithm for Machine Learning by Jason Brownlee on S ...
How to Configure the Gradient Boosting Algorithm
How to Configure the Gradient Boosting Algorithm by Jason Brownlee on September 12, 2016 in XGBoost ...
Ensemble Learning 之 Gradient Boosting 与 GBDT
之前一篇写了关于基于权重的 Boosting 方法 Adaboost,本文主要讲述 Boosting 的另一种形式 Gradient Boosting ,在 Adaboost 中样本权重随着分类正确与 ...
GBDT(Gradient Boosting Decision Tree)算法&协同过滤算法
GBDT(Gradient Boosting Decision Tree)算法参考:http://blog.csdn.net/dark_scope/article/details/24863289 理 ...
机器学习中的数学(3)-模型组合(Model Combining)之Boosting与Gradient Boosting
版权声明: 本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请联系wheeleast@gm ...
Jackknife，Bootstraping, bagging, boosting, AdaBoosting, Rand forest 和 gradient boosting的区别
引自http://blog.csdn.net/xianlingmao/article/details/7712217 Jackknife,Bootstraping, bagging, boosting ...
模型组合(Model Combining)之Boosting与Gradient Boosting
版权声明: 本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请联系wheeleast@gm ...
Gradient Boosting, Decision Trees and XGBoost with CUDA ——GPU加速5-6倍
xgboost的可以参考:https://xgboost.readthedocs.io/en/latest/gpu/index.html 整体看加速5-6倍的样子. Gradient Boosting ...

随机推荐

alsa音频驱动科普第一课
做linux音频编程对alsa应该不陌生. 但是对于刚接触这块技术的同学来说是一件困难的事情.原因在于:网上关于alsa的资料太少了,特别国内的资料更是大部分重复.对于初学者来说特别苦恼. 由于笔者经 ...
sql 数据库庞大数据量需要分表
17:04:05问下在什么情况下审核分区啊 ~..大熊..o○ 17:06:53这个要看应用~..大熊..o○ 17:07:37比如数据量很大,查询多是按照时间段查询,就可以用时间段来做分区~.. ...
动态可视化库Vis.js：社交关系谱
Form Here:http://code.csdn.net/news/2819345 Vis.js 是一个动态的.基于浏览器的可视化库,可处理大量的动态数据并能与这些数据进行交互操作.该项目是由Al ...
linux之SQL语句简明教程---表格连接
现在我们介绍连接 (Join) 的概念.要了解连接,我们需要用到许多我们之前已介绍过的指令.我们先假设我们有以下的两个表格, Store_Information 表格 Store_Name Sales ...
HDU1875 畅通工程再续 (并查集)
畅通工程再续 Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Total Subm ...
模板应用--UI线程与worker线程同步模仿c# invoke
由之前的一篇博文 <UI线程与worker线程><UI线程与worker线程>引出,UI线程与worker线程“串行化”在win32上实现是多么没有节操的事情,代码编写麻烦不说 ...
HDU 2517 / POJ 1191 棋盘分割区间DP / 记忆化搜索
题目链接: 黑书 P116 HDU 2157 棋盘分割 POJ 1191 棋盘分割分析: 枚举所有可能的切割方法. 但如果用递归的方法要加上记忆搜索, 不能会超时... 代码: #include& ...
rpm包下载网站
摘自http://blog.sina.com.cn/s/blog_4942055d0100031a.html rpm包下载网站 http://www.rpmfind.net http://www.rp ...
Tengine笔记1：安装Tengine和Tengine说明
什么是Tengine 官方帮助文档:http://tengine.taobao.org/nginx_docs/cn/ Tengine的安装新建tengine用户组 groupadd -r n ...
启动Tomcat自动加载（运行）类
其实这是紧跟着我上次写的java计时器Timer的,因为Timer的测试类写好后,不可能要通过什么东西去触发,对已经存在的时间点进行监控所以,在启动项目是自动运行此类方法如下: 一.在web.xm ...

Gradient boosting

Gradient boosting

Gradient boosting的更多相关文章

随机推荐

热门专题