GBDT算法推导过程

m次迭代，n个类别，那么就意味着学习了m*n棵回归树

train过程：假设有8个训练样本，3个类别

步骤一、假设所有样本的F矩阵，F矩阵是8*3的，F矩阵刚开始全为0，而实际每个样本都有一个属于的类别y,y能组成一个实际的矩阵也是8*3的

步骤二、决策树是不断学习残差的过程，这里的残差经过计算是y-p,其中p是由F矩阵求出来的，即

这里要知道决策树的分裂依据：遍历所有的特征纬度，这里是3个特征，对于每一个特征，选择一个合适的分裂点，

如果属性是数字

也就是遍历所有那个属性的值，eg[10,20,30,40,50,60,70]然后分类节点假设是3个的话就需要从中随机采样3个数据作为属性，eg[20,40,60]，那么在这个属性进行遍历的时候就可以以该点的值作为分界限，分割左右子树

如果属性是标量

就直接按照节点属性是否等于标量为分界线，分隔左右子树

如何选择最佳属性和最佳分隔点：

我们已经将树分隔成了左右子树了，那么怎么从那么多的分隔中选择最佳的分隔点呢

这里，leftTargets,rightTargets都是左右子树样本点的残差，也就是前面的y-p的值，所以这里分隔的依据是：选择左右子树残差的均方差和最小

这样一直分割下去，只要不超过最大深度，一直到达叶子节点

叶子节点的值：

其中：

建立好一棵树后，需要更新F矩阵，

接着再更加F矩阵和y矩阵重新计算残差，重新生成新的树，这样迭代M次，F矩阵是在不断地逼近y矩阵的（注意，这里的3个类的决策树是同时进行的，也就是一次迭代，生成的是3棵树，如下代码所示：

测试

将测试样本输入到m*n棵树中，每个类别是m棵树，不断累加这m棵树的的结果就是最终的f[instance_id]的值，然后选择值最大的f作为最终的label

公式推导部分：

简言之：最小化目标函数，泰勒展开，f’(x)=0求得叶子节点的值

论文名字：

Greedy function approximation : A Gradient Boosting Machine

gbdt推导和代码的更多相关文章

《神经网络的梯度推导与代码验证》之FNN（DNN）的前向传播和反向推导
在<神经网络的梯度推导与代码验证>之数学基础篇:矩阵微分与求导中,我们总结了一些用于推导神经网络反向梯度求导的重要的数学技巧.此外,通过一个简单的demo,我们初步了解了使用矩阵求导来批量 ...
《神经网络的梯度推导与代码验证》之FNN（DNN）前向和反向过程的代码验证
在<神经网络的梯度推导与代码验证>之FNN(DNN)的前向传播和反向梯度推导中,我们学习了FNN(DNN)的前向传播和反向梯度求导,但知识仍停留在纸面.本篇章将基于深度学习框架tensor ...
《神经网络的梯度推导与代码验证》之CNN的前向传播和反向梯度推导
在FNN(DNN)的前向传播,反向梯度推导以及代码验证中,我们不仅总结了FNN(DNN)这种神经网络结构的前向传播和反向梯度求导公式,还通过tensorflow的自动求微分工具验证了其准确性.在本篇章 ...
《神经网络的梯度推导与代码验证》之CNN前向和反向传播过程的代码验证
在<神经网络的梯度推导与代码验证>之CNN的前向传播和反向梯度推导中,我们学习了CNN的前向传播和反向梯度求导,但知识仍停留在纸面.本篇章将基于深度学习框架tensorflow验证我们所 ...
《神经网络的梯度推导与代码验证》之vanilla RNN的前向传播和反向梯度推导
在本篇章,我们将专门针对vanilla RNN,也就是所谓的原始RNN这种网络结构进行前向传播介绍和反向梯度推导.更多相关内容请见<神经网络的梯度推导与代码验证>系列介绍. 注意: 本系列 ...
《神经网络的梯度推导与代码验证》之vanilla RNN前向和反向传播的代码验证
在<神经网络的梯度推导与代码验证>之vanilla RNN的前向传播和反向梯度推导中,我们学习了vanilla RNN的前向传播和反向梯度求导,但知识仍停留在纸面.本篇章将基于深度学习框架 ...
《神经网络的梯度推导与代码验证》之LSTM的前向传播和反向梯度推导
前言在本篇章,我们将专门针对LSTM这种网络结构进行前向传播介绍和反向梯度推导. 关于LSTM的梯度推导,这一块确实挺不好掌握,原因有: 一些经典的deep learning 教程,例如花书缺乏相关 ...
SMO推导和代码-记录毕业论文4
SMO的数学公式通过Platt的论文和看这个博客:http://www.cnblogs.com/jerrylead/archive/2011/03/18/1988419.html,大概弄懂了.推导以后 ...
BP神经网络算法推导及代码实现笔记zz
一. 前言: 作为AI入门小白,参考了一些文章,想记点笔记加深印象,发出来是给有需求的童鞋学习共勉,大神轻拍! [毒鸡汤]:算法这东西,读完之后的状态多半是 --> “我是谁,我在哪?” 没事的 ...

随机推荐

JAVA单例
单例模式: 1 public class Person{ 2 public static Person per//定义一个静态变量,用来储存当前类的对象 3 private Person()//构造方 ...
VS Code
VS Code VS Code(Visual Studio Code)是由微软研发的一款免费.开源的跨平台文本(代码)编辑器.几乎完美的编辑器. 官网:https://code.visualstudi ...
jquery的ready方法（DOM是否加载完）详解与使用
jquery的ready方法(准备DOM触发)还是比较复杂的,我们先看流程图:
linux 防火墙开启80端口永久保存
经常使用CentOS的朋友,可能会遇到和我一样的问题.开启了防火墙导致80端口无法访问,刚开始学习centos的朋友可以参考下.经常使用CentOS的朋友,可能会遇到和我一样的问题.最近在Linux ...
javascript中的链表结构—从链表中删除元素
1.概念上一个博文我们讲到链表,其中有一个方法remove()是暂时注释的,这个方法有点复杂,需要添加一个Previous()方法找到要删除的元素的前一个节点,这一个博文我们来分析一下这个remov ...
ubuntu 12.04下zmap安装
zmap介绍 https://zmap.io/ ----------------华丽的分割线---------------- zmap 1.03 的安装 Step1: sudo apt-get ins ...
Kafka及 .NET Core 客户端
消息队列 Kafka 的基本知识及 .NET Core 客户端消息队列 Kafka 的基本知识及 .NET Core 客户端前言最新项目中要用到消息队列来做消息的传输,之所以选着 Kafka ...
代码滑动panorama-即程序中设置SelectedIndex
我们都知道panorama的SelectedIndex属性是只读的,所以通过修改它,在程序滑动panorama似乎不可能.那么是不是就没有办法了呢?其实我们可以通过设置SelectedItemProp ...
基于SignalR的小型IM系统
这个IM系统真是太轻量级了,提供的功能如下: 1.聊天内容美化 2.用户上下线提示 3.心跳包检测机制 4.加入用户可群聊下面来一步一步的讲解具体的制作方法. 开篇准备工作首先,巧妇难为无米之炊, ...
手把手教你在Windows下搭建React Native Android开发环境
最近看到React Native好像好厉害的样子,好奇心驱使之下体验了一下并将在Window下搭建React Natvie Android环境的步骤记录下来,并有需要的朋友参考.(我都是参考官方文档的 ...

gbdt推导和代码

GBDT算法推导过程

gbdt推导和代码的更多相关文章

随机推荐

热门专题