【集成模型】Stacking

CZiFan 2024-10-28 22:59:16 原文

0 - 思路

　　Stacking是许多集成方法的综合。其主要思路如下图所示，通过训练数据训练多个base learners（the first-level learners），这些learners的输出作为下一阶段meta-learners（the second-level learners）的输入，最终预测由meta-learners预测结果得到。

1 - 算法

　　具体地算法如下图所示（图片引自博客）。在第一阶段，采用$K$折交叉验证，首先将训练数据$X_{n\times m}$和对应标签$y_{n}$分成$K$份，训练$K$个base-learners，对于第$i$（$i=1,\cdots,K$）个base-learner，将第$i$份数据作为验证集，其余$(K-1)$份数据作为训练集进行训练。而后，将第$i$个base-learners对于各自验证集的预测结果$y_{n_i}^{(i)}$（如图中"Predict"橘红色所示）组合起来，即得到和训练数据规模一样的预测结果$y_{n}^{stage1}$（如图中"Predictions"橘红色所示）。将这个第一阶段的预测结果$y_{n}^{stage1}$以及对应的标签$y_{n}$作为第二阶段的meta-learners的训练数据进行训练即可。

　　在测试过程中，假设对于测试数据$X_{n\times m}^{test}$，经过$K$个base-learners进行预测得到第一阶段预测结果$y_{n\times K}^{stage1}$，而后可以通过硬投票或者软投票或者其他处理方法得到第一阶段的综合预测结果$y_{n}^{stage1}$，再通过meta-learners预测最终的结果$y_{n}^{stage2}$。

　　注意到，Stacking可以无限叠加下去，也就是stage可以从2开始一直叠加，但实际运用中，一般选取stage为2或者3，因为太多stage对于精度的提高微乎其微甚至没有而计算量却需要大量增加。

2 - 参考资料

https://blog.csdn.net/weixin_43991592/article/details/89962511

【集成模型】Stacking的更多相关文章

Python机器学习（基础篇---监督学习（集成模型））
集成模型集成分类模型是综合考量多个分类器的预测结果,从而做出决策. 综合考量的方式大体分为两种: 1.利用相同的训练数据同时搭建多个独立的分类模型,然后通过投票的方式,以少数服从多数的原则作出最终的 ...
DeepMind提出空间语言集成模型SLIM，有效编码自然语言的空间关系
前不久,DeepMind 提出生成查询网络 GQN,具备从 2D 画面到 3D 空间的转换能力.近日.DeepMind 基于 GQN 提出一种新模型.可以捕捉空间关系的语义(如 behind.left ...
『Kaggle』分类任务_决策树&集成模型&DataFrame向量化操作
决策树这节中涉及到了很多pandas中的新的函数用法等,所以我单拿出来详细的理解一下这些pandas处理过程,进一步理解pandas背后的数据处理的手段原理. 决策树程序数据载入 pd.read_c ...
【集成模型】Bootstrap Aggregating（Bagging）
0 - 思想如下图所示,Bagging(Bootstrap Aggregating)的基本思想是,从训练数据集中有返回的抽象m次形成m个子数据集(bootstrapping),对于每一个子数据集训练 ...
Kaggle机器学习之模型集成（stacking）
Stacking是用新的模型(次学习器)去学习怎么组合那些基学习器,它的思想源自于Stacked Generalization这篇论文.如果把Bagging看作是多个基分类器的线性组合,那么Stack ...
sklearn--决策树和基于决策树的集成模型
一.决策树决策树一般以选择属性的方式不同分为id3(信息增益),c4.5(信息增益率),CART(基尼系数),只能进行线性的分割,是一种贪婪的算法,其中sklearn中的决策树分为回归树和分类树两种 ...
监督学习集成模型——AdaBoost
一.集成学习与Boosting 集成学习是指将多个弱学习器组合成一个强学习器,这个强学习器能取所有弱学习器之所长,达到相对的最佳性能的一种学习范式. 集成学习主要包括Boosting和Bagging两 ...
DAG 模型 stacking boxes 动态规划
题目:UVA 103 stacking boxes 题目大意: 给你两个数,一个是盒子的个数,一个是每一个盒子的维数.将一个个盒子互相装起来,让你求最多可以装多少个,要求字典序最小. 解析:这个就是盒 ...
深度学习模型stacking模型融合python代码，看了你就会使
话不多说,直接上代码 def stacking_first(train, train_y, test): savepath = './stack_op{}_dt{}_tfidf{}/'.format( ...

随机推荐

【基础搜索】poj-2676-Sudoku（数独）--求补全九宫格的一种合理方案
数独时限:2000 MS 内存限制:65536K 提交材料共计: 22682 接受: 10675 特别法官描述数独是一个非常简单的任务.一个9行9列的正方形表被分成9个较小的3x ...
复杂json后端解析出现第二层无数据的问题
自从使用了lombok之后写代码更加爽了但是突然遇到前端小姐姐传的对象中的数组后端接收不到,查了好长时间无果后就搁置了. 今天突然想找找什么原因.自己写了一个测试的案例,经过测试过后发现是lombo ...
python开发的百度翻译接口
做的一个python版的百度翻译,附代码 #!/usr/bin/env python # -*- coding:utf-8 -*- ''' 爬虫之百度翻译需要的库有 js2py, request ...
26 组件中style标签lang属性和scoped属性的介绍
普通的style标签只支持普通的样式,如果想要启用scss或less,需要为style元素,设置lang属性只要咱们的style标签,是在 .vue 组件中定义的,那么,推荐都为style开启sc ...
17 webpack中babel的配置
在webpack中,默认只能处理一部分ES6的新语法,一些更高级的ES6语法或者ES7语法, webpack是处理不了的:这时候,就需要借助于第三方的loader,来帮助webpack处理这些高级的语 ...
Oracle递归查询connect by
一.概述 Oracle中可以通过START WITH . . . CONNECT BY . . .子句来实现SQL的层次查询. 自从Oracle 9i开始,可以通过 SYS_CONNECT_BY_PA ...
springMvc--接受请求参数
作者:liuconglin 接收基本类型表单: <h1>接受基本类型参数到Controller</h1> <form action="/param/test& ...
django设置时区与语言
django的目录下,django/conf/locale,这个目录下,看有什么语言包, zh_Hans代表中文简体,zh_Hant代表中文繁体,设置即可. TIME_ZONE设置为:Asia/Sha ...
Vue之nextTick()
我们有时候操作 DOM,是想在 data 数据变更的时候进行操作. 那么,我们应该怎么做呢? index.html <!DOCTYPE html> <html lang=" ...
sql server 存储过程中,调用事务 tran
Sql Server 2005/2008中提供了begin tran,commit tran和rollback tran来使用事务. begin tran表示开始事务, commit tran表示 ...