【笔记】Stacking方法

Stacking

先前的思路很简单，假设有三个算法，每个算法都对数据进行一个预测，最后综合这三个结果得出一个最终结果，对于分类问题可以进行少数服从多数，对于回归问题可以简单地取平均值

stacking是另一种思路，对于stacking这个方法来说，假设有三个算法，首先求出这三个算法对于这个数据的预测结果，但是不直接使用这三个预测结果进行综合来得到最终结果，将这三个预测结果作为输入，再添加进一层算法，也就是说，以这三个结果作为输入，再训练出一个新的模型，然后用这个新的模型的输出作为最终的结果

这个方法可以解决回归问题也可以解决分类问题，只要三个算法得出的三个模型，其预测的结果是输入数据是某一类的概率就可以了，将这三个模型预测的某一类的概率值作为第四个模型的输入，最后得到一个总的新的样本是某一类的概率，使用这个概率再进行分类

实际上分类问题和回归问题可以以预测这个样本在哪个类别中的概率这个数值作为连接，就可以很轻松的将分类问题转换成回归问题或者是将回归问题转换成分类问题

明白了stacking是什么以后，看一下如何训练出一个stacking的分类器，思路本身是很简单的

要做的事情就是首先将训练数据集分成两份，对于其中的一份，使用这一份数据集训练出三个模型，第二份的意义是训练第四份模型

也就是说，首先使用第一份数据通过三个算法训练出三个模型，训练好以后将第二份数据直接丢进训练好的三个模型中，相应的，训练好的三个模型也就有了输出结果，这些新的输出结果和第二份的数据里相应的真值输出就形成了一个新的数据集，然后用这个新的数据集来训练第四个模型，最终形成stacking的集成训练模型

在了解构成以及思路以后就可以构建出更复杂的模型，使用三层的模型，第一层有三个模型，相应的可以得到三个输出，将这三个输入作为输入可以再分别训练出三个模型作为第二层的模型，这三个模型以第一层的输出作为输入，又可以得到三个输出结果，然后再使用这三个输出作为第三层这一个模型的输入，然后使用第三层模型得到的结果作为整个stacking模型的最终结果

按照上面的思路的话，如果要训练上面的stacking模型的话，就要将训练数据集分成三份，第一份用来训练第一层的三个模型，第二份用来训练第二层的三个模型，第三份就用来训练第三层的一个模型

所以对于stacking来说，层数是一个超参数，每一层的模型数也是一个超参数，因此stacking模型具有很高的复杂性，也正是如此，这个模型是很容易过拟合的

可以发现，stacking这种组建方式是很像神经网络的

【笔记】Stacking方法的更多相关文章

集成学习总结 & Stacking方法详解
http://blog.csdn.net/willduan1/article/details/73618677 集成学习主要分为 bagging, boosting 和 stacking方法.本文主要 ...
Java学习笔记之---方法和数组
Java学习笔记之---方法与数组 (一)方法 (1)什么是方法? 方法是解决一类问题的步骤的有序组合方法包含于类或对象中方法在程序中被创建,在其他地方被引用 (2)方法的优点使程序变得更简短而 ...
Stacking方法详解
集成学习方法主要分成三种:bagging,boosting 和 Stacking.这里主要介绍Stacking. stacking严格来说并不是一种算法,而是精美而又复杂的,对模型集成的一种策略. 首 ...
swift 笔记 (十一) —— 方法（类，结构体，枚举)
Methods (方法) 实例方法(Instance Methods) 我认为看到这里.我们唯能八一八的就是swift的自做主张的行为了,反正它就是会以各种方式帮助我们来完毕让代码看起来非常奇怪的事情 ...
Swift学习笔记(14)--方法
1.分类方法分为实例方法和类型方法实例方法(Instance Methods):与java中的类似,略类型方法(Type Methods):与java.oc中的类方法类似.声明类的类型方法,在方 ...
Tools - 笔记记录方法Markdown
Markdown 简介轻量级标记语言,使用易读易写的纯文本格式和类似HTML的标记语法来编写具有一定的格式的文档. 语法简洁直观,易学易用,可以使用任何喜爱的文本编辑器来阅读和写作. 可精- 确控制 ...
Java学习笔记之方法重载
被重载的方法必须具有不同的参数列表.不能基于不同修饰符或返回值类型来重载方法. package welcome; public class TestMethodOverloading { public ...
MongoDB学习笔记~Update方法更新集合属性后的怪问题
回到目录在对MongoDB进行封装后,对于Update更新对象里的集合属性时出现了一个现象,让人感到很恶心,人家更新前是个美丽的Array,但是更新之后集合对象变成了键值对,键是集合的类型名称,值是 ...
视觉机器学习读书笔记--------SVM方法
SVM是一种二类分类模型,有监督的统计学习方法,能够最小化经验误差和最大化几何边缘,被称为最大间隔分类器,可用于分类和回归分析.支持向量机的学习策略就是间隔最大化,可形式化为一个求解凸二次规划的问题, ...

随机推荐

python之学生信息管理系统
1 #!usr/bin/python 2 #encoding=utf-8 3 4 #1. 打印学生管理系统界面 5 def printStd(): 6 print ("*"*50) ...
Hadoop知识总结
------------恢复内容开始------------ Hadoop知识点 Hadoop知识点什么是HadoopHadoop和Spark差异Hadoop常见版本,有哪些特点,一般是如何进行选择H ...
YAOI Round #5 题解
前言比赛链接: Div.1 : http://47.110.12.131:9016/contest/13 Div.2 : http://47.110.12.131:9016/contest/12 D ...
如何搭建一个简易的 Web Terminal（一）
前言在介绍本篇文章的时候,先说一下本篇文章的一些背景.笔者是基于公司的基础建设哆啦 A 梦(Doraemon)一些功能背景写的这篇文章,不了解.有兴趣的同学可以去袋鼠云的 github 下面了解 ...
C语言：逻辑运算符||
#include <stdio.h> //逻辑运算符||特点:左右两边的表达式先做左边,如果左边为1则右边不用执行,整个结果为1:如果左边为0,再执行右边: main() { int x= ...
C语言：预处理命令总结
预处理指令是以#号开头的代码行,# 号必须是该行除了任何空白字符外的第一个字符.# 后是指令关键字,在关键字和 # 号之间允许存在任意个数的空白字符,整行语句构成了一条预处理指令,该指令将在编译器进行 ...
SQL USE语句（选择数据库）
对于大型的软件系统,会存在多个数据库,用来存储不同的数据,那么我们在开始操作之前,需要选择一个需要操作的数据库,进行后续数据的增.删.改.查工作. SQL USE语句用于选择SQL模式中的任何现有数据 ...
python -- 面向对象编程(类、对象)
一.类类是用来描述具有相同的属性和方法的对象的集合. 它定义了该集合中每个对象共同拥有的属性和方法. 类是一个独立的单位,它有一个类名,其内部包括成员变量和成员方法,分别用于描述对象的属性和行为. ...
微信小程序云开发-数据库-列表页携带id跳转到详情页
一.新建页面新建列表页"pages/goodslist/goodslist",新建列表详情页"pages/gooddetail/gooddetail" 二. ...
每天五分钟Go - 条件语句
if语句 if 布尔表达式 { /* 在布尔表达式为 true 时执行 */ } else { /* 在布尔表达式为 false 时执行 */ } 如下代码 if a>10{ fmt.Print ...

【笔记】Stacking方法

Stacking

【笔记】Stacking方法的更多相关文章

随机推荐

热门专题