boosting_bagging

boosting(提升法）

对于训练集中的每个样本建立全职W（i），当某个样本被错误分类概率很高时，样本的权重加大；

在迭代过程中，每一个迭代器都是一个弱分类器，我们需要用某种策略将其组合，作为最终模型。

bagging（套袋法）

从原始样本集随机抽取n个训练样本，共进行k轮抽取，得到k个训练集。（k个训练集之间相互独立，元素可以有重复）
对于k个训练集，我们训练k个模型
对于分类问题：由投票表决产生分类结果；对于回归问题：由k个模型预测结果的均值作为最后预测结果。（所有模型的重要性相同）

区别：

样本选择：Bagging采用的是Bootstrap随机有放回抽样，训练集变化；而Boosting每一轮的训练集是不变的，样本权重变化。
样本权重：Bagging使用的是均匀取样，每个样本权重相等；Boosting根据错误率调整样本权重，错误率越大的样本权重越大。
预测函数：Bagging所有的预测函数的权重相等；Boosting中误差越小的预测函数其权重越大。
并行计算：Bagging各个预测函数可以并行生成；Boosting各个预测函数必须按顺序迭代生成。

1）Bagging + 决策树 = 随机森林

2）AdaBoost + 决策树 = 提升树

3）Gradient Boosting + 决策树 = GBDT

boosting_bagging的更多相关文章

随机推荐

python中键值叫唤例子
>>> myDict = {'a':'A','b':'B','c':'C'} >>> myDict {'a': 'A', 'c': 'C', 'b': 'B'} & ...
django的小操作，查询效率up，引用art-template模板+djangorestframework
Part1: 提高查询效率newses = News.objects.select_related('category', 'author').get(id=1) # category和author字 ...
UVA439-水题
题意:一只棋盘上的马,从一个点到另外一个点要走多少步解法:广搜 #include<stdio.h> #include<iostream> #include <strst ...
HP服务器安装配置教程
使用iLO远程管理HP系列服务器 http://blog.51cto.com/wangchunhai/837529
jdk配置（备份）
#####set java environment #export JAVA_HOME=/usr/java/jdk1..0_172 #export JRE_HOME=${JAVA_HOME}/jre ...
eval是只读数据，bind是可更新的．
1.Eval和Bind的区别绑定表达式 <%# Eval("字段名") %> <%# Bind("字段名") %> Eval(& ...
进程和创建线程的两种方法(threading.Thread)
进程如QQ 要以一个整体的形式暴露给操作系统管理,里面包含对各种资源的调用,内存的管理, 网络接口的调用等,进程就是各种资源管理的集合线程:是操作系统最小的调度单位,是一串指令的结合进程要操作 ...
AS3 在不规则区域内拖动
原理: 1.确保拖动对象在鼠标点上,如果不确定会出现瞬间移动的感觉 2.确保触碰到非通行区域,跳回到没触碰的点源码: import flash.events.MouseEvent; import f ...
svn异常处理
TortoiseSVN 为客户端,SUBVersion为服务器端. 1.安装的tortoiseSVN不在鼠标右键菜单栏出现这种原因是电脑的系统和svn不符,即电脑是64位系统,而svn是32位的. ...
kafka相关资料
先来说一下Kafka与RabbitMQ的对比: RabbitMQ,遵循AMQP协议,由内在高并发的erlanng语言开发,用在实时的对可靠性要求比较高的消息传递上. kafka是Linkedin于20 ...

boosting_bagging

boosting_bagging的更多相关文章

随机推荐

热门专题