秦曾昌人工智能课程---7、决策树集成学习Tree Ensembles

一、总结

一句话总结：

其实机器模型减少variance的比较好的方式就是多个模型取平均值

1、CART是什么？

classification and regression tree

2、决策树模型的本质是什么？

divide the input space into a few regions

3、我们如何用决策树去做预测？

信息不同属性按重要性依次下分：先划分x1的范围，这就形成了一个二叉树分支，再划分x2的范围，就形成的决策树。

叶子节点是分类，也是预测：预测的话就是不同范围的(x1,x2)就对应了不同的y，这个y就是可以用作预测的

叶子节点是预测值：决策树，非叶子节点就是x1，x2的范围，叶子节点就是预测的值y

4、CART tree 分割的一个例子？

|||-begin

x 1 | 2 3 4 | 5 6 7 8 9 10

y 0 | 1 2 3 | 4 5 6 7 8 9

|||-end

求不同分割的重要性：如果是1.5处分割，那么loss(1.5)=每一部分的差值平方和的和，比如第二部分xi={1-9}，x平均数=5，(xi-5)^2

5、CART tree的本质是什么？

二分·递归·分割树：感觉和线段树的分割非常相似，只不过cart tree的叶子节点是y值

6、如何用cart tree做集成学习？

多个角色投票产生：每个角色可能准确度不高，但是多个角色投票起来，准确率就高了很多（和多次模型取平均值很相似）

7、用cart tree做集成学习中Bagging 和 Boosting的区别是什么？

Bagging：每个臭皮匠的能力都是一样：每个模型是单独训练，方便做分布式，最后各个模型投票决定

Boosting：给臭皮匠分了等级：后一个模型的训练依赖于前一个，给分错的数据增加权限方便下一个模型分对，给训练的模型增加权限为了最后投票，最后也是各个模型投票决定

8、用cart tree做集成学习的好处是什么？

去掉了噪音：即那些不着边际的数据

二、内容在总结中

秦曾昌人工智能课程---7、决策树集成学习Tree Ensembles的更多相关文章

秦曾昌人工智能课程---6、Decision Tree Learning
秦曾昌人工智能课程---6.Decision Tree Learning 一.总结一句话总结: 怎样去构建决策树:比如一维:***|00|***|000|***,|为分割线,每个分割点都是一种情况, ...
秦曾昌人工智能课程---5、KNN和朴素贝叶斯
秦曾昌人工智能课程---5.KNN和朴素贝叶斯一.总结一句话总结: 拟合和概率:构建机器学习模型,一般有拟合和概率两种方式轻学无用:一定要保证学有所用,要深入学习,比如之前做的安卓,一定要学通, ...
大白话5分钟带你走进人工智能-第30节集成学习之Boosting方式和Adaboost
目录 1.前述: 2.Bosting方式介绍: 3.Adaboost例子: 4.adaboost整体流程: 5.待解决问题: 6.解决第一个问题:如何获得不同的g(x): 6.1 我们看下权重与函数的 ...
大白话5分钟带你走进人工智能-第31节集成学习之最通俗理解GBDT原理和过程
目录 1.前述 2.向量空间的梯度下降: 3.函数空间的梯度下降: 4.梯度下降的流程: 5.在向量空间的梯度下降和在函数空间的梯度下降有什么区别呢? 6.我们看下GBDT的流程图解: 7.我们看一个 ...
大白话5分钟带你走进人工智能-第32节集成学习之最通俗理解XGBoost原理和过程
目录 1.回顾: 1.1 有监督学习中的相关概念 1.2 回归树概念 1.3 树的优点 2.怎么训练模型: 2.1 案例引入 2.2 XGBoost目标函数求解 3.XGBoost中正则项的显式表达 ...
大白话5分钟带你走进人工智能-第二十九节集成学习之随机森林随机方式，out of bag data及代码(2)
大白话5分钟带你走进人工智能-第二十九节集成学习之随机森林随机方式 ,out of bag data及代码(2) 上一节中我们讲解了随机森林的基本概念,本节的话我们讲解随机森 ...
『Kaggle』分类任务_决策树&集成模型&DataFrame向量化操作
决策树这节中涉及到了很多pandas中的新的函数用法等,所以我单拿出来详细的理解一下这些pandas处理过程,进一步理解pandas背后的数据处理的手段原理. 决策树程序数据载入 pd.read_c ...
决策树(中)-集成学习、RF、AdaBoost、Boost Tree、GBDT
参考资料(要是对于本文的理解不够透彻,必须将以下博客认知阅读): 1. https://zhuanlan.zhihu.com/p/86263786 2.https://blog.csdn.net/li ...
吴裕雄 python 机器学习——集成学习梯度提升决策树GradientBoostingRegressor回归模型
import numpy as np import matplotlib.pyplot as plt from sklearn import datasets,ensemble from sklear ...

随机推荐

Python爬虫实战——反爬策略之代理IP【无忧代理】
一般情况下,我并不建议使用自己的IP来爬取网站,而是会使用代理IP. 原因很简单:爬虫一般都有很高的访问频率,当服务器监测到某个IP以过高的访问频率在进行访问,它便会认为这个IP是一只"爬虫 ...
leetcode-163周赛-1262-可被3整除的最大和
题目描述: 方法一:动态规划 O(N) class Solution: def maxSumDivThree(self, nums: List[int]) -> int: dp = [0, -1 ...
php封装支付
<?php namespace Pay; use think\Config; vendor ('Pay.alipay.pagepay.service.AlipayTradeService'); ...
清理Visual Studio解决方案临时文件：Clean Visual Studio Solution Temporary File Build20160418
复制保存到任意文件名.bat,放置在Visual Studio Solution目录下. 当Visual Studio Solution目录过于庞大或打算拷贝移动Visual Studio Solut ...
Redis和SpringBoot整合RedisUtils类
一.引入依赖 <dependency> <groupId>org.springframework.boot</groupId> <artifactId> ...
SPOJ MAXMATCH - Maximum Self-Matching (FFT)
题目链接:MAXMATCH - Maximum Self-Matching Description You're given a string s consisting of letters 'a', ...
python TypeError: ‘encoding’ is an invalid keyword argument for this function
shell调用python脚本出现了这个问题,查询原因得知,python脚本是python3.6写的,我们服务器上默认的python是python2.7.3,所以会出现编码问题. 解决思路: 1.安装 ...
vscode eslint插件对vue文件无效
vscode配置好了之后,只对.js文件提示 vue文件没有效果改成如下配置就好了. "eslint.validate": [ "javascript", & ...
Firefox好用的快捷键
1,Alt+D 你可以使用该快捷键直接把光标转到火狐的地址栏.非常有用 2,Ctrl + T和Ctrl + Shift + T Ctrl+T帮你打开一个新标签,Ctrl+Shift+T重新打开上次关闭 ...
[USACO10FEB]购买巧克力Chocolate Buying
题目描述 Bessie and the herd love chocolate so Farmer John is buying them some. The Bovine Chocolate Sto ...

秦曾昌人工智能课程---7、决策树集成学习Tree Ensembles

秦曾昌人工智能课程---7、决策树集成学习Tree Ensembles

一、总结

一句话总结：

其实机器模型减少variance的比较好的方式就是 多个模型取平均值

1、CART是什么？

classification and regression tree

2、决策树模型的本质是什么？

divide the input space into a few regions

3、我们如何用决策树去做预测？

信息不同属性按重要性依次下分：先划分x1的范围，这就形成了一个二叉树分支，再划分x2的范围，就形成的决策树。

叶子节点是分类，也是预测：预测的话就是不同范围的(x1,x2)就对应了不同的y，这个y就是可以用作预测的

叶子节点是预测值：决策树，非叶子节点就是x1，x2的范围，叶子节点就是预测的值y

4、CART tree 分割的一个例子？

求不同分割的重要性：如果是1.5处分割，那么loss(1.5)=每一部分的差值平方和的和，比如第二部分xi={1-9}，x平均数=5，(xi-5)^2

5、CART tree的本质是什么？

二分·递归·分割树：感觉和线段树的分割非常相似，只不过cart tree的叶子节点是y值

6、如何用cart tree做集成学习？

多个角色投票产生：每个角色可能准确度不高，但是多个角色投票起来，准确率就高了很多（和多次模型取平均值很相似）

7、用cart tree做集成学习中Bagging 和 Boosting的区别是什么？

Bagging：每个臭皮匠的能力都是一样：每个模型是单独训练，方便做分布式，最后各个模型投票决定

Boosting：给臭皮匠分了等级：后一个模型的训练依赖于前一个，给分错的数据增加权限方便下一个模型分对，给训练的模型增加权限为了最后投票，最后也是各个模型投票决定

8、用cart tree做集成学习的好处是什么？

去掉了噪音：即那些不着边际的数据

二、内容在总结中

秦曾昌人工智能课程---7、决策树集成学习Tree Ensembles的更多相关文章

随机推荐

热门专题

其实机器模型减少variance的比较好的方式就是多个模型取平均值