python实现简单决策树（信息增益）——基于周志华的西瓜书数据

【python实现简单决策树（信息增益）——基于周志华的西瓜书数据】的更多相关文章

python实现简单决策树（信息增益）——基于周志华的西瓜书数据

数据集如下: 色泽根蒂敲声纹理脐部触感好瓜青绿蜷缩浊响清晰凹陷硬滑是乌黑蜷缩沉闷清晰凹陷硬滑是乌黑蜷缩浊响清晰凹陷硬滑是青绿蜷缩沉闷清晰凹陷硬滑是浅白蜷缩浊响清晰凹陷硬滑是青绿稍蜷浊响清晰稍凹软粘是乌黑稍蜷浊响稍糊稍凹软粘是乌黑稍蜷浊响清晰稍凹硬滑是乌黑稍蜷沉闷稍糊稍凹硬滑否青绿硬挺清脆清晰平坦软粘否浅白硬挺清脆模糊平坦硬滑否浅白…

周志华-机器学习西瓜书-第三章习题3.5 LDA

本文为周志华机器学习西瓜书第三章课后习题3.5答案,编程实现线性判别分析LDA,数据集为书本第89页的数据首先介绍LDA算法流程: LDA的一个手工计算数学实例: 课后习题的代码: # coding=utf-8# import flattenimport tensorflow as tffrom numpy import *import numpy as npimport matplotlib.pyplot as pltdef LDA(c1,c2): m1=mean(c1,axis=0) m2…

支持向量机（SVM）算法分析——周志华的西瓜书学习

1.线性可分对于一个数据集: 如果存在一个超平面X能够将D中的正负样本精确地划分到S的两侧,超平面如下: 那么数据集D就是线性可分的,否则,不可分. w称为法向量,决定了超平面的方向:b为位移量,决定了超平面与原点的距离. 样本空间中的任意点x到超平面X的距离(不太熟悉的可以复习高数中空间几何那一章的内容)可以写为: 使得下面两式成立的训练样本称为支持向量: 两个异类支持向量(一个等于+1,一个等于-1)到超平面的距离之和为: 它称之为“间隔” 想找到最大间隔的划分超平面,就是使最大: 等价于…

（二）《机器学习》（周志华）第4章决策树笔记理论及实现——“西瓜树”——CART决策树

CART决策树 (一)<机器学习>(周志华)第4章决策树笔记理论及实现——“西瓜树” 参照上一篇ID3算法实现的决策树(点击上面链接直达),进一步实现CART决策树. 其实只需要改动很小的一部分就可以了,把原先计算信息熵和信息增益的部分换做计算基尼指数,选择最优属性的时候,选择最小的基尼指数即可. #导入模块 import pandas as pd import numpy as np from collections import Counter #数据获取与处理 def getDat…

【深度森林第三弹】周志华等提出梯度提升决策树再胜DNN

[深度森林第三弹]周志华等提出梯度提升决策树再胜DNN 技术小能手 2018-06-04 14:39:46 浏览848 分布式性能神经网络还记得周志华教授等人的“深度森林”论文吗?今天,ArXiv上公布了深度森林系列最新的第三弹——可做表示学习的多层GBDT. 在这篇题为“Multi-Layered Gradient Boosting Decision Trees”的论文中,作者冯霁.俞扬和周志华提出了一种新颖的具有显式表示学习能力的多层GBDT森林(mGBDT),它可以与目标传播…

【Todo】【读书笔记】机器学习-周志华

书籍位置: /Users/baidu/Documents/Data/Interview/机器学习-数据挖掘/<机器学习_周志华.pdf> 一共442页.能不能这个周末先囫囵吞枣看完呢.哈哈哈. 当然了,我觉得Spark上面的实践其实是非常棒的.有另一个系列文章讨论了Spark. 还有另一篇读书笔记(Link)是关于<机器学习实战>.实战经验也很重要. P1 一般用模型指全局性结果(例如决策树),用模式指局部性结果(例如一条规则). P3 如果预测的是离散值,那就是分类-classi…

[重磅]Deep Forest，非神经网络的深度模型，周志华老师最新之作，三十分钟理解！

欢迎转载,转载请注明:本文出自Bin的专栏blog.csdn.net/xbinworld. 技术交流QQ群:433250724,欢迎对算法.技术感兴趣的同学加入. 深度学习最大的贡献,个人认为就是表征学习(representation learning),通过端到端的训练,发现更好的features,而后面用于分类(或其他任务)的输出function,往往也只是普通的softmax(或者其他一些经典而又简单的方法)而已,所以,只要特征足够好,分类函数本身并不需要复杂--博主自己在做researc…

偶尔转帖：AI会议的总结（by南大周志华）

偶尔转帖:AI会议的总结(by南大周志华) 说明: 纯属个人看法, 仅供参考. tier-1的列得较全, tier-2的不太全, tier-3的很不全. 同分的按字母序排列. 不很严谨地说, tier-1是可以令人羡慕的, tier-2是可以令人尊敬的,由于AI的相关会议非常多, 所以能列进tier-3的也是不错的 tier-1: IJCAI (1+): International Joint Conference on Artificial Intelligence AAAI (1): Na…

【转载】 AI会议的总结（by南大周志华）

原文地址: https://blog.csdn.net/LiFeitengup/article/details/8441054 最近在查找期刊会议级别的时候发现这篇博客,应该是2012年之前的内容,现在的CCF推荐会议.期刊可以在CCF官网上查看,但是这篇博客内容据说是周志华老师总结的,所以必须mark一下,以示支持. -----------------------------------------------------------------------------------------…

AI产业将更凸显个人英雄主义周志华老师的观点是如此的有深度

今天无意间在网上看的了一则推送,<周志华:AI产业将更凸显个人英雄主义> http://tech.163.com/18/0601/13/DJ7J39US00098IEO.html 摘录一些原文内容: 关于机器学习能够解决的任务,周志华认为,围棋属于封闭静态环境的任务,他不是“最难的任务”, 以往的机器学习就可以解决这种封闭静态环境任务. “我们今天面对的是动态开放环境下的机器学习挑战,最关键的就是鲁棒性.” 周志华称,这就要求AI必须很好的应对未知环境,是通往鲁棒人工智能的核心环节. ps:…