特点: 是一个二叉树,元素可以重复利用,可以做回归也可以做分类,分类用最小二乘法,即误差平方和最小 切割方法: 对于可量化的x来说: 切割点通常为两个x的平均值 左右两部分分别取均值,再评判以哪个分割点的误差平方和最小,即第一层根节点为此点 以此为规则,往下迭代,构建出回归树 对于不可量化的x来说: x无法去均值.直接以特征属性割分,再计算两个区域的均值,再寻找误差平方和最小的切割点 举个栗子: CART回归树的构建: 优点: 易于解释 处理类别特征,其他的技术往往要求数据属性的单一 延展到多分…