本章全部来自于李航的<统计学>以及他的博客和自己试验.仅供个人复习使用. Boosting算法通过改变训练样本的权重,学习多个分类器,并将这些分类器进行线性组合,提高分类性能.我们以AdaBoost为例. 它的自适应在于:前一个弱分类器分错的样本的权值(样本对应的权值)会得到加强,权值更新后的样本再次被用来训练下一个新的弱分类器. 在每轮训练中,用总体(样本总体)训练新的弱分类器,产生新的样本权值.该弱分类器的话语权,一直迭代直到达到预定的错误率或达到指定的最大迭代次数. 有两个问题需要回答:…