一.简介 xgboost在集成学习中占有重要的一席之位,通常在各大竞赛中作为杀器使用,同时它在工业落地上也很方便,目前针对大数据领域也有各种分布式实现版本,比如xgboost4j-spark,xgboost4j-flink等.xgboost的基础也是gbm,即梯度提升模型,它在此基础上做了进一步优化... 二.损失函数:引入二阶项 xgboost的损失函数构成如下,即一个经验损失项+正则损失项: \[Cost(y,F_{m-1},f_m)=\sum_{i=1}^n L(y_i,F_{m-1}(x…