XGBoost、LightGBM参数讲解及实战

本文链接：https://blog.csdn.net/linxid/article/details/80785131
XGBoost
一、API详解
xgboost.XGBClassifier
1.1 参数
1.1.1 通用参数：
booster=‘gbtree’ 使用的提升数的种类 gbtree, gblinear or dart
silent=True: 训练过程中是否打印日志
n_jobs=1: 并行运行的多线程数
1.1.2 提升树参数
learning_rate=0.1: 训练的学习率，和梯度下降差不多
max_depth=3: 树的最大深度
gamma=0
n_estimators=100: 要拟合的树的棵树，可以认为是训练轮数
min_child_weight=1: 叶结点的最小权重
subsample=1: 训练样本的抽样比率，行索引
colsample_bytree=1: 特征的抽样比率，列索引
reg_alpha=0: L1正则化系数
reg_lambda=1: L2正则化系数
1.1.3 学习任务参数
objective=‘binary:logistic’ 确定学习任务和相应的学习函数
"reg:linear" -线性回归
"reg:logistic" -逻辑回归
"binary:logistic" -二分类逻辑回归，输出概率
"binary:logitraw" -二分类逻辑回归，输出未logistic变换前的得分

"multi:softmax"
"multi:softprob"

random_state=0: 随机种子数

missing=None: 缺失值处理办法

max_delta_step=0,

colsample_bylevel=1

scale_pos_weight=1,

base_score=0.5,

nthread=None: 弃用，改用n_jobs

seed=None：弃用，改用random_state

1.1.4 控制过拟合：
降低模型复杂度：max_depth, min_child_weight and gamma
对样本随机采样：subsample, colsample_bytree
降低学习率，同时相应提高训练轮数
1.2 方法：
1.2.1 fit
X：特征矩阵

y: 标签

sample_weight=None: 没一个样本的权重

eval_set=None: (X,y)验证集，用于检测提前结束训练

eval_metric=None: 评价指标

"rmse"
"mae"
"logloss"
"error":二分类错误率，阈值是0.5
"error@t":和error类似，阈值为t
"mlogloss"
"auc"

early_stopping_rounds=None: 提前结束轮数
verbose=True,
xgb_model=None,
sample_weight_eval_set=None
1.2.2 predict(data, output_margin=False, ntree_limit=0)
返回预测类别，数据类型np.array，阈值不好控制

1.2.3 predict_proba(data, ntree_limit=0)
预测每一个数据，成为给定类别的概率

二、实例学习如何使用Xgboost
https://github.com/dmlc/xgboost/tree/master/demo

LightGBM
一、API详解
lightgbm.LGBMClassifier
参数 XGBoost CatBoost Lightgbm
模型参数 boosting_type=‘gbdt’(gbdt,dart,goss,rf)
num_leaves=31
max_depth=-1(no limit)
n_estimators=100
learning_rate=0.1
objective=(regression,binary/multiclass)
class_weight=()
subsample=1 训练样本采样率(行)
colsample_bytree=1 训练特征采样率(列)
lambda_l1=0：L1正则化系数
lambda_l2=0.0: L2正则化系数
random_state=None: 随机种子数
n_jobs=-1: 多线程数
max_bin=255
metric
fit X,y
eval_set=None([(X_train, y_train), (X_valid, y_valid)])
early_stopping_rounds=None
categorical_feature=‘auto’
verbose=True
eval_metric=None
metrics l1/mae
l2/mse(regression)
l2_root/rmse
binary_logloss(bi-classification)
auc
multi_logloss
参考资料：
1. XGBoost和LightGBM的参数以及调参
2. Xgboost参数调优的完整指南及实战
3. LightGBM调参笔记
4. LightGBM 调参方法（具体操作）

————————————————
版权声明：本文为CSDN博主「linxid」的原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/linxid/article/details/80785131

XGBoost、LightGBM参数讲解及实战的更多相关文章

XGBoost 重要参数(调参使用)
XGBoost 重要参数(调参使用) 数据比赛Kaggle,天池中最常见的就是XGBoost和LightGBM. 模型是在数据比赛中尤为重要的,但是实际上,在比赛的过程中,大部分朋友在模型上花的时间却 ...
RF/GBDT/XGBoost/LightGBM简单总结(完结)
这四种都是非常流行的集成学习(Ensemble Learning)方式,在本文简单总结一下它们的原理和使用方法. Random Forest(随机森林): 随机森林属于Bagging,也就是有放回抽样 ...
R︱Yandex的梯度提升CatBoost 算法（官方述：超越XGBoost/lightGBM/h2o）
俄罗斯搜索巨头 Yandex 昨日宣布开源 CatBoost ,这是一种支持类别特征,基于梯度提升决策树的机器学习方法. CatBoost 是由 Yandex 的研究人员和工程师开发的,是 Matri ...
RF,GBDT,XGBoost,lightGBM的对比
转载地址:https://blog.csdn.net/u014248127/article/details/79015803 RF,GBDT,XGBoost,lightGBM都属于集成学习(Ensem ...
Opencv+Yolov3算法实现社交距离安全检测讲解和实战（Social Distance Detector）
在我们进行交流谈话时,人与人之间总要保持一定的距离,尤其是在疫情的情况下,人与人之间更要保持一定的安全距离,今天给大家来介绍一个检测社交距离的项目,实现社交距离检测器. 社交距离(Social Dis ...
（万字好文）Dubbo服务熔断与降级的深入讲解&代码实战
原文链接:(万字好文)Dubbo服务熔断与降级的深入讲解&代码实战一.Dubbo服务降级实战 1 mock 机制谈到服务降级,Dubbo 本身就提供了服务降级的机制:而 Dubbo 的服务 ...
android ui界面设计参数讲解
百度文库: http://wenku.baidu.com/link?url=s66Hw6byBEzmjL77doYL1YQN4Y_39F7MovaHKs5mVGrzTDOQCAmiM-1N_6Cdm- ...
XGBoost中参数调整的完整指南（包含Python中的代码）
(搬运)XGBoost中参数调整的完整指南(包含Python中的代码) AARSHAY JAIN, 2016年3月1日介绍如果事情不适合预测建模,请使用XGboost.XGBoost算法已 ...
小D课堂 - 零基础入门SpringBoot2.X到实战_第9节 SpringBoot2.x整合Redis实战_40、Redis工具类封装讲解和实战
笔记 4.Redis工具类封装讲解和实战简介:高效开发方式 Redis工具类封装讲解和实战 1.常用客户端 https://redisdesktop.com/download ...

随机推荐

Linux-3.14.12内存管理笔记【建立内核页表（2）】-低端内存的建立
前面的前奏已经分析介绍了建立内核页表相关变量的设置准备,接下来转入正题分析内核页表的建立. 建立内核页表的关键函数init_mem_mapping(): [file:/arch/x86/mm/init ...
echarts js报错 Cannot read property 'getAttribute' of null
本文将为您描述如何解决 eharts.js报错 Uncaught TypeError: Cannot read property 'getAttribute' of null 的问题根据报错信息查找 ...
React 以两种形式去创建组件类或者函数（二）
08==>创建组件以 1类的形式或者以 2函数的形式 09==>使用组件在src下创建components文件夹是放组件的 CompType.js 组件组件开头大写(重要) Com ...
python中copy()和deepcopy()详解
**首先直接上结论: —–我们寻常意义的复制就是深复制,即将被复制对象完全再复制一遍作为独立的新个体单独存在.所以改变原有被复制对象不会对已经复制出来的新对象产生影响.—–而浅复制并不会产生一个独立的 ...
python--各种锁机制归纳整理
Q:为什么要用锁?什么样的业务场景下需要用锁? 就拿之前的工单系统来说,当审批方式为角色组审批时,代表该角色组内任意一人审批即可,这时,该角色组内成员的系统上都是可以显示审批按钮,如果此时A审批员和B ...
kafka 重放重播从某个时间点或者offset开始消费
转自: https://www.jianshu.com/p/932663e9a226 consumer.subscribe(topicA); consumer.poll(100);//正常订阅topi ...
JAVA 网络编程 - 实现群聊程序
在实现这个程序之前, 我们需要了解一些关于 Java 网络编程的知识. 基本的网络知识: 网络模型 OSI (Open System Interconnection 开放系统互连 ...
VRF--虚拟路由表
VRF Virtual routing forwarding,虚拟路由转发表,简称VPN.他能在两个site之间建立两个不用的路由表,相互隔离,把每台交换机逻辑上分成多台虚拟交换机,即多VPN路由转发 ...
Express中app.use()用法详解
app.use(path,callback)中的callback既可以是router对象又可以是函数 app.get(path,callback)中的callback只能是函数当一个路由有好多个子路 ...
ARM64的内核栈、用户栈、寄存器上下文
1. 内核栈的分配,即thread_info的分配,是在do_fork->dup_task_struct中分配(默认为2个pages),并赋值给task_struct->stack: 2. ...

XGBoost、LightGBM参数讲解及实战

XGBoost、LightGBM参数讲解及实战的更多相关文章

随机推荐

热门专题