1.L1和l2损失是什么意思?

相较于MSE,MAE有个优点,那就是MAE对离群值不那么敏感,可以更好地拟合线性,因为MAE计算的是误差y−f(x)的绝对值,对于任意大小的差值,其惩罚都是固定的。

2.参数:

核心参数:

1.objective:

回归应用:用法都是:objective=type

type:

常见的有:

L2(MSE) \L1(MAE)\MAP

二分类应用:

多分类应用:

交叉熵应用:

排序应用:

2.boosting

默认使用gbdt,梯度下降决策树

3.data:

指的是训练数据

4.valid:

指的是验证集(测试集)的路径或文件,支持多个验证集

5.num_iterations:

迭代次数(增益次数)

6.learning_rate:

必须大于零的收缩率,双精度小数

7.num_leaves:

大于1,一颗树中的叶子的最大个数

8.tree _learner:

学习器是平行的还是单机学习,是数据平行还是特征平行

9.num_threads

线程数目

10.device_type

建立GPU支持后可以用GPU跑

11.seed

一般都是用random_state,可以时间点。实现每次运行程序划分的训练集和测试集都是同一个

使用控制参数:

1. force_col_wise:

特征非常多,线程数目特别多才会推荐使用

2.histogram_pool_size:

设置直方图的最大缓存数,<0代表没有限制

3.max_depth:

设置最大深度防止过拟合,<=0代表没有限制

4.min_data_in_leaf:

设置一个叶子的最小数据量

5.bagging_fraction:

小部分装袋:防止过拟合和加快训练

6.pos_bagging_fraction

用于二分类问题

7.neg_bagging_fraction

(0,1] 只能用于二分类

8.bagging_freq

每k 此迭代执行一次bagging 随机选择bagging_fraction*100%的数据用于下一次迭代

9.bagging_seed

用于固定打包时间

10.feature_fraction

在训练每棵树前 随机选择feature_fraction*100%的特征,值大小为(0,1]

11.feature_fraction_bynode

在每棵树节点随机选择一个特征子集

12.feature_fraction_seed

用于固定每次的抽取的部分特征

13.extra_trees

使用极度随机的树

14.extra_seed

固定extra_trees的时间

15.early_stopping_round

如果在到达设置的提前停止轮内,验证集的某个评价指标没有提高,训练就会停止.,否则继续训练

16.first_metric_only

17.max_delta_step:

用于限制最大叶子输出

18.

lambda_l1:L1正则项

lambda_l2:L2正则项

19.linear_lambda:

适用于线性回归树

20.min_gain_to_split:

执行分割的最小增益,可用于加速训练

21.drop_rate:  

[0,1]

只适用于dart模式下的 丢弃先前的树

22.max_drop

在一次增益迭代中丢弃的最大数目,适用于dart模式

23.skip_drop

取值[0,1],

设置在dart模式下跳过dropout的概率

24.xgboost_dart_mode

设置是否采用xgboost里的dart模块

25.uniform_drop

随机均衡丢弃

26.

drop_seed:

确定选择丢弃模型的时间

goss模型:

27.

top_rate

  

大梯度数据的保存概率

28.

other_rate:

小梯度数据的保存概率

29.

min_data_per_group

每种类别组的最小数据量的数据

30.max_cat_threshold

为类别特征设置限制分割点数量

类别型特征
类别型特征(Categorical Feature)主要是指只在有限选项内取值的特征。例如性别(男、女)、成绩等级(A、B、C)等。通常以字符串形式输入,除了决策树等少数模型能直接处理字符串形式的输入,逻辑回归、支持向量机等模型的输入必须是数值型特征才能正确工作。

31.cat-l2

类别分割中的正则项

32.cat_smooth

可以降低类别特征中的噪声,尤其是小样本。

33.max_cat_to_onehot

34.top_k

仅仅适用于 voting tree learner

35.monotone_constraints

单调特征

36.monotone_constraints_method

37.monotone_penalty:单调惩罚

38.verbosity

一般就是默认选1,显示信息

39.max_bin

将被分桶的特征值的最大分桶数量

40 max_bin_by_feature:

每个特征的最大分箱数量

41.min_data_in_bin

避免一箱一数据,防止过拟合

42.bin_construct_sample_cnt

被采样用于创建特征离散箱的数据数量

loading data directly from text file

直接从testfile中载入数据

43.label_column:

  用于指定标签列

44.weight_column:

用于指定权重列

45.group_column:

46.ignore_column

47.catagorical_feature

规定一些列是类别特征

Predict Parameters3

48.start_iteration_predict:

49.num_iteration_predict

50.predict_raw_score:

布尔型,=True是只预测初始得分

51 .predict_leaf_index:

52.pred_early_stop:

仅使用于分类和排序应用

==true会使用early-stopping来加速预测,可能会影响精度

53.pred_early_stop_margin:

在预测中边界的阈值

54.

  

lgb文档学习的更多相关文章

  1. EasyUI文档学习心得

    概述 jQuery EasyUI 是一组基于jQuery 的UI 插件集合,它可以让开发者在几乎完全不需要CSS以及复杂的JS代码情况下完成美观且功能强大的Web界面. 本文主要说明一些如何利用Eas ...

  2. Spring文档学习

    Spring文档学习 参考Spring Framework Documentation学习 1. IoC 容器 1.1 容器实例化 <beans> <import resource= ...

  3. Cassandra1.2文档学习解读计划——为自己鼓劲

    最近想深入研究一下Cassandra,而Cassandra没有中文文档,仅有的一些参考书都是0.7/0.6版本的.因此有个计划,一边学习文档(地址:http://www.datastax.com/do ...

  4. 《MATLAB从入门到放弃》二维曲线和图形绘制基础(二):使用Help文档学习line、plot、plotyy、subplot、hold绘图函数

    目录: »  plot 最常用的二维曲线绘图函数 >  帮助文档 >  基本使用语法 >  线条的样式.符号和颜色调整 >  图形属性调整 >  使用图形句柄进行设置 » ...

  5. 这可能是最详细的 iOS 学习入门指南(含书目/文档/学习资料)

    1 零基础小白如何进行 iOS 系统学习 首先,学习目标要明确: 其次,有了目标,要培养兴趣,经常给自己一些正面的反馈,比如对自己的进步进行鼓励,在前期小步快走: 再次,学技术最重要的一点就是多动手. ...

  6. 通过程序校验xml文档学习笔记

    校验xml文档,可以通过程序来校验,利用一段js代码即可. 各行代码的含义已经写出,运行这个html文件,检验如下xml代码: 结果如下: 如果xml文档出现错误: 结果如下: 其中,obj.asyn ...

  7. Nodejs v4.x.0API文档学习(2)Assert断言测试模块

    文档参考地址:https://nodejs.org/dist/latest-v4.x/docs/api/ Assert(断言) assert模块提供了一组简单的断言测试方法,可以拥有测试不变量.该模块 ...

  8. Nodejs v4.x.0API文档学习(1)简介

    文档参考地址:https://nodejs.org/dist/latest-v4.x/docs/api/ 简介 下面是用nodejs编写的一个web服务的例子,返回"Hello World& ...

  9. linux 内存-文档学习

    ptmalloc http://www.malloc.de/en/ tcmalloc https://github.com/gperftools/gperftools jcmalloc http:// ...

  10. <文档学习>AirSim/using_car.md Choosing Your Vehicle: Car or Multirotor

    如何在AirSim中使用汽车 默认情况下,AirSim中使用的车型为多转子multirotor. 如果你想使用汽车,那么只需在你的settings.json(https://github.com/Mi ...

随机推荐

  1. tool script to convert back slash

    Back slash is used in windows, which makes so many headache for me. Then an idea came to my mind. It ...

  2. 阿里云IPSec的一些问题

    1.阿里云IPSec无法进行多段连接单个IPSec连接 解决方案  在阿里云端需要如下操作 1.单个VPN网关下创建多个IPSec连接  连接属性一致  使用兴趣流模式.打开nat转换.  2段对2段 ...

  3. django找不到template文件的解决办法

    照着视频抄写第一个django展示html的页面如下图所示,然后运行之后提示 template不存在的问题,这个坑怎么填啊? 原来是因为主应用的settings文件下边少配置了一个东西,如下图所示,在 ...

  4. grep 查找字符串 在文件或者文件夹中

    1, 命令行能做的事情很多, grep 'XXX' ./access.log 当前某个文件下下查找某个字符串grep 'xxx' ./ -r 当前目录文件夹下查找某个字符串

  5. 使用centos8.5配置一台YUM源服务器

    公司的生产环境部署的Centos8.5, 现在已经EOL了, 为了给生产和测试机继续提供yum/dnf服务, 特意在公司的内部机房部署了一套本地yum源. 环境:centos 8.5 1. 下载镜像 ...

  6. Worksheet使用方法

    1  下载印象笔记: iPhone/iPad在App Store搜索"印象笔记"后下载 安卓在应用市场或在印象笔记官网yinxiang.com下载,图标同上 电脑可至印象笔记官网y ...

  7. 多线程事务回滚sqlSession, spring-mybatis 开启事务

    @Resource SqlContext sqlContext; /** * 多线程事务. * @param employeeDOList */ @Override public void saveT ...

  8. python--线性回归

    首先先安装要用到的包:sklearn,顾名思义机器学习包 import matplotlib.pyplot as plt import numpy as np import pandas as pd ...

  9. CxImageJPG

    typedef struct tag_ExifInfo { char Version [5]; //EXIF 信息版本 char CameraMake [32]; //DC 制造商 char Came ...

  10. 城壁 (Rampart)

    题意简述 给定一张 $H \times W $ 的网格图,其中有 \(P\) 个被标记的点,求边长为 \(L\) 或以上的正方形的个数,要求正方形的边不得经过被标记的点. \(1 \le H,W \l ...