RankLib参数翻译
写在前面,metric2t指标详解:
NDCG(Normalized discounted cumulative gain)即DCG/IDCG
CG(cumulative gain)
DCG(Discounted Cumulative Gain)
MAP(Mean Average Precision)
MRR(Mean Reciprocal Rank)
Usage: java -jar RankLib.jar <Params>
Params:
[+] Training (+ tuning and evaluation)
-train <file> 训练数据
-ranker <type> 指定要使用的排名算法
0: MART (gradient boosted regression tree)
1: RankNet
2: RankBoost
3: AdaRank
4: Coordinate Ascent
6: LambdaMART
7: ListNet
8: Random Forests
[ -feature <file> ] 特征描述文件:列出要学习的特征,如果不指定,默认使用所有特征。
[ -metric2t <metric> ] Metric to optimize on the training data. Supported: MAP, NDCG@k, DCG@k, P@k, RR@k, ERR@k (default=ERR@10)
[ -gmax <label> ] Highest judged relevance label. It affects the calculation of ERR (default=4, i.e. 5-point scale {0,1,2,3,4})
[ -silent ] Do not print progress messages (which are printed by default)
[ -validate <file> ] 是否在验证数据集上调整模型 Specify if you want to tune your system on the validation data (default=unspecified). If specified, the final model will be the one that performs best on the validation data
[ -tvs <x \in [0..1]> ] 训练-验证数据集的分割比例 Set train-validation split to be (x)(1.0-x)
[ -save <model> ] 学习的模型保存到指定文件 Save the learned model to the specified file (default=not-save)
[ -test <file> ] 是否要在数据上测试训练的模型 Specify if you want to evaluate the trained model on this data (default=unspecified)
[ -tts <x \in [0..1]> ] 训练-测试数据集的分割比例 Set train-test split to be (x)(1.0-x). -tts will override -tvs
[ -metric2T <metric> ] 默认与metric2t一样 Metric to evaluate on the test data (default to the same as specified for -metric2t)
[ -norm <method>] 归一化特征向量,方法包括求和归一化,均值/标准差归一化,最大值/最小值归一化 Normalize feature vectors (default=no-normalization). Method can be:
sum: normalize each feature by the sum of all its values
zscore: normalize each feature by its mean/standard deviation
linear: normalize each feature by its min/max values
[ -kcv <k> ] 在训练数据集上执行交叉验证 Specify if you want to perform k-fold cross validation using ONLY the specified training data (default=NoCV)
-tvs can be used to further reserve a portion of the training data in each fold for validation
[ -kcvmd <dir> ] 交叉验证训练模型的目录 Directory for models trained via cross-validation (default=not-save)
[ -kcvmn <model> ] Name for model learned in each fold. It will be prefix-ed with the fold-number (default=empty)
[-] RankNet-specific parameters RankNet特定参数
[ -epoch <T> ] 训练迭代次数 The number of epochs to train (default=100)
[ -layer <layer> ] 隐含层个数 The number of hidden layers (default=1)
[ -node <node> ] 每层隐含节点个数 The number of hidden nodes per layer (default=10)
[ -lr <rate> ] 学习率 Learning rate (default=0.00005)
[-] RankBoost-specific parameters RankBoost特定参数
[ -round <T> ] 训练迭代次数 The number of rounds to train (default=300)
[ -tc <k> ] 搜索的阈值候选个数 Number of threshold candidates to search. -1 to use all feature values (default=10)
[-] AdaRank-specific parameters AdaRank特定参数
[ -round <T> ] 训练迭代次数 The number of rounds to train (default=500)
[ -noeq ] Train without enqueuing too-strong features (default=unspecified)
[ -tolerance <t> ] 连续两轮学习之间的误差 Tolerance between two consecutive rounds of learning (default=0.002)
[ -max <times> ] 一个特征可以被连续选择而不改变性能的最大次数 The maximum number of times can a feature be consecutively selected without changing performance (default=5)
[-] Coordinate Ascent-specific parameters
[ -r <k> ] The number of random restarts (default=5)
[ -i <iteration> ] The number of iterations to search in each dimension (default=25)
[ -tolerance <t> ] Performance tolerance between two solutions (default=0.001)
[ -reg <slack> ] Regularization parameter (default=no-regularization)
[-] {MART, LambdaMART}-specific parameters LanbdaMART特定参数
[ -tree <t> ] 树的个数 Number of trees (default=1000)
[ -leaf <l> ] 每个树的叶子个数 Number of leaves for each tree (default=10)
[ -shrinkage <factor> ] 学习率 Shrinkage, or learning rate (default=0.1)
[ -tc <k> ] 树分割时的候选特征个数 Number of threshold candidates for tree spliting. -1 to use all feature values (default=256)
[ -mls <n> ] 一个叶子最少的样本个数 Min leaf support -- minimum #samples each leaf has to contain (default=1)
[ -estop <e> ] Stop early when no improvement is observed on validaton data in e consecutive rounds (default=100)
[-] Random Forests-specific parameters 随机森林特定参数
[ -bag <r> ] Number of bags (default=300)
[ -srate <r> ] Sub-sampling rate (default=1.0)子集采样率
[ -frate <r> ] Feature sampling rate (default=0.3) 特征采样率
[ -rtype <type> ] Ranker to bag (default=0, i.e. MART)
[ -tree <t> ] Number of trees in each bag (default=1) 树个数
[ -leaf <l> ] Number of leaves for each tree (default=100) 每个树的叶节点个数
[ -shrinkage <factor> ] Shrinkage, or learning rate (default=0.1) 学习率
[ -tc <k> ] 树分割时使用的候选特征阈值个数 Number of threshold candidates for tree spliting. -1 to use all feature values (default=256)
[ -mls <n> ] Min leaf support -- minimum #samples each leaf has to contain (default=1)
[ -estop <e> ] Stop early when no improvement is observed on validaton data in e consecutive rounds (default=100)
[+] Testing previously saved models 测试已经保存的模型
-load <model> 加载模型 The model to load
-test <file> 测试数据Test data to evaluate the model (specify either this or -rank but not both)
-rank <file> 对制定文件中的样本排序,与-test不能同时指定 Rank the samples in the specified file (specify either this or -test but not both)
[ -metric2T <metric> ] Metric to evaluate on the test data (default=ERR@10)
[ -gmax <label> ] Highest judged relevance label. It affects the calculation of ERR (default=4, i.e. 5-point scale {0,1,2,3,4})
[ -score <file> ] Store ranker's score for each object being ranked (has to be used with -rank)
[ -idv ] 打印单个排名列表上的性能(必须与-test一起使用) Print model performance (in test metric) on individual ranked lists (has to be used with -test)
[ -norm ] 特征归一化 Normalize feature vectors (similar to -norm for training/tuning)
RankLib参数翻译的更多相关文章
- JVM 参数翻译汉化解释
博客搬家,新地址:http://www.zicheng.net/article/38.htm Behavioral Options(行为参数) Option and Default Value Des ...
- hbase-default.xml(Hbase 默认参数翻译)
hbase.tmp.dir \({java.io.tmpdir}/hbase-\){user.name} 本地文件系统上的临时目录.将'/tmp'改为其他可以持久保存文件的位置,通常能够解决java. ...
- 以太坊客户端Geth命令用法-参数详解
Geth在以太坊智能合约开发中最常用的工具(必备开发工具),一个多用途的命令行工具. 熟悉Geth可以让我们有更好的效率,大家可收藏起来作为Geth命令用法手册. 本文主要是对geth help的翻译 ...
- 以太坊客户端Geth命令用法-参数详解【转载】
原文链接:http://www.cnblogs.com/tinyxiong/p/7918706.html Geth在以太坊智能合约开发中最常用的工具(必备开发工具),一个多用途的命令行工具.熟悉Get ...
- Spark配置参数的三种方式
1.Spark 属性Spark应用程序的运行是通过外部参数来控制的,参数的设置正确与否,好与坏会直接影响应用程序的性能,也就影响我们整个集群的性能.参数控制有以下方式:(1)直接设置在SparkCon ...
- nginx 常见参数以及重定向参数配置
nginx 各参数翻译,作用 $arg_PARAMETER #这个变量包含GET请求中,如果有变量PARAMETER时的值. $args #这个变量等于请求行中(GET请求)的参数,例如foo=123 ...
- PHP的CURL方法curl_setopt()函数案例介绍(抓取网页,POST数据)
通过curl_setopt()函数可以方便快捷的抓取网页(采集很方便),curl_setopt 是php的一个扩展库 使用条件:需要在php.ini 中配置开启.(PHP 4 >= 4.0.2) ...
- nginx常用命令
ps -ef | grep nginx在进程列表里面找master进程,它的编号就是主进程号了. 步骤2:发送信号 从容停止Nginx: kill -QUIT 主进程号 快速停止Nginx: kill ...
- Linux磁盘与文件系统概念理解
磁盘级别概念 这里讲的主要是网上所谓的老式磁盘,它是由一个个盘片组成的,我们先从个盘片结构讲起.如图1所示,图中的一圈圈灰色同心圆为一条条磁道,从圆心向外画直线,可以将磁道划分为若干个弧段,每 ...
随机推荐
- 行内js函数调用
<ul> <li onclick=abc(this);><a href="javascript:void(0);">12234588</a ...
- centos7装机和初步运维
1.装机-制作U盘启动盘 CentOS7是一个比较新的版本.在服务器领域用得比较多.因为前安装软件可能没有Ubuntu那样方便,所以桌面领域好像不是很多. https://www.centos.org ...
- unity调用摄像头的方法
http://blog.csdn.net/cocoa_china/article/details/10527995 using UnityEngine; using System.Collection ...
- json和jsonp(json是目的,jsonp是手段)
自己理解:JSON是一种数据交换格式,而JSONP是一种依靠开发人员的聪明才智创造出的一种非官方跨域数据交互协议.我们拿最近比较火的谍战片来打个比方,JSON是地下党们用来书写和交换情报的" ...
- Ubuntu Server 配置网络
------------------ Ubuntu 14.04 x86_64 ----------------- 设置静态IP:vi /etc/network/interfaces. 然后再编辑 ...
- 即时聊天IM之四 Android客户端IM帮助类编写
图文无关一起娱乐: 这一篇我们开始写Android端的Smack版主类,后面Android的IM功能都是通过这个帮助类实现的 引用类库: 因为我用的是IDE是Android Studio,所以我通过g ...
- android webview远程调试
H5的调试的方式一般用chrome的emulator就好,可是遇到APP就拙计了.这时候还得用远程调试,远程调试很给力,不过目前网上还没有好的文章讲解,要好好的把其配置下来还是非常有难度的,今天折腾了 ...
- 优化Google字体 全面加速WordPress
从5月27号起,由于某些原因,Google服务在大陆的崩溃影响了数百万的站长,因为很多wordpress主题都在使用Google的在线字体方案-google fonts包括新版的WordPress 后 ...
- Oracle中DBLink的使用
DBLink 的作用是在局域网内,通过一台服务器上面的数据库访问另外一台服务器上面数据库的功能. 下面简单的介绍DBLink的配置: 服务器A:IP 10.10.10.107, 数据库实例名:orcl ...
- Angularjs Controller间通信的几种方法
先说最简单的,适合简单数据 一.使用controller as <body ng-controller="ParentCtrl as parent"> <inpu ...