从ranknet到lamdarank，再到lamdamart

learn2rank目前基本两个分支，1是神经网络学派ranknet，lamdarank，另一个是决策树学派如gbrank,lamdamart

05年提出ranknet，算分模块是简单的全连接网络，loss函数是预测概率之家的pair-wise关系和真实lablel的pair-wise关系的逻辑回归。

预测概率的pair-wise关系是两个相减然后求个sigmoid，如下图：

真实概率如下）（S_ij表示，i 比 j 相关，S_ij是1，反之是 -1，如果label一样是0）：

最后的loss是

然后可以化简为：

具体推倒过程见：

下面展示了当Sij分别取1，0，-1的时候cost function以si-sj为变量的示意图：

当两个相关性不同的文档算出来的模型分数相同时，损失函数的值大于0，仍会对这对pair做惩罚，使他们的排序位置区分开。

lamdarank想要解决的一个问题是，目前loss只会优化pair之间的关系，但是rank的目的是希望把最好好的结果往上promote，pair-wise没有考虑到这一点，使得最好的结果在中间位置也会loss非常小：

如：

每个线条表示文档，蓝色表示相关文档，灰色表示不相关文档，RankNet以pairwise error的方式计算cost，左图的cost为13，右图通过把第一个相关文档下调3个位置，第二个文档上条5个位置，将cost降为11，但是像NDCG或者ERR等评价指标只关注top k个结果的排序，在优化过程中下调前面相关文档的位置不是我们想要得到的结果。图 1右图左边黑色的箭头表示RankNet下一轮的调序方向和强度，但我们真正需要的是右边红色箭头代表的方向和强度，即更关注靠前位置的相关文档的排序位置的提升。LambdaRank正是基于这个思想演化而来，其中Lambda指的就是红色箭头，代表下一次迭代优化的方向和强度，也就是梯度。

于是lamdarank在每个pair-wise loss乘以了一个ndcg的变化值，作为最终的loss

我的理解：如果是 i,j是预测对了，由于log项非常小，所以整体loss小，但是如果预测错了，会根据ndcg的差对loss加权，一般label比较大的权重也大

最后说说lamdamart，由于神经网络系列的模型都是可以直接求梯度的，Loss对模型也可以求梯度，所以很直接的用梯度下降就可以求解。

但是树模型由于无法直接求导，导致无法直接走梯度下降那一套进行求导。需要考虑另一种方法。

我们直接loss对模型可以直接求导的，那么我们就用model(i) = model(i-1) - Loss(梯度)。来求解最终的model就行了。由于树是ensemble的方式，实际使用的过程是model(i) = model(i-1)- (-loss(梯度))，即优化的时候，是减去loss的负梯度。

所以关键是每次迭代的时候是拟合 loss的负梯度，loss对于模型的负梯度是可以求出的(Loss = loss_function(model)，loss_function是可以求梯度的)，剩下来的就是模型来拟合这个梯度。这个梯度可以代表的是每个样本在一个函数的值，只是现在函数不是线性的，用树来拟合这些个值的话，其实就是树来求解一个回归问题，它也只能求解一个回归问题。不知道给你绕晕了没有，详细参考libo的文章吧

基本步骤就是，根据loss去求解当前的梯度值，然后用树模型来拟合梯度，加这个树后，重新进行迭代。

树拟合的过程就是分裂的过程，不多说，参考gbdt基本原理，就是每次分裂的时候使用左叶子节点值的和除以左叶子节点数目，加上右叶子节点值的和除以右叶子节点数目。看哪个特征分裂后这个值大就用这个特征进行分裂。分裂终止的条件就是根据你的设置叶子节点数目，或者分裂到叶子节点的样本数目少于多少等等。lightgbm分裂是所有叶子节点一起比较，选择一个最优的叶子节点进行分裂。xgboost是所有叶子节点都分类，是一个完全二叉树

从ranknet到lamdarank，再到lamdamart的更多相关文章

[笔记]Learning to Rank算法介绍：RankNet，LambdaRank，LambdaMart
之前的博客:http://www.cnblogs.com/bentuwuying/p/6681943.html中简单介绍了Learning to Rank的基本原理,也讲到了Learning to R ...
Learning to Rank算法介绍：RankNet，LambdaRank，LambdaMart
之前的博客:http://www.cnblogs.com/bentuwuying/p/6681943.html中简单介绍了Learning to Rank的基本原理,也讲到了Learning to R ...
Pairwise ranking methods: RankNet与LambdaRank
转自:http://blog.csdn.net/u014374284/article/details/49385065, 感谢分享! LamdaMart 介绍见博客http://blog.csdn.n ...
排序学习(learning to rank)中的ranknet pytorch简单实现
一.理论部分理论部分网上有许多,自己也简单的整理了一份,这几天会贴在这里,先把代码贴出,后续会优化一些写法,这里将训练数据写成dataset,dataloader样式. 排序学习所需的训练样本格式如 ...
恢复SQL Server被误删除的数据（再扩展）
恢复SQL Server被误删除的数据(再扩展) 大家对本人之前的文章<恢复SQL Server被误删除的数据> 反应非常热烈,但是文章里的存储过程不能实现对备份出来的日志备份里所删数据的 ...
再谈CAAnimation动画
CAAnimaton动画分为CABasicAnimation & CAKeyframeAnimation CABasicAnimation动画, 顾名思义就是最基本的动画, 老规矩先上代码: ...
再部署一个 instance 和 Local Network - 每天5分钟玩转 OpenStack（131）
上一节部署了 cirros-vm1 到 first_local_net,今天我们将再部署 cirros-vm2 到同一网络,并创建 second_local_net. 连接第二个 instance 到 ...
iOS开发之再探多线程编程：Grand Central Dispatch详解
Swift3.0相关代码已在github上更新.之前关于iOS开发多线程的内容发布过一篇博客,其中介绍了NSThread.操作队列以及GCD,介绍的不够深入.今天就以GCD为主题来全面的总结一下GCD ...
你还可以再诡异点吗——SQL日志文件不断增长
前言今天算是遇到了一个罕见的案例. SQL日志文件不断增长的各种实例不用多说,园子里有很多牛人有过介绍,如果我再阐述这些陈谷子芝麻,想必已会被无数次吐槽. 但这次我碰到的问题确实比较诡异,其解决方式 ...

随机推荐

loadrunner12中JavaVuser脚本的编写
1.环境准备: 友情提示:用本地环境,不要用虚拟机 LoadRunner11----->对应JDK1.6版本(32位) LoadRunner12----->对应JDK1 ...
TypeError: '_io.TextIOWrapper' object does not support item assignment
纯小白遇到的细节问题: 报错一开始看到这个傻逼了 TypeError: '_io.TextIOWrapper' object does not support item assignment 其实 ...
Winfon 页签切换及窗体控件自适应
由于公司的业务调整,最近不仅开发bs,还有不熟悉的cs,人手也不足,项目还多,对于cs来说,算是小白,虽然是一个人,也是硬着头皮写,拖拽控件,自定义控件.一个项目下来,对cs有了很深的认识,这里好好感 ...
linux软AP－－hostapd+dhcpd
linux软AP--hostapd+dhcpd 2018年05月08日 ⁄ 综合 ⁄ 共 4908字 ⁄ 字号小中大 ⁄ 评论关闭随着手机.笔记本等无线设备的增多,公司里的家用三个无线路由器已 ...
python小知识点随笔
可能会有不局限于Python语言的内容,文中“>>>”表示结果,而不是命令行交互的提示符 1.关于字符串编码 ASCII编码占用一个字节二进制11111111=十进制255 所以 ...
redis 在 php 中的应用（Hash篇）
本文为我阅读了 redis参考手册之后结合博友的博客编写,注意 php_redis 和 redis-cli 的区别(主要是返回值类型和参数用法) Redis hash 是一个string类型的f ...
java之过滤器
form.jsp <%@ page language="java" contentType="text/html; charset=UTF-8" page ...
Java基础总结3
计算只做加法计算减法也是加法计算出来的: 1,顺序结构: 按照编写代码的顺序从上而下逐行翻译执行: 特点:每行代码都能被执行到且被执行一次: 2,选择结构看条件: 条件为true(成立)执行代码块: ...
php伪造ip头
<? $fp = fsockopen ("passport.baidu.com", 80, $errno, $errstr, 30); if (!$fp) { echo &q ...
UI自动化（十三）appium操作
定位: # id resource-id可能出现重复如果appium-desktop提示了id 定位方式说明id唯一driver.find_element_by_id('com.tencent.m ...

从ranknet到lamdarank，再到lamdamart

从ranknet到lamdarank，再到lamdamart的更多相关文章

随机推荐

热门专题