RankNet

RankNet 论文的笔记：Learning to rank using gradient descent.

模型

特征 $\mathbf x_i \in \mathbb R^d$
模型函数：$f: \mathbb R^d \to \mathbb R$

若 $f(\mathbf x_i) > f(\mathbf x_j)$ 则表示模型预测 i 排在 j 前面: $\mathbf x_i \triangleright \mathbf x_j$。

后验概率 $ P_{ij} = P(\mathbf x_i \triangleright \mathbf x_j)$ 用如下形式：
\[ P_{ij} = \frac{1}{1 + e^{-o_{ij}}} \\
o_{ij} \equiv o_i - o_j \\
o_i \equiv f(\mathbf x_i) \]

损失函数使用交叉熵的形式，并根据上面的定义变形为：
\[ C_{ij} \equiv C(o_{ij}) = -\bar P_{ij} \log P_{ij} - (1 - \bar P_{ij}) \log (1-P_{ij}) \\
= -\bar P_{ij} o_{ij} + \log (1 + e^{o_{ij}}) \]

其中根据样本中两个 item 排序的在前、在后和同序关系，目标取值为：
\[ \bar P_{ij} = \{1, 0.5, 0\} \]

关于假设合理性的讨论

论文中已经证明上述模型假设的一致性、传递性。由于 $o_{ik} = o_i - o_j + (o_j-o_k) = o_{ij} + o_{jk}$，则容易得到：
\[ P_{ij} = \frac{P_{ij}P_{jk}}{1 + 2P_{ij}P_{jk}- P_{ij} - P_{jk}}\]

自洽性
上式满足 $0 < P_{ij} < 1$.
传递性：
在概率等于 $p\in \{0, 0,5, 1\}$ 的时候，等号具有传递性：
\[ P(A \triangleright B) = p, \quad P(B \triangleright C) = p, \\
\Rightarrow \quad P(A \triangleright C) = P \]

$P < 0.5$ 时，小于号传递性：
\[ P(A \triangleright B) = p, \quad P(B \triangleright C) = p, \\
\Rightarrow \quad P(A \triangleright C) < P \]

$ 0.5 < P < 1 $ 时，大于号传递性：
\[ P(A \triangleright B) = p, \quad P(B \triangleright C) = p, \\
\Rightarrow \quad P(A \triangleright C) > P \]

以上的传递不限于两步，经过多步仍然满足。

优模型化

$o_i$ 的取值使用神经网络模型
[ o_i = g^3 \left( \sum_j w_j^{32} g^2 \left( \sum_k w^{21}_{jk} x_k + b^2_j \right) +b^3_i \right) \equiv g^3_i ]

其中 $g^3, g^2, w^{32}, w^{21},b^2, b^3$ 分别为第三、第二层激活函数，第三、第二层的权重、第二、第三层偏置。

定义一个 pair 样本的损失为 $ l(o_2-o_1)$ (论文中用 $f$ 表示，这里换成 $l$)，则参数的梯度 $\partial_\alpha l = (\partial_\alpha o_2 - \partial_\alpha o_1)l'$。注意 $\partial_\alpha o_2 = \partial_\alpha f(\mathbf x_2)$

[ \frac{\partial l}{\partial b^3} = l'(g'^3(\mathbf x_2) - g'^3(\mathbf x_1)) \equiv \Delta^3_2 - \Delta^3_1\
\frac{\partial l}{\partial w^{32}i} = \Delta^3_2 g^2_i(\mathbf x_2) - \Delta^3_1 g^2_i(\mathbf x_1) \
\frac{\partial l}{\partial b^2_i} = \Delta^3_2 w^{32}i g'^2_i(\mathbf x_2) - \Delta^3_1 w^{32}i g'^2_i(\mathbf x_1) \equiv \Delta^2{2,i} - \Delta^2{1,i} \
\frac{\partial l}{\partial w^{21}{ij}} = \Delta^2_{2,i} x_{2,j} - \Delta^2_{1,i} x_{1,j} \ ]

所有参数都可以根据上面的梯度，用梯度下降法来优化。

RankNet的更多相关文章

[笔记]Learning to Rank算法介绍：RankNet，LambdaRank，LambdaMart
之前的博客:http://www.cnblogs.com/bentuwuying/p/6681943.html中简单介绍了Learning to Rank的基本原理,也讲到了Learning to R ...
排序学习实践---ranknet方法
要: 1 背景随着移动互联网的崛起,越来越多的用户开始习惯于从手机完成吃.喝.玩.乐.衣.食.住.行等各个方面的需求.打开手机,点开手淘.美团等APP,商品玲玲满目,而让用户将所有商品一页 ...
从ranknet到lamdarank，再到lamdamart
learn2rank目前基本两个分支,1是神经网络学派ranknet,lamdarank,另一个是决策树学派如gbrank,lamdamart 05年提出ranknet,算分模块是简单的全连接网络,l ...
机器学习排序算法：RankNet to LambdaRank to LambdaMART
使用机器学习排序算法LambdaMART有一段时间了,但一直没有真正弄清楚算法中的所有细节. 学习过程中细读了两篇不错的博文,推荐给大家: 梯度提升树(GBDT)原理小结徐博From RankNet ...
Learning to Rank算法介绍：RankNet，LambdaRank，LambdaMart
之前的博客:http://www.cnblogs.com/bentuwuying/p/6681943.html中简单介绍了Learning to Rank的基本原理,也讲到了Learning to R ...
Learning to Rank之RankNet算法简介
排序一直是信息检索的核心问题之一, Learning to Rank(简称LTR)用机器学习的思想来解决排序问题(关于Learning to Rank的简介请见我的博文Learning to Rank ...
Pairwise ranking methods: RankNet与LambdaRank
转自:http://blog.csdn.net/u014374284/article/details/49385065, 感谢分享! LamdaMart 介绍见博客http://blog.csdn.n ...
排序学习(learning to rank)中的ranknet pytorch简单实现
一.理论部分理论部分网上有许多,自己也简单的整理了一份,这几天会贴在这里,先把代码贴出,后续会优化一些写法,这里将训练数据写成dataset,dataloader样式. 排序学习所需的训练样本格式如 ...
NLP&数据挖掘基础知识
Basis(基础): SSE(Sum of Squared Error, 平方误差和) SAE(Sum of Absolute Error, 绝对误差和) SRE(Sum of Relative Er ...

随机推荐

mp4格式的视频，编码方式mpeg4，转化为h264
知识点:在使用vcastr3.swf播放器播放flv视频,(同时在html5页面,使用<video>标签时),发现某些MP4格式的代码不能播放原因:vcastr3.swf和video,不 ...
gulp构建例子(ubuntu)
1.项目结构和生产之后的目录 2.gulpfile.js // 载入插件 var gulp = require('gulp'), //本地安装gulp所用到的地 sass = require('gul ...
JavaScript对象、JSON对象、JSON字符串的区别
一.首先看下什么是JSON JSON:JavaScript Object Natation,JavaScript对象的表现形式,已经发展成一种轻量级的数据交换格式. JavaScript对象的表现形式 ...
WinCE数据通讯之SqlCE数据同步篇
上一篇总结了WinCE通过WebService进行数据通讯的交互方式,今天整理个SqlCE数据同步方式的内容.先说下软件环境:终端平台使用WinCE5.0+SqlCE2.0,服务器使用Windows ...
Linux 安装rabbitmq 遇到的一些问题
Linux下防火墙开启相关端口及查看已开启端口 https://www.cnblogs.com/pizitai/p/6518987.htmlhttps://www.cnblogs.com/blog-y ...
css 固定宽度，自动换行
max-width: 200px; display: block; word-break: break-all:
js打乱数组的实战应用
文章首发于: https://www.xiabingbao.com/post/javascript/js-random-array.html 在js中,能把数组随机打乱的方法有很多,每个方法都有自己的 ...
Template、ItemsPanel、ItemContainerStyle、ItemTemplate （部分内容有待验证）
以下摘自“CSDN”的某人博客,部分内容有待验证,需注意“辨别学之....” 1.Template是指控件的样式在WPF中所有继承自contentcontrol类的控件都含有此属性,(继承自Fram ...
ASP.NET Core and .NET Core Library Support
ASP.NET Core and .NET Core Library Support 详情参见:https://github.com/linezero/NETCoreLibrary/blob/mast ...
vim 的寄存器
If you've been following my series on Vim, it should be clear now that Vim has a pretty clear philos ...

RankNet

模型

关于假设合理性的讨论

优模型化

RankNet的更多相关文章

随机推荐

热门专题