RankNet 论文的笔记:Learning to rank using gradient descent.

模型

  • 特征 \(\mathbf x_i \in \mathbb R^d\)
  • 模型函数:\(f: \mathbb R^d \to \mathbb R\)

若 \(f(\mathbf x_i) > f(\mathbf x_j)\) 则表示模型预测 i 排在 j 前面: \(\mathbf x_i \triangleright \mathbf x_j\)。

后验概率 $ P_{ij} = P(\mathbf x_i \triangleright \mathbf x_j)$ 用如下形式:
\[ P_{ij} = \frac{1}{1 + e^{-o_{ij}}} \\
o_{ij} \equiv o_i - o_j \\
o_i \equiv f(\mathbf x_i) \]

损失函数使用交叉熵的形式,并根据上面的定义变形为:
\[ C_{ij} \equiv C(o_{ij}) = -\bar P_{ij} \log P_{ij} - (1 - \bar P_{ij}) \log (1-P_{ij}) \\
= -\bar P_{ij} o_{ij} + \log (1 + e^{o_{ij}}) \]

其中根据样本中两个 item 排序的在前、在后和同序关系,目标取值为:
\[ \bar P_{ij} = \{1, 0.5, 0\} \]

关于假设合理性的讨论

论文中已经证明上述模型假设的一致性、传递性。由于 \(o_{ik} = o_i - o_j + (o_j-o_k) = o_{ij} + o_{jk}\),则容易得到:
\[ P_{ij} = \frac{P_{ij}P_{jk}}{1 + 2P_{ij}P_{jk}- P_{ij} - P_{jk}}\]

  • 自洽性
    上式满足 \(0 < P_{ij} < 1\).

  • 传递性:
    在概率等于 \(p\in \{0, 0,5, 1\}\) 的时候,等号具有传递性:
    \[ P(A \triangleright B) = p, \quad P(B \triangleright C) = p, \\
    \Rightarrow \quad P(A \triangleright C) = P \]

    \(P < 0.5\) 时,小于号传递性:
    \[ P(A \triangleright B) = p, \quad P(B \triangleright C) = p, \\
    \Rightarrow \quad P(A \triangleright C) < P \]

    $ 0.5 < P < 1 $ 时,大于号传递性:
    \[ P(A \triangleright B) = p, \quad P(B \triangleright C) = p, \\
    \Rightarrow \quad P(A \triangleright C) > P \]

    以上的传递不限于两步,经过多步仍然满足。

优模型化

\(o_i\) 的取值使用神经网络模型
[ o_i = g^3 \left( \sum_j w_j^{32} g^2 \left( \sum_k w^{21}_{jk} x_k + b^2_j \right) +b^3_i \right) \equiv g^3_i ]

其中 \(g^3, g^2, w^{32}, w^{21},b^2, b^3\) 分别为第三、第二层激活函数,第三、第二层的权重、第二、第三层偏置。

定义一个 pair 样本的损失为 $ l(o_2-o_1)$ (论文中用 \(f\) 表示,这里换成 \(l\)),则参数的梯度 \(\partial_\alpha l = (\partial_\alpha o_2 - \partial_\alpha o_1)l'\)。注意 \(\partial_\alpha o_2 = \partial_\alpha f(\mathbf x_2)\)

[ \frac{\partial l}{\partial b^3} = l'(g'^3(\mathbf x_2) - g'^3(\mathbf x_1)) \equiv \Delta^3_2 - \Delta^3_1\
\frac{\partial l}{\partial w^{32}i} = \Delta^3_2 g^2_i(\mathbf x_2) - \Delta^3_1 g^2_i(\mathbf x_1) \
\frac{\partial l}{\partial b^2_i} = \Delta^3_2 w^{32}i g'^2_i(\mathbf x_2) - \Delta^3_1 w^{32}i g'^2_i(\mathbf x_1) \equiv \Delta^2{2,i} - \Delta^2{1,i} \
\frac{\partial l}{\partial w^{21}
{ij}} = \Delta^2_{2,i} x_{2,j} - \Delta^2_{1,i} x_{1,j} \ ]

所有参数都可以根据上面的梯度,用梯度下降法来优化。

RankNet的更多相关文章

  1. [笔记]Learning to Rank算法介绍:RankNet,LambdaRank,LambdaMart

    之前的博客:http://www.cnblogs.com/bentuwuying/p/6681943.html中简单介绍了Learning to Rank的基本原理,也讲到了Learning to R ...

  2. 排序学习实践---ranknet方法

    要: 1 背景      随着移动互联网的崛起,越来越多的用户开始习惯于从手机完成吃.喝.玩.乐.衣.食.住.行等各个方面的需求.打开手机,点开手淘.美团等APP,商品玲玲满目,而让用户将所有商品一页 ...

  3. 从ranknet到lamdarank,再到lamdamart

    learn2rank目前基本两个分支,1是神经网络学派ranknet,lamdarank,另一个是决策树学派如gbrank,lamdamart 05年提出ranknet,算分模块是简单的全连接网络,l ...

  4. 机器学习排序算法:RankNet to LambdaRank to LambdaMART

    使用机器学习排序算法LambdaMART有一段时间了,但一直没有真正弄清楚算法中的所有细节. 学习过程中细读了两篇不错的博文,推荐给大家: 梯度提升树(GBDT)原理小结 徐博From RankNet ...

  5. Learning to Rank算法介绍:RankNet,LambdaRank,LambdaMart

    之前的博客:http://www.cnblogs.com/bentuwuying/p/6681943.html中简单介绍了Learning to Rank的基本原理,也讲到了Learning to R ...

  6. Learning to Rank之RankNet算法简介

    排序一直是信息检索的核心问题之一, Learning to Rank(简称LTR)用机器学习的思想来解决排序问题(关于Learning to Rank的简介请见我的博文Learning to Rank ...

  7. Pairwise ranking methods: RankNet与LambdaRank

    转自:http://blog.csdn.net/u014374284/article/details/49385065, 感谢分享! LamdaMart 介绍见博客http://blog.csdn.n ...

  8. 排序学习(learning to rank)中的ranknet pytorch简单实现

    一.理论部分 理论部分网上有许多,自己也简单的整理了一份,这几天会贴在这里,先把代码贴出,后续会优化一些写法,这里将训练数据写成dataset,dataloader样式. 排序学习所需的训练样本格式如 ...

  9. NLP&数据挖掘基础知识

    Basis(基础): SSE(Sum of Squared Error, 平方误差和) SAE(Sum of Absolute Error, 绝对误差和) SRE(Sum of Relative Er ...

随机推荐

  1. LeetCode——Find Minimum in Rotated Sorted Array II

    Question Follow up for "Find Minimum in Rotated Sorted Array": What if duplicates are allo ...

  2. Anaconda 环境中使用pip安装时候出现的一些问题

    author:pprp date:18/8/12 --- 1. AttributeError: Module Pip has no attribute 'main' solution:降低pip的版本 ...

  3. java 之 find 命令

    转自:https://blog.csdn.net/holyshit666/article/details/52296966 find命令是比较常用的命令,用来在特定目录下查找具有某种特征的文件. 一: ...

  4. ng-options 如何实现其中一项option禁选

    <select class="form-control" ng-model="functionPaymentMethod" ng-options=&quo ...

  5. JavaScript encodeURIComponent()

    ■ 把字符串作为 URI 组件进行编码.JavaScript中有三个可以对字符串编码的函数,分别是: escape,encodeURI,encodeURIComponent,相应3个解码函数:unes ...

  6. Hive 表结构操作

    添加列  add columns alter table table_name add columns (id int comment '主键ID' ) ; 默认在表所有字段之后,分区字段之前. 替换 ...

  7. 明确出需求 然后开会评审 要什么接口 接口参数、返回json内容、格式 协定好 在做

     明确出需求 然后开会评审 要什么接口 接口参数.返回json内容.格式 协定好 在做 

  8. 图片服务器(FastDFS)的搭建

    1.1 什么是FastDFS FastDFS是用c语言编写的一款开源的分布式文件系统.FastDFS为互联网量身定制,充分考虑了冗余备份.负载均衡.线性扩容等机制,并注重高可用.高性能等指标,使用Fa ...

  9. Bootstrap 可视化布局--拖拽后弹窗进行编辑

    Bootstrap 可视化布局--拖拽后弹窗进行编辑 最近后台想一个需求,使用可视化布局-中文 | en中拖拽表格后,弹窗进行编辑,保存下载后在后台生成pdf格式. 奈何各种问题不断,使用 jquer ...

  10. Arison [JS]window.location获取url各项参数详解

    https://www.cnblogs.com/Arison/p/5286368.html 对于这样一个URL代码如下 复制代码 http://www.php230.com :80/fisker/po ...