Deep Learning 论文解读——Session-based Recommendations with Recurrent Neural Networks

daniel-D 2024-09-02 05:10:10 原文

博客地址：http://www.cnblogs.com/daniel-D/p/5602254.html

新浪微博：http://weibo.com/u/2786597434

欢迎多多交流~

这篇论文的工作是讲 RNN 应用到推荐系统中，想法在于把一个 session 点击一系列 item 的行为看做一个序列，用来训练一个 RNN 模型。在预测阶段，把 session 已知的点击序列作为输入，用 softmax 预测该session下一个最有可能点击的item。论文想法虽然很朴素很直白，但是目前这类直接用deep learning的结构来做推荐的论文非常少（RBM除外），因此值得仔细研读。

Architecture

论文采用了 RNN 中的 GRU 单元作为基本结构，组建了一个深层的神经网络来预测该session下一个点击的item 的概率。比如item拥有 2w 个，那么通过 1-of-N coding 的方式（one hot encoding），神经网络的第一层就有2w个节点，然后通过第二层embedding层压缩为低维连续向量（假设200维），当然最开始这些向量都是随机初始化的。embedding这一层实际上是一个 2w * 200的矩阵字典，每一行 200 维的向量就是一个item的presentation。这200维向量可作为 stacked GRU 的输入，得到低维连续的输出（200维），然后通过与一个 200 * 2w 的矩阵相乘，得到了下一个点击的item在 2w 个节点中的预测概率，整体而言，这是一个 sequence to sequence 的预测问题。

为了更好的并行计算，论文采用了mini-batch的处理，即把不同的session拼接起来，同一个sequence遇到下一个Session时，要注意将 GRU 中的一些向量重新初始化。因为item的维度非常高，每次要预测 2w 个item 的概率会导致计算量庞大，因此原则上只选取当前的正样本（即下一个点击的item）加上随机抽取的负样本。论文采用了取巧的方法来减少采样需要的计算量，即选取了同一个 mini-batch 中其他sequence下一个点击的item作为负样本，用这些正负样本来训练整个神经网络。

Loss Function

作者尝试了常见的 point-wise rank loss，即认为负样本为 0，正样本为 1 的loss function，发现训练出来的模型并不稳定，原因可能因为在推荐里面，并不存在绝对的正样本和负样本。在同一个情景里面，用户只能点击一个最偏好的item，对其他item可能也存在偏好，这并不是一个非黑即白的classification问题。然后作者尝试了 pair-wise rank loss，并且对于负样本的分数进行了近0约束，防止训练过程中分数相互“攀比”的情形下所有的预测分数都越来越高。实际上，我认为这种约束方法近似于对权重进行了 L2 约束。

Results

论文在 recSys2015 竞赛的数据集上进行了点击item的预测评比，对比的方法有 pop 、s-pop 、item-knn以及 BPR-MF，评测标准有 MRR@20 和 Recall@20，貌似都取得了不错的效果。

Deep Learning 论文解读——Session-based Recommendations with Recurrent Neural Networks的更多相关文章

论文解读 - Composition Based Multi Relational Graph Convolutional Networks
1 简介随着图卷积神经网络在近年来的不断发展,其对于图结构数据的建模能力愈发强大.然而现阶段的工作大多针对简单无向图或者异质图的表示学习,对图中边存在方向和类型的特殊图----多关系图(Multi- ...
Deep Learning 16：用自编码器对数据进行降维_读论文“Reducing the Dimensionality of Data with Neural Networks”的笔记
前言论文“Reducing the Dimensionality of Data with Neural Networks”是深度学习鼻祖hinton于2006年发表于<SCIENCE > ...
Deep Learning论文笔记之（四）CNN卷积神经网络推导和实现（转）
Deep Learning论文笔记之(四)CNN卷积神经网络推导和实现 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文, ...
Deep Learning论文笔记之（八）Deep Learning最新综述
Deep Learning论文笔记之(八)Deep Learning最新综述 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文,但老感觉看完 ...
Deep Learning论文笔记之（六）Multi-Stage多级架构分析
Deep Learning论文笔记之(六)Multi-Stage多级架构分析 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些 ...
Deep Learning论文笔记之（一）K-means特征学习
Deep Learning论文笔记之(一)K-means特征学习 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文,但老感 ...
Deep Learning论文笔记之（三）单层非监督学习网络分析
Deep Learning论文笔记之(三)单层非监督学习网络分析 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文,但老感 ...
Spectral Norm Regularization for Improving the Generalizability of Deep Learning论文笔记
Spectral Norm Regularization for Improving the Generalizability of Deep Learning论文笔记 2018年12月03日 00: ...
论文翻译：2020_Lightweight Online Noise Reduction on Embedded Devices using Hierarchical Recurrent Neural Networks
论文地址:基于分层递归神经网络的嵌入式设备轻量化在线降噪引用格式:Schröter H, Rosenkranz T, Zobel P, et al. Lightweight Online Noise ...

随机推荐

CSS中的 backgroundPosition 属性
body { background-image:url('bgimage.gif'); background-repeat:no-repeat; background-attachment:fixed ...
Ubuntu 14.04（32位）安装Oracle 11g（32位）全过程
1.将系统更新到最新:sudo apt-get updatesudo apt-get dist-upgrade2.安装Oracle所需的依赖包:sudo apt-get install automak ...
hadoop data 相关开源项目（近期学习计划）
计划学习几个hadoop相关的开源项目: 1.spring hadoop 2.spring batch 3.spring redis 4.spring mongo 相关项目样例:https://git ...
欧拉函数 cojs 2181. 打表
cojs 2181. 打表 ★☆ 输入文件:sendtable.in 输出文件:sendtable.out 简单对比时间限制:1 s 内存限制:256 MB [题目描述] 有一道比赛题 ...
传统高斯模糊与优化算法(附完整C++代码)
高斯模糊(英语:Gaussian Blur),也叫高斯平滑,是在Adobe Photoshop.GIMP以及Paint.NET等图像处理软件中广泛使用的处理效果,通常用它来减少图像噪声以及降低细节层次 ...
css3中box-flex的使用
语法: box-flex:<number> 其中number取值:使用浮点数指定对象所分配其父元素剩余空间的比例.设置或检索伸缩盒对象的子元素如何分配其剩余空间. html代码: < ...
如何利用python模仿浏览器进行网页爬取？
http://wwwsearch.sourceforge.net/mechanize/ http://www.ibm.com/developerworks/cn/linux/l-python-mech ...
HDU 2602 Bone Collector --01背包
这种01背包的裸题,本来是不想写解题报告的.但是鉴于还没写过背包的解题报告.于是来一发. 这个真的是裸的01背包. 代码: #include <iostream> #include < ...
C# explicit与implicit
1.它们解决什么问题? 考虑下面的需求,Person类有个字段age.我想使用Person p = (Person) 18 来创建一个age为18的Person对象,怎么办? 更进一步,我想使用Per ...
Unity3D 多平台预编译宏定义
平台定义 UNITY_EDITOR 编辑器调用. UNITY_STANDALONE_OSX 专门为Mac OS(包括Universal,PPC和Intelarchitectures)平台的定义. UN ...