读论文-基于会话的推荐系统综述(A survey on session-based recommender systems)
前言
今天读的论文是一篇于2021年发表于"ACM Computing Surveys (CSUR)"的论文,文章写到,推荐系统在信息过载时代和数字化经济中非常重要。基于会话的推荐系统(SBRSs)是新的推荐系统范式,不同于其他模型化长期静态用户偏好的推荐系统,SBRSs专注于捕捉短期动态用户偏好。尽管SBRSs已被深入研究,但缺乏统一的问题陈述和对其特点及挑战的深入阐述。该综述深入探讨了SBRSs的实体、行为和属性,提出了SBRSs的一般问题陈述,总结了SBRSs的数据特性和挑战,并定义了分类法。最后,文章讨论了SBRSs研究领域的新机会。
要引用这篇论文,请使用以下格式:
Wang, Shou**, et al. "A survey on session-based recommender systems." ACM Computing Surveys (CSUR) 54.7 (2021): 1-38.
摘要
Recommender systems (RSs) have been playing an increasingly important role for informed consumption, services, and decision-making in the overloaded information era and digitized economy. In recent years, session-based recommender systems (SBRSs) have emerged as a new paradigm of RSs. Different from other RSs such as content-based RSs and collaborative filtering-based RSs which usually model long-term yet static user preferences, SBRSs aim to capture short-term but dynamic user preferences to provide more timely and accurate recommendations sensitive to the evolution of their session contexts. Although SBRSs have been intensively studied, neither unified problem statements for SBRSs nor in-depth elaboration of SBRS characteristics and challenges are available. It is also unclear to what extent SBRS challenges have been addressed and what the overall research landscape of SBRSs is. This comprehensive review of SBRSs addresses the above aspects by exploring in depth the SBRS entities (e.g., sessions), behaviours (e.g., users’ clicks on items) and their properties (e.g., session length). We propose a general problem statement of SBRSs, summarize the diversified data characteristics and challenges of SBRSs, and define a taxonomy to categorize the representative SBRS research. Finally, we discuss new research opportunities in this exciting and vibrant area.
推荐系统(RSs)在信息过载的时代和数字化经济中,对于知情消费、服务和决策起着越来越重要的作用。近年来,基于会话的推荐系统(SBRSs)已经成为推荐系统的新范式。与其他推荐系统不同,例如基于内容的推荐系统和基于协同过滤的推荐系统通常模型化长期但静态的用户偏好,SBRSs旨在捕捉短期但动态的用户偏好,以提供更及时和准确的建议,对这些会话上下文的演变敏感。尽管SBRSs已经被深入研究,但既没有统一的SBRS问题陈述,也没有深入阐述SBRS的特点和挑战。目前还不清楚SBRS的挑战在多大程度上得到了解决,以及SBRS的整体研究现状是什么。这篇关于SBRSs的全面综述通过深入探讨SBRS实体(例如,会话)、行为(例如,用户对项目的点击)及其属性(例如,会话长度),解决了上述问题。我们提出了SBRS的一般问题陈述,总结了SBRS多样化的数据特性和挑战,并定义了一个分类法来分类代表性的SBRS研究。最后,我们讨论了这一激动人心且充满活力的领域中的新的研究机会。
摘要中讲到,推荐系统在信息爆炸的情况下扮演着非常重要的作用,基于会话的推荐系统成为了新范式;SBRSs可以捕捉短期的用户偏好,本文主要通过深入探讨SBRS实体(例如,会话)、行为(例如,用户对项目的点击)及其属性(例如,会话长度),解决了会话系统的一些问题。
引言
推荐系统(RSs)已成为一个基础工具,用于在生活的几乎每个日常方面做出更有益、高效和有效的选择和决策,包括工作、商业运作、学习、娱乐和社交[133]。它们在数字经济日益超载的时代变得尤为重要,用户通常需要从大量且快速增长的内容、产品和服务(统称为项目)中做出选择。各种推荐系统研究领域已经取得了巨大成功,例如基于内容的推荐系统[2, 84]、基于协同过滤的推荐系统[24, 98]以及结合前两者的混合推荐系统[8]。
然而,这些推荐系统倾向于利用所有历史用户-项目互动(简称互动,指用户对项目的直接或间接行为,例如用户点击项目的列表)[9]来学习每个用户对项目的长期和静态偏好。这种做法通常与一个潜在假设相关联,即用户的所有历史互动对她当前的偏好同等重要。但在现实世界情况下可能并非如此,主要原因有两点。首先,用户对项目的选择不仅取决于她的长期历史偏好,还取决于她的短期近期偏好和时间敏感的上下文(例如,最近浏览或购买的项目)。这种短期偏好嵌入在用户最近的互动中[52],这通常只占她历史互动的一小部分。其次,用户对项目的偏好往往是动态而非静态的,即随时间演变。为了弥合推荐系统中的这些差距,近年来会话型推荐系统(SBRSs)越来越受到关注。与上述推荐系统不同,SBRSs从消费过程中关联和生成的会话中学习用户的偏好。每个会话由多个在连续时间内发生的用户-项目互动组成,例如一次交易访问中购买的一篮产品,通常持续几分钟到几小时。通过将会话作为基本输入单位,SBRS能够捕捉用户从最近会话中的短期偏好以及从一个会话到另一个会话的偏好动态变化,以提供更准确和及时的推荐。在本文中,我们提到的SBRSs指的是所有以会话数据为中心来推荐当前会话中的下一个互动或下一个部分会话(即,剩余互动),或者推荐有多个互动的下一个会话的推荐系统(参见第2.2节)。这个定义涵盖了一些研究中狭义上的SBRSs [42, 91],它们仅推荐当前会话中的下一个互动。此外,它还包括了[91]中讨论的基于会话和会话感知的推荐系统。有许多研究使用不同的术语描述了SBRSs,在不同的设置和假设下,针对不同的应用领域。例如,Hidasi等人[43]在匿名会话数据上构建了一个SBRS,假设每个会话内的互动(例如,点击一个项目或观看一部电影)有严格的顺序,以预测下一个要点击的项目或要观看的视频。胡等人[49]在非匿名会话数据上构建了另一个SBRS,没有会话内部的顺序假设,推荐下一个要购买的项目。荆等人[55]在非匿名会话数据上设计了一个SBRS,假设会话内部有顺序,用于推荐下一首音乐或电影。尽管SBRSs在各个领域广泛存在,并且已经进行了许多相关研究,但由于描述、设置、假设和应用领域的多样性,SBRSs领域存在许多不一致之处。目前还没有一个统一的框架能够很好地对它们进行分类,也没有针对SBRSs的统一问题陈述。更重要的是,关于SBRSs的独特特性,包括其问题和会话数据、由特性引起的研究挑战,以及解决挑战的研究现状和差距,还没有系统的讨论。对于SBRSs的所有代表性和最先进的方法,也没有系统的分类。这些差距限制了SBRSs的理论发展和实际应用。为了解决上述重要方面和差距,本文提供了对SBRSs领域的全面和系统的概述和调查:
• 我们提供了一个统一的框架来分类SBRSs的研究,这可以减少SBRSs领域中的混乱和不一致的观点。
• 我们的工作首次提出了SBRSs的统一问题陈述,其中SBRS建立在正式概念之上:用户、项目、行动、互动和会话。
• 我们提供了对会话数据的独特特性以及由此引发的SBRSs挑战的全面概述。据我们所知,这是第一次这样的描述。
• 对SBRS方法进行了系统的分类和比较,以提供关于如何解决这些挑战以及在SBRS领域取得的进展的整体视图。
• 简要介绍了SBRSs的每类方法及其关键技术细节,以提供对SBRSs取得的进展的深入理解。
• 最后,讨论了SBRS研究的开放问题和前景。
引言部分主要讨论了推荐系统(RSs)的发展、挑战和一种特定类型推荐系统——会话型推荐系统(SBRSs)的兴起。
- 推荐系统的重要性和发展:
- 推荐系统已成为在生活的各个方面做出选择的重要工具,例如工作、商业、学习、娱乐和社交。
- 成功应用多种推荐系统研究,如基于内容的推荐系统、基于协同过滤的推荐系统以及混合推荐系统。
- 历史用户-项目互动的挑战:
- 传统推荐系统通常使用所有可用的历史用户-项目互动数据来预测用户的长期偏好。
- 这种方法假定历史互动可以完全反映用户的当前偏好,但这可能不适用于快速变化或短期内用户偏好发生变动的情况。
- 会话型推荐系统的出现:
- SBRSs专注于短期、动态的用户偏好,通过分析会话数据来提供更准确及时的推荐。
- 一个会话包括用户在一定时期内的连续互动,例如一次购物篮或观看一系列视频。
- 会话型推荐系统的特点:
- SBRSs利用会话中的数据来捕捉用户的短期偏好和偏好随时间的动态变化。
- 将会话作为基本的分析单位,有助于更精准地预测用户接下来可能的互动或感兴趣的项目。
- 会话型推荐系统的研究和分类:
- 文献中使用不同的术语和设置描述SBRSs,针对各种应用领域展开研究。
- 目前缺乏统一的框架来分类SBRSs研究,并缺少针对SBRSs的统一问题陈述。
- 本文的贡献:
- 提供了SBRSs研究的全面和系统概述,包括统一的分类框架和问题陈述。
- 分析了会话数据的独特特性和由此引发的挑战,以及SBRSs领域的现状和进展。
- 对SBRSs方法进行了分类和比较,介绍了关键技术细节。
- 讨论了SBRSs研究的潜在问题和未来研究方向。
总结来说,这段文字强调了推荐系统特别是会话型推荐系统在理解用户行为和提供个性化推荐方面的重要性,同时指出了当前研究中存在的问题和挑战,并提出了本文旨在解决这些问题的努力和贡献。
SBRSs vs. SRSs
会话型推荐系统(SBRSs)和序列推荐系统(SRSs)分别基于会话数据和序列数据构建,但有些读者常将这两者混淆。因此,首先澄清会话数据与序列数据之间的区别是必要的。会话是具有明确边界的交互列表,而交互可能是按时间顺序排列的(在有序会话中)[43, 92],或无序的(在无序会话中)[49, 126]。边界指的是开始和结束特定会话的交易事件中的起始-结束交互对。有序(无序)会话指的是会话中的交互是(不是)按时间顺序排列的。给定用户的会话数据通常包含在不同时间发生并由多个边界分隔的多个会话,并且会话之间的时间间隔不相同(参见图 1 (a))。序列是具有明确顺序的历史元素(例如,项目ID)列表。给定用户的序列数据通常只包含一个序列,并且只有一个边界(参见图 1 (b))。在大多数序列数据中,时间戳仅用于对序列内的元素进行排序,而没有包括和考虑明确的时间间隔[91]。边界通常表明在其内部的交互或元素之间的共现依赖性[9]。共现依赖性构成了SBRSs的基础,特别是那些基于无序会话数据构建的SBRSs。顺序意味着会话或序列内的交互或元素之间存在明确的序列依赖性。我们在表1中展示了某个用户的会话数据和序列数据之间的区别。SBRS的目标是通过学习会话内部或会话之间的依赖性,预测给定已知部分的会话的未知部分(例如,一个项目或一批项目),或者给定历史会话的未来会话(例如,下一个购物篮)。这样的依赖性通常在很大程度上依赖于会话内交互的共现,它们可能是顺序的或非顺序的[49]。原则上,SBRS不一定依赖于会话内的顺序信息,但对于有序会话,自然存在的顺序依赖性可以用于推荐。相比之下,SRS通过学习它们之间的顺序依赖性来预测给定一系列历史元素的后续元素。有几篇综述文章特别关注了SRSs,包括序列感知推荐系统[91]、深度学习用于顺序推荐[27]和顺序推荐系统[128]。在这项调查中,我们特别关注SBRSs领域,强调会话数据的独特特性以及它们给SBRSs带来的挑战,以及SBRSs的代表性和最先进方法。
要点总结:
- SBRSs和SRSs分别基于会话数据和序列数据构建,但有时会被混淆。
- 会话是有明确边界的交互列表,可能是有序的或无序的。
- 边界是指开始和结束特定会话的交互对。
- 会话数据包含多个不同时间的会话,时间间隔不同;序列数据通常只含一个序列和一个边界。
- 序列数据中的时间戳通常仅用于排序,不考虑明确的时间间隔。
- 边界表明共现依赖性,是SBRSs的基础。
- SBRSs预测会话的未知部分或未来会话,依赖性可能基于共现,可能是顺序的或非顺序的。
- SBRSs不一定依赖会话内的顺序信息,但有序会话的序列依赖性可用于推荐。
- SRSs通过学习顺序依赖性来预测后续元素。
- 本文关注的是SBRSs领域,特别是会话数据的特性、挑战以及代表性和最先进方法。
A Framework for Organizing SBRS Work
对SBRSs现有工作的多样性通常可以分为三个子领域,这些子领域适合统一的分类框架,以减少上述的不一致性和混淆。根据推荐任务的不同,这些子领域包括下一次互动推荐、下一局部会话推荐和下一会话推荐。给定会话的已知部分(即已发生的互动),下一次互动推荐旨在通过主要建模会话内的依赖性来推荐当前会话中的下一个可能互动。这通常被简化为预测下一个要互动的项目,例如点击或购买的产品。给定会话的已知部分,下一局部会话推荐旨在推荐所有剩余的互动以完成当前会话,例如,给定购物篮中已购买的商品,预测所有后续商品以完成篮子,这主要是通过建模会话内的依赖性。尽管研究较少,但这个子领域在现实世界案例中甚至更加实用,因为用户通常不会在下一个只互动一个项目,而是多个项目,直到她结束整个会话。给定历史会话,下一会话推荐旨在通过主要建模会话间的依赖性来推荐下一个会话,例如下一个购物篮。有时,会话间的依赖性也被结合到前两个子领域中,以提高推荐性能。这些子领域的比较在表2中展示。
总结来说,这一小节讲的内容要点如下:
- SBRSs的研究可以分为三个子领域:下一次互动推荐、下一局部会话推荐和下一会话推荐。
- 下一次互动推荐关注在当前会话中推荐下一个可能的互动,通常简化为预测下一个项目。
- 下一局部会话推荐关注推荐当前会话剩余的互动,例如预测购物篮中剩余的商品。
- 下一会话推荐关注基于历史会话数据推荐下一个会话,例如下一个购物篮。
- 各子领域之间可能会结合会话间依赖性以提高推荐性能。
- 子领域之间的比较在文中的表2展示。
SBRS PROBLEM STATEMENT
推荐系统(RS)可以被视为一个系统[9, 10],它由多个基本实体组成,包括用户、项目及其行为,例如用户-项目的互动。这些基本实体和行为形成了会话的核心组成部分,而会话是SBRS中的核心实体。因此,我们首先介绍这些实体和行为的定义和属性,然后基于它们定义SBRS问题。这些定义和属性将用于SBRS的表征和分类等。主要符号列在表3中。
User and User Properties
在SBRS中的用户是采取行动的主体,例如对商品进行点击、购买,并接收推荐结果。用??表示一个用户,每个用户都与一个独特的ID和一组属性相关联,这些属性描述了她的特征,例如用户的性别,它有多个值,例如男性和女性。用户的属性可能会影响她对项目的行为,并进一步影响相应的会话。例如,一个男孩可能会观看更多的动作电影,导致在他的观看会话中有更多动作电影,而一个女孩可能更喜欢观看爱情故事电影。除了可以明显观察到的显式属性外,一些反映用户内部状态的隐式属性,例如她的情绪和意图,也可能对她的行为产生重大影响。所有用户共同形成了用户集,即?? = {??1, ??2, ..., ??|?? | }。请注意,由于两个原因,会话中的用户信息并不总是可用的:(1) 由于隐私保护没有记录;(2) 一些用户在与在线平台(如amazon.com)互动时没有登录。因此,会话变成了匿名的。
Item and Item Properties
在SBRS中,项目是被推荐的实体,例如产品(如书籍)或服务(如课程)。用??表示一个项目,它与一个独特的ID和一组属性相关联,以提供项目的描述信息,如项目的类别和价格。数据集中的所有项目形成了项目集,即?? = {??1, ??2, ..., ??|?? | }。通常,不同领域的项目是不同的。例如,在新闻推荐领域,项目是发布在新闻网站上的新闻文章,如abc.com上的人工智能报道;在电子商务领域,项目是待售产品,如amazon.com上的耳机;在服务行业,项目是特定服务,如Coursera提供的"机器学习"课程(https://www.coursera.org/)。
Action and Action Properties
在会话中,用户对项目执行的操作通常被视为一个动作,例如点击一个项目。用??表示一个动作,该动作与一个独特的ID和一组属性相关联,以提供其属性信息,例如动作的类型,并且具有多个值,例如点击、查看和购买。请注意,一些动作可能不与特定项目关联,例如搜索动作或目录导航动作。但正如[91]中所讨论的,它们仍然可以为SBRS提供有用的信息。
结尾
今天的论文先读到这了,快过年了;总结来说,一个月左右,读的论文也不少了,龙年快乐
读论文-基于会话的推荐系统综述(A survey on session-based recommender systems)的更多相关文章
- 【RS】A review on deep learning for recommender systems: challenges and remedies- 推荐系统深度学习研究综述:挑战和补救措施
[论文标题]A review on deep learning for recommender systems: challenges and remedies (Artificial Intell ...
- (读论文)推荐系统之ctr预估-NFM模型解析
本系列的第六篇,一起读论文~ 本人才疏学浅,不足之处欢迎大家指出和交流. 今天要分享的是另一个Deep模型NFM(串行结构).NFM也是用FM+DNN来对问题建模的,相比于之前提到的Wide& ...
- 【推荐系统论文笔记】Introduction To Recommender Systems: Algorithms and Evaluation
这篇论文比较短,正如题目所说,主要还是简单地介绍了一下推荐系统的一些算法以及评估的方法. 推荐系统之前是基于关键字信息的过滤系统,后来发展成为协同过滤系统,解决了两个问题:1.通过人工审核去评价那些具 ...
- 【RS】Deep Learning based Recommender System: A Survey and New Perspectives - 基于深度学习的推荐系统:调查与新视角
[论文标题]Deep Learning based Recommender System: A Survey and New Perspectives ( ACM Computing Surveys ...
- 大数据算法->推荐系统常用算法之基于内容的推荐系统算法
港真,自己一直非常希望做算法工程师,所以自己现在开始对现在常用的大数据算法进行不断地学习,今天了解到的算法,就是我们生活中无处不在的推荐系统算法. 其实,向别人推荐商品是一个很常见的现象,比如我用了一 ...
- 读论文系列:Deep transfer learning person re-identification
读论文系列:Deep transfer learning person re-identification arxiv 2016 by Mengyue Geng, Yaowei Wang, Tao X ...
- 基于spark-streaming实时推荐系统
基于spark-streaming实时推荐系统(一) 基于spark-streaming实时推荐系统( 二) 基于spark-streaming实时推荐系统(三)
- 论文笔记: Deep Learning based Recommender System: A Survey and New Perspectives
(聊两句,突然记起来以前一个学长说的看论文要能够把论文的亮点挖掘出来,合理的进行概括23333) 传统的推荐系统方法获取的user-item关系并不能获取其中非线性以及非平凡的信息,获取非线性以及非平 ...
- 【RS】Improving Implicit Recommender Systems with View Data - 使用浏览数据提升隐式推荐系统
[论文标题]Improving Implicit Recommender Systems with View Data(IJCAI 18) [论文作者]Jingtao Ding , Guanghui ...
- 【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 16—Recommender Systems 推荐系统
Lecture 16 Recommender Systems 推荐系统 16.1 问题形式化 Problem Formulation 在机器学习领域,对于一些问题存在一些算法, 能试图自动地替你学习到 ...
随机推荐
- 中电金信:云原生时代IT基础设施管理利器——基础设施即代码(IaC)
在数字化转型.零售业务快速发展.信创建设驱动下,应用架构.技术架构.基础架构都已向云原生快速演进,银行业IT基础设施管理产生了非常大的变化,当前银行业,正在开展新一轮的核心应用系统重构.基础平台统一 ...
- 龙哥量化:代写技术指标,通达信ZIG函数优化改进之字转向,高点用最高价,低点用最低价
如果您需要代写技术指标公式, 请联系我. 龙哥QQ:591438821 龙哥微信:Long622889 N:=50; A1:ZIG(3,N/10); 代码只有两行,参数是50,表示涨幅5%,在调参数时 ...
- Qt/C++地图坐标纠偏/地球坐标系/火星坐标系/百度坐标系/互相转换/离线函数
一.前言说明 为什么需要地球坐标纠偏这个功能,因为国家安全需要,不允许使用国际标准的地球坐标系,也并不是咱们这边这样,很多国家都是这样处理的,就是本国的地图经纬度坐标都是按照国家标准来的,所以就需要一 ...
- Qt编写跨平台视频监控系统(64通道占用7%CPU/支持win_linux_mac等)
一.前言 视频监控组件经历过数十年的迭代,从最初的只简单播放个rtsp视频流,到现在支持各种音频视频文件格式(mp3.wav.mp4.asf.rm.rmvb.mkv等).支持各种视频流格式(rtp.r ...
- Qt编写物联网管理平台41-自动清理早期数据
一.前言 随着时间的增加,存储的历史记录也在不断增加,如果设备数量很多,存储间隔很短,不用多久,数据库中的记录就非常多,至少是百万级别起步,而且有些用户还是需要存储每一次的采集的数据,这数据量别说一年 ...
- Qt编写安防视频监控系统23-图片地图
一.前言 图片地图这个模块是后面新增加进去的,主要是安防领域还有很多应用场景是一个区域比如就一个学校,提供一个学校的平面图或者鸟瞰图,然后在该地图上放置对应的摄像机,双击该摄像机图标可以查看对应的实时 ...
- 贝叶斯定律和卡尔曼滤波中,关于(e^-x)*(e^-x)的积分的计算方法
贝叶斯定律和卡尔曼滤波中,关于(e^-x)*(e^-x)的积分的计算方法: 1.用数学软件Mathmatica计算: 2.用复变函数中的留数定理计算: 3.用FFT+卷积公式计算.
- 即时通讯技术文集(第18期):IM架构设计基础知识合集 [共16篇]
为了更好地分类阅读 52im.net 总计1000多篇精编文章,我将在每周三推送新的一期技术文集,本次是第18 期. [- 1 -] IM系统的MQ消息中间件选型:Kafka还是RabbitMQ? [ ...
- # 个人认为windows下最好用的一批软件 #
个人认为windows下最好用的一批软件 chrome 为什么是chrome而不是edge2? 这当然不是因为我是谷歌吹什么的.其实当得知edge2比chrome更省内存,运行更快,而且不跨越城墙就能 ...
- java第二章数组学习
java第二章数组 数组的概念和特点 数组(Array),是多个相同类型数据按一定顺序排列的集合,并使用一个 名字命名,并通过编号的方式对这些数据进行统一管理. 特点 数组本身是引用数据类型,而数组中 ...