基于融合语义信息改进的内容推荐算法。Improved content recommendation algorithm integrating semantic information
引言
路漫漫其修远兮,吾将上下而求索。每天一篇论文,做更好的自己。
本文读的这篇论文为发表于2023年5月28日的一篇名为《基于融合语义信息改进的内容推荐算法》(基于融合语义信息改进的内容推荐算法)的文章,文章主要介绍了基于内容的推荐技术在电子商务和教育领域的广泛应用,以及传统基于内容推荐技术在语义分析方面的不足之处。为了改进传统算法的语义分析能力,本文提出了一种整合了语义信息的改进的内容推荐算法,并通过实验证明了该算法的有效性和稳定性。
摘要
Content-based recommendation technology is widely used in the field of e-commerce and education because of its intuitive and easy to explain advantages. However, due to the congenital defect of insufficient semantic analysis of TF-IDF vector space model, the traditional content-based recommendation technology has the problem of insufficient semantic analysis in item modeling, fails to consider the role of semantic information in knowledge expression and similarity calculation, and is not accurate enough in calculating item content similarity. The items with semantic relevance in content can not be well mined. The research goal of this paper is to improve the semantic analysis ability of the traditional content-based recommendation algorithm by integrating semantic information with TF-IDF vector space model for item modeling and similarity calculation and proposed an improved content recommendation algorithm integrating semantic information. In order to prove the effectiveness of the proposed method, several groups of experiments are carried out. The experiments results showed that the overall performance of the proposed algorithm in this paper is the best and relatively stable. This verified the validity of our method.
摘要翻译
基于内容的推荐技术在电子商务和教育领域得到广泛应用,因为它具有直观且易于解释的优势。然而,由于TF-IDF向量空间模型在语义分析方面的先天性缺陷,传统的基于内容推荐技术在项目建模中存在语义分析不足的问题,无法充分考虑语义信息在知识表达和相似度计算中的作用,并且在计算项目内容相似度时不够准确。因此,无法很好地挖掘出内容上具有语义相关性的项目。本文的研究目标是通过将语义信息与TF-IDF向量空间模型相结合,改进传统基于内容推荐算法的语义分析能力,并提出了一种改进的内容推荐算法,该算法整合了语义信息。为了证明所提出方法的有效性,进行了几组实验。实验结果表明,本文提出的算法在整体性能上表现最好且相对稳定。这验证了我们方法的有效性。
基于内容的推荐技术
所谓基于内容的推荐算法(Content-Based Recommendations)是基于标的物相关信息、用户相关信息及用户对标的物的操作行为来构建推荐算法模型,为用户提供推荐服务。
简单来讲,基于内容的推荐算法的基本原理是根据用户的历史行为,获得用户的兴趣偏好,为用户推荐和他兴趣偏好相似的事物。
基于内容的推荐技术在电商和教育领域有很大应用,比如我们生活中很常用的一些电商平台,会根据用户的搜索来推荐用户可能会购买的事物;另外,在教育领域,课程网站或者APP会根据用户搜索观看的视频来对用户进行推荐,我们能够经常看到系统推荐给我们的信息。此外,基于内容的推荐技术还应用在娱乐、社交网络、新闻网站等领域。
传统基于内容的推荐技术的缺点
TF-IDF向量空间模型存在语义分析不足的先天缺陷,传统的基于内容的推荐技术在项目建模中存在语义分析不足的问题。它没有考虑语义信息在知识表达中的作用,对项目内容相似度的计算不够准确。内容中具有语义相关性的项目不能很好地挖掘。
下图为基于内容的推荐算法模型:

集成语义信息的改进内容推荐算法
为解决传统的推荐技术的缺点,文章提出将语义信息与TF-IDF向量空间模型相结合,以此来改进传统的推荐技术的缺点。
词嵌入技术可以在一定程度上反映词的语义信息。单词之间的语义距离可以通过单词向量来计算。目前常用的词向量主要基于word2vec和fasttext模型。
Word2vec模型使用深度学习方法来获取单词的空间分布表示。它是一种语言模型,它以无监督的方式从海量文本语料库中学习富含语义信息的低维词向量。它是神经网络在自然语言处理领域应用的结果。Word2vec词向量模型将单词映射到低维空间,使语义相似的单词在空间中很接近。单词之间的语义相似性是通过计算单词向量之间的空间距离来表示的。
语义相似的特征词在空间分布上距离越近。然后,通过相似度计算或距离测量可以得到特征词之间的语义相关性。为了提高基于内容的推荐算法的语义分析缺陷和推荐准确率,将词嵌入技术与TF-IDF向量空间模型相结合,进行项目建模和相似度计算,提出了一种新的推荐算法。
下图为集成语义信息的改进内容推荐算法模型:

补充:TF-IDF
TF-IDF是一种统计方法,用来评估一个词语对一个文档的重要程度,一个词语在文档中出现的次数越多,则这个词语对这个文档而言更重要;而如果它在整个语料库中出现的次数越多,则它对这个文档越不重要。TF-IDF中的TF(Term Frequency)表示词频,IDF(Inverse Document Frequency)表示逆向文档频率。TF-IDF的计算公式如下:

其中 表示词语i在文档中的权重, 表示词语在文档中的频率,N为总的文档数, 表示出现词语i的文档个数,L为一个常数,在很多应用场景中其实都忽略了L。
心得
在推荐算法中,基于内容的推荐在生活中非常常见,但问题是我们日常生活中的推荐算法大都存在准确度较差的问题,不管是基于协同的Top-N算法还是基于内容的推荐算法。事实上,如果推荐算法效果不够好的话,那么对于用户来说就是灾难而非福利,所以在推荐算法这方面还需要更多的研究,以带给用户不一样的体验。
写在最后
每日读一篇文章,虽然很艰难,但是有收获。坚持下去,加油,奥利给!
基于融合语义信息改进的内容推荐算法。Improved content recommendation algorithm integrating semantic information的更多相关文章
- 美团网基于机器学习方法的POI品类推荐算法
美团网基于机器学习方法的POI品类推荐算法 前言 在美团商家数据中心(MDC),有超过100w的已校准审核的POI数据(我们一般将商家标示为POI,POI基础信息包括:门店名称.品类.电话.地址.坐标 ...
- (二)基于商品属性的相似商品推荐算法——Flink SQL实时计算实现商品的隐式评分
系列随笔: (总览)基于商品属性的相似商品推荐算法 (一)基于商品属性的相似商品推荐算法--整体框架及处理流程 (二)基于商品属性的相似商品推荐算法--Flink SQL实时计算实现商品的隐式评分 ( ...
- 新闻推荐系统:基于内容的推荐算法(Recommender System:Content-based Recommendation)
https://blog.csdn.net/qq_32690999/article/details/77434381 因为开发了一个新闻推荐系统的模块,在推荐算法这一块涉及到了基于内容的推荐算法(Co ...
- SimRank协同过滤推荐算法
在协同过滤推荐算法总结中,我们讲到了用图模型做协同过滤的方法,包括SimRank系列算法和马尔科夫链系列算法.现在我们就对SimRank算法在推荐系统的应用做一个总结. 1. SimRank推荐算法的 ...
- 用Spark学习矩阵分解推荐算法
在矩阵分解在协同过滤推荐算法中的应用中,我们对矩阵分解在推荐算法中的应用原理做了总结,这里我们就从实践的角度来用Spark学习矩阵分解推荐算法. 1. Spark推荐算法概述 在Spark MLlib ...
- 基于MapReduce的(用户、物品、内容)的协同过滤推荐算法
1.基于用户的协同过滤推荐算法 利用相似度矩阵*评分矩阵得到推荐列表 已经推荐过的置零 2.基于物品的协同过滤推荐算法 3.基于内容的推荐 算法思想:给用户推荐和他们之前喜欢的物品在内容上相似的物品 ...
- 【T-BABY 夜谈大数据】基于内容的推荐算法
这个系列主要也是自己最近在研究大数据方向,所以边研究.开发也边整理相关的资料.网上的资料经常是碎片式的,如果要完整的看完可能需要同时看好几篇文章,所以我希望有兴趣的人能够更轻松和快速地学习相关的知识. ...
- 基于KNN的相关内容推荐
如果做网站的内容运营,相关内容推荐可以帮助用户更快地寻找和发现感兴趣的信息,从而提升网站内容浏览的流畅性,进而提升网站的价值转化.相关内容 推荐最常见的两块就是“关联推荐”和“相关内容推荐”,关联推荐 ...
- (转) 基于MapReduce的ItemBase推荐算法的共现矩阵实现(一)
转自:http://zengzhaozheng.blog.51cto.com/8219051/1557054 一.概述 这2个月为公司数据挖掘系统做一些根据用户标签情况对用户的相似度进行评估,其中涉及 ...
- 基于用户的协同过滤的电影推荐算法(tensorflow)
数据集: https://grouplens.org/datasets/movielens/ ml-latest-small 协同过滤算法理论基础 https://blog.csdn.net/u012 ...
随机推荐
- django介绍及基本使用
目录 一.python主流web框架 二.django简介 1.版本问题 2.运行django注意事项 三.django基本使用 1.下载模块 2.验证 3.常见命令 4.pycharm自动创建dja ...
- 配置YUM源出现Errno 14 Could not open/read repomd.xml 或者 "Couldn't open file /mnt/cdrom/repodata/repomd.xml" 错误的解决办法
报错信息: [root@tcljr-jdh-uat007 yum.repos.d]# yum makecache Loaded plugins: fastestmirror Loading mirro ...
- 基于Three.js的大屏3D地图(一)
依赖安装 yarn add three yarn add @types/three yarn add d3-geo three库安装后在node_modules下其还包含核心three/src和插件t ...
- 关于Jetson nano (B02)如何部署Yolov8以及一些必要的知识点
一.前言 记录一个简单的安装和部署过程,尽管笔者也是按照教程来的,但奈何参考了很多教程,虽然写的都非常好,但是却很散,因此笔者这里想把这些教程的精华提炼出来,汇总并且写在正文处.还是老规矩,笔者也在学 ...
- Qt编写的项目作品16-Onvif搜索和云台控制工具
一.功能特点 广播搜索设备,支持IPC和NVR,依次返回. 可选择不同的网卡IP进行对应网段设备的搜索. 依次获取Onvif地址.Media地址.Profile文件.Rtsp地址. 可对指定的Prof ...
- Eclipse中如何将web应用部署到tomcat
第1种方法: 将workspace下的复制到tomcat的webapp下(我看度还是算了,看着都觉得麻烦). 第2种方法:总体思路就是:(1)先为web应用创建Tomcat Server:(2)再将w ...
- Docker简易操作
Docker简易操作 1.启动docker sudo docker run [OPTIONS] IMAGE [COMMAND] [ARG...] sudo docker run -d -p 8009: ...
- o3 发布了,摔碎了码农的饭碗
大家好,我是汤师爷~ 在 2024 年底,OpenAI 发布了最新推理模型 o3.o3模型相当炸裂,在世界级编程比赛中拿下第 175 名,打败 99.9% 的参赛者.AI 写代码都赶上顶级程序员了,程 ...
- CDS标准视图:功能位置描述 I_FunctionalLocationText
视图名称:功能位置描述 I_FunctionalLocationText 视图类型:基本视图 视图代码: 点击查看代码 @EndUserText.label: 'Functional Location ...
- 互联网不景气了那就玩玩嵌入式吧,用纯.NET开发并制作一个智能桌面机器人(一):从.NET IoT入门开始
前言 为什么我会想着制作一个智能桌面机器人呢?自问自答一下,看过我之前文章的小伙伴应该都知道我之前有为稚晖君开源的ElectronBot桌面机器人开发过一个桌面上位机软件叫电子脑壳,由于Electro ...