推荐系统(recommender systems):均值归一化(mean normalization)

均值归一化可以让算法运行得更好。

现在考虑这样一个情况：一个用户对所有的电影都没有评分，即上图所示的Eve用户。现在我们要学习特征向量（假设n=2）以及用户5的向量θ⁽⁵⁾,因为用户Eve没有对任何电影打分，所以前面的一项为0，只有后面正则化的项，所以影响θ取值的只有后面的θ的正则化的项。所以要使它最小，即θ的取值为0.所以当我们预测用户5对所有电影的评分的时候，这时的评分都为0.所以我们会预测所有的电影的评分都为0.这样是毫无意义的，因为我们还是没有办法知道我们应该向用户5推荐什么电影（没有一部电影评分要高些），所有的电影预测为0也没有意义，因为事实是有的电影评分要高些，有的电影评分要低些。

均值归一化可以让我们解决上面的问题

首先计算每部电影所得评分的均值，将其放在向量u中，将所有的电影评分减去平均评分，即将每部电影的评分归一化，让其平均值变为0.

现在我们将这个评分数据集Y使用协同过滤算法，来学习θ(j)与x(i).

对于用户j对于电影i的评分，我们使用(θ(j))^T(x(i))+u⁽ⁱ⁾

所以对于user5我们学习到的θ为[0,0],这样再加上u值，这样user5对于电影1的预测分为2.5,对于电影2的预测分也为2.5....它的意思其实是在说，如果用户5没有给任何电影评分，我们要做的是预测他对每部电影的评分为这些电影的平均得分

均值归一化Y，使得每行的平均值为0，如果有些电影是没有评分的，这种情况我们可以将Y的列进行均值归一化，但是这种情况可能不好，因为当一部电影没有一个用户对它进行评分时，这种情况我们是不会将这部电影推荐给用户的。所以当用户没有对一部电影进行评分时，我们可以使用行无值归一化来处理，这种情况比列均值归一化要常见些

总结

协同过滤算法的预处理过程--均值归一化，根据数据集的不同，可以让算法运行得更好

推荐系统(recommender systems):均值归一化(mean normalization)的更多相关文章

[C11] 推荐系统(Recommender Systems)
推荐系统(Recommender Systems) 问题阐述(Problem Formulation) 将推荐系统纳入这门课程来讲有以下两个原因: 第一.仅仅因为它是机器学习中的一个重要的应用.在 ...
斯坦福第十六课：推荐系统(Recommender Systems)
16.1 问题形式化 16.2 基于内容的推荐系统 16.3 协同过滤 16.4 协同过滤算法 16.5 矢量化:低秩矩阵分解 16.6 推行工作上的细节:均值归一化 16.1 问题形式 ...
Ng第十六课：推荐系统(Recommender Systems)
16.1 问题形式化 16.2 基于内容的推荐系统 16.3 协同过滤 16.4 协同过滤算法 16.5 矢量化:低秩矩阵分解 16.6 推行工作上的细节:均值归一化 16.1 问题形式 ...
推荐系统(recommender systems):预测电影评分--问题描述
推荐系统很重要的原因:1>它是机器学习的一个重要应用2>对于机器学习来说,特征是非常重要的,对于一些问题,存在一些算法能自动帮我选择一些优良的features,推荐系统就可以帮助我们做这样 ...
推荐系统(recommender systems):预测电影评分--构造推荐系统的一种方法：低秩矩阵分解(low rank matrix factorization)
如上图中的predicted ratings矩阵可以分解成X与ΘT的乘积,这个叫做低秩矩阵分解. 我们先学习出product的特征参数向量,在实际应用中这些学习出来的参数向量可能比较难以理解,也很难可 ...
【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 16—Recommender Systems 推荐系统
Lecture 16 Recommender Systems 推荐系统 16.1 问题形式化 Problem Formulation 在机器学习领域,对于一些问题存在一些算法, 能试图自动地替你学习到 ...
【RS】Matrix Factorization Techniques for Recommender Systems - 推荐系统的矩阵分解技术
[论文标题]Matrix Factorization Techniques for Recommender Systems(2009,Published by the IEEE Computer So ...
【RS】Improving Implicit Recommender Systems with View Data - 使用浏览数据提升隐式推荐系统
[论文标题]Improving Implicit Recommender Systems with View Data(IJCAI 18) [论文作者]Jingtao Ding , Guanghui ...
【RS】Wide & Deep Learning for Recommender Systems - 广泛和深度学习的推荐系统
[论文标题]Wide & Deep Learning for Recommender Systems (DLRS'16) [论文作者] Heng-Tze Cheng, Levent Koc, ...

随机推荐

避免因为Arcgis Server服务设置不当导致Oracle Process溢出的方法
我之前写过一篇文章<arcsoc进程无限增长导致oracle processes溢出>(见链接:https://www.cnblogs.com/6yuhang/p/9379086.html ...
python三级联动
#以字典的形式保存相关省市数据 menu={ '北京':{ '朝阳':{ '国贸':{ 'CICC':{}, 'HP':{}, '银行':{}, 'CCTV':{} }, '望京':{ '陌陌':{ ...
Cannot find class in classpath解决方法
1)Build Path出问题了 build path出问题了 ,java工程名前会有一个红色的感叹号,重新build一下工程名上右键——>Build Path ——>Configure ...
Linux基础(01)开发环境的搭建
内核源码下载 : https://blog.csdn.net/u011375704/article/details/81866427 1.在虚拟机安装Ubuntu 14.04版本 (安装时设置好用户名 ...
Oulipo 子串查找
题目描述思路使用哈希值表示较长串的子串的值,直接比较哈希值是否相等代码 #include <cstdio> #include <cstring> using namesp ...
射频IC设计的六边形法则
博主在之前学习射频IC时,通过网上的资料,总结了射频IC设计的六个指标含义及其相应的折中关系,希望能给大家带来帮助. 噪声(Noise): (1)噪声一般可以分为白噪声和闪烁噪声.白噪声是由载流子的无 ...
python面试题_01
前言现在面试测试岗位,一般会要求熟悉一门语言(python/java),为了考验求职者的基本功,一般会出2个笔试题,这些题目一般不难,主要考察基本功.要是给你一台电脑,在编辑器里面边写边调试,没多大 ...
IntelliJ IDEA启动一个普通的java web项目的配置
文:朱季谦这是我很久以前刚开始用IntelliJ IDEA时记录的笔记,正好赶上最近离职了,可以有比较多的时间把以前的记录整理一下,可以让刚接触到IntelliJ IDEA的童鞋学习如何在Intel ...
Linux学习笔记之秋水BBR一键部署
0x00 本脚本适用环境系统支持:CentOS 6+,Debian 7+,Ubuntu 12+内存要求:≥128M 阅读文章时请除手动删出干扰字符“1”.(Shadowsocks) 0x01 关于本 ...
JAAS configuration for Kafka clients
Clients may configure JAAS using the client configuration property sasl.jaas.config or using the sta ...

推荐系统(recommender systems):均值归一化(mean normalization)

推荐系统(recommender systems):均值归一化(mean normalization)的更多相关文章

随机推荐

热门专题