本博客是针对Andrew Ng在Coursera上的machine learning课程的学习笔记。

基于内容的推荐（Content-based recommendation）
- 问题表述
- 问题范式
协同过滤（collaborative filtering）
低阶矩阵因式分解（Low Rank Matrix Factorization）。
均值标准化（Mean Normalization）

基于内容的推荐（Content-based recommendation）

问题表述

假设我们有如下评分矩阵（纵向为同一用户的评分对不同电影的评分，横向为不同用户对同一部电影的评分）：

$n_u$表示用户数目，$n_m$表示电影数目，$\theta^{{(j)}$表示用户j对电影特征的喜好程度参数（一个向量），$x}{(i)}$表示电影i的特征向量。当我们要预测用户j对电影i的评分时，就可以使用以下公式：$$Rating=(\theta^{(j)})Tx^{(i)}$$

即用户对电影不同特征的喜好向量的转置，与电影的特征向量相乘。

问题范式

那么，用公式化的语言来总结上述的问题，形式如下：

总结而言，我们通过以$\theta^{{(j)}$为目标参数最小化损失函数（加上正则项），以学习到$\theta}{(j)}$的最优值，以用于预测用户j对于其尚未评分的电影的评分。（删除$m^{(j)}$是因为其是一个常数，在最小化损失函数的过程中对结果没有影响）

接下来，我们将最优化目标做进一步转化：将所有需要预测的用户的损失函数加总在一起，得到我们最终的优化目标（如下图）：

参数学习的方式还是用梯度下降（注意对截距项和非截距项参数的更新上，正则项是否存在的差别）

协同过滤（collaborative filtering）

问题引入

我们之前假设了已经获得了每部电影的特征向量，但实际情况中，往往电影的特征向量数据也可能没有，这种情况下，我们怎么预测用户对电影的评分呢？假设我们的每个用户已经告诉了我们他们对于不同的电影特征的喜好程度($\theta^{{(j)}$)，那么根据$\theta}{(j)}$，以及已知的用户给电影的评分，我们可以大致判断某些电影中的特征向量的值：

最优化算法

给定各用户的喜好向量$\theta^{{(j)}$，我们以学习到电影的特征向量$x}{(i)}$为目的，以以下损失函数的最小化为优化目标（上面的式子是以学习到某电影i的特征向量为目的，下面的式子是一学习到所有电影的特征向量为目的）：

上一个部分讲的是如何通过电影的特征向量和电影评分学习到用户的喜好向量，而协同过滤是通过用户的喜好向量学习到电影的特征向量，因此这两个过程的结果可以互相为对方所用，因此可以将结果交给对方交互进行学习过程，以达到最终最优的效果。

协同过滤的最优化目标

当我们将上述的两种学习过程组合在一起，便可以同时学习用户的喜好向量和电影的特征向量，这便是我们的协同过滤算法的最优化目标：

协同过滤算法

低阶矩阵因式分解（Low Rank Matrix Factorization）。

假设我们有以下四个用户对五部电影的评分数据（有部分缺失），我们将用户的评分放入一个矩阵Y：

我们可以通过协同过滤算法获得用户对于电影的完整的评分矩阵（用拟合模型获得估计评分填入缺失部分）。而如果想通过向量化的方式直接获得这个评分矩阵，可以对X和$\Theta$作处理，如下图：

而这里通过$X*\Theta^T$的做法其实就是低阶矩阵因式分解，因为获得的运算结果的完整评分矩阵就是一个被称为低阶矩阵的东西（名称来源）。

来自《集体智慧编程》的非负矩阵因式分解（Non-Negative Matrix Factorization）的参考内容，以帮助读者更好理解矩阵因式分解的知识：

对矩阵进行因式分解，其本质就是要找到两个更小的矩阵，使得二者相乘可以得到原来的矩阵，而这两个更小的矩阵分别称为特征矩阵和权重矩阵。

那么我们如何来找两部彼此相似度高的电影呢？

对于每个电影，我们可以得到它的一个特征向量$x^{(i)}\in R^n$，如下图，只需找到特征向量之间距离小的两部电影即可：

均值标准化（Mean Normalization）

同样，对于如下评分矩阵，我们用协同过滤的算法去尝试进行估计：

我们仍然将评分放入一个Y矩阵中，并可以算出每一行的一个均值，将Y的均值提取出来$\mu$，并利用均值将Y矩阵进行相应地改变：保证每一行均值不变的情况下，使得评分值均匀分布，这便是均值标准化的步骤：

然后，我们将均值标准化后的Y矩阵假设为我们从用户那边得到的真实评分矩阵，从该矩阵中学习参数$\theta^{(j)}$和$x{(i)}$。于是，当我们要预测用户j对电影i的评分值时，就可以用$(\theta^{(i)})T(x^{(i)})+\mu_i$的方式来进行预测。那么这时，假若用户j的$\theta$为0向量（用户j没有对任何电影给过评分），我们即用其它用户对电影i的平均评分作为对用户j对电影i的评分值。

随机推荐

app后端用户登录api
app将用户名和密码发送到服务器,服务器验证用户名和密码都正确后,会在redis或memcached服务器中以用户id为键生成token字符串,然后服务器把token字符串和用户id都返回给客户端( ...
【HI AI：人机协同赋能未来系列】计算机是最好的左脑
AI:人机协同赋能未来系列]计算机是最好的左脑"> 编者按: 计算机领域的热点总是在不断更替,从大数据到云计算再到人工智能,这些热点的背后离不开专家学者们在这些领域一点一滴聚沙成塔的 ...
基础又重要的浮动（float）
浮动浮动的概念什么是浮动,他在css中占据什么样的位置网页布局的核心,就是用CSS来摆放盒子位置.如何把盒子摆放到合适的位置? 在css中有三种方式来定位位置普通文档标准流方式 (默认方式) ...
这几个IDEA高级调试技巧，用完就是香
一个项目启动两次测试分布式项目时,经常要一个项目启动2次,不用将一个项目打开多次启动,配置一下即可 1.点击Edit Configurations 2.勾选Allow parallel run 3. ...
NumPy——统计函数
引入模块import numpy as np 1.numpy.sum(a, axis=None)/a.sum(axis=None) 根据给定轴axis计算数组a相关元素之和,axis整数或元组,不指定 ...
harbor自动清理镜像
harbor定时清理镜像分享下最近写harbor仓库镜像自动清理脚本思路,很长时间不写shell脚本,这次的脚本也是匆匆写的,还有很多可优化点,感兴趣的可以参考自己优化下,写的不完善地方也希望指 ...
WebAPI-处理架构
带着问题去思考,大家好! 问题1:HTTP请求和返回相应的HTTP响应信息之间发生了什么? 1:首先是最底层,托管层,位于WebAPI和底层HTTP栈之间 2:其次是消息处理程序管道层,这里比如日志 ...
Taro_Mall 是一款多端开源在线商城小程序.
介绍 Taro_Mall是一款多端开源在线商城应用程序,后台是基于litemall基础上进行开发,前端采用Taro框架编写,现已全部完成小程序和h5移动端,后续会对APP,淘宝,头条,百度小程序进行适 ...
Python 获取MySql某个表所有字段名
在使用python导出数据库中数据的时候,往往除了插入的数据以外,还有表字段等信息需要导出,查阅了资料后发现了2种方法第一种:在mysql自带的表里查询,这个表保存了每张表的字段信息,可以用pymy ...
《一步步成为 Hacker_Day 01》
环境搭建传统运行模式 - 一台机器同时只能运行一个操作系统 |:----------|----------:| | 应用程序 | 应用程序 | |:----------|----------:| | ...

推荐系统（Recommender Systems）