推荐系统实践 0x0f AutoRec

从这一篇开始，我们开始学习深度学习推荐模型，与传统的机器学习相比，深度学习模型的表达能力更强，并且更能够挖掘出数据中潜藏的模式。另外。深度学习模型结构也非常灵活，能够根据业务场景和数据结构进行调整。还是原来的样子，我会按照原理以及代码实现，再就是一些优缺点进行逐一介绍。

AutoRec

AutoRec可以说是最小的深度学习推荐系统了，它是一种单隐层神经网络推荐模型，将自编码器与协同过滤相结合。那么什么是自编码器呢？自编码器可以看做是一种压缩维度的工具，无论是图像、音频、还是文本，都能够通过自编码器转换成向量形式进行表达，假设我们的输入（无论是图像、音频等等）的数据向量是$r$，那么希望通过自编码器的输出向量尽可能接近原来的数据输入$r$。

假设自编码器的重建函数是$h(r;\theta)$，那么自编码器的目标函数是：

\[\min_{\theta}\sum_{r\in S}||r-h(r;\theta)||_2^2
\]

其中的$S$就是所有数据输入的向量结合。

一般来说，重建函数$h(r;\theta)$的参数量远远小于输入向量的维度，所以自编码器相当于完成了数据压缩和降维的工作。并且，通过自编码器生成的输出向量，使得自编码器的编码过程有一定的泛化能力，可以预测丢失的维度信息，这也是自编码器能够用于推荐系统的原因。

模型结构

在之前的文章中我们介绍了协同过滤的关键——共现矩阵。就是因为由$m$个用户以及$n$的物品形成的$m\times n$的共现矩阵维度太高，所以我们需要使用一个重建函数对共现矩阵里面的评分向量进行压缩，然后经过评分预估以及排序之后形成最终的排序列表。AutoRec使用了单隐层神经网络结构来实现自编码器的功能。如下图所示。

蓝色神经元代表模型的$k$维单隐层，也就是压缩之后的向量，$V$以及$W$代表从输入到隐层、从隐层到输出层的参数矩阵。那么写成重建函数的形式就是

\[h(r;\theta)=f(W\cdot g(Vr+\mu)+b)
\]

$f(\cdot)$以及$g(\cdot)$为输出层和隐层神经元的激活函数。为了防止重构函数（单隐层神经网络、或者说三层神经网络）的过拟合，再加上$L2$正则化项，那么AutoRec的目标函数就是

\[\min_{\theta}\sum_{r=1}^{n}||r^{(i)}-h(r;\theta)||_O^2+\frac{\lambda}{2}(||W||_{F}^{2}+|V||_{F}^2)
\]

$||\cdot||_F$为Frobenius范数.

局限性

无法进行特征交叉，表达能力相对于后面更复杂的深度学习模型还是表达能力不足。由于AutoRec的简单明了，作为入门的深度学习推荐模型再合适不过了。

代码

## 模型部分

class Autorec(nn.Module):

    def __init__(self,args, num_items):

        super(Autorec, self).__init__()

        self.args = args

        #self.num_users = num_users

        self.num_items = num_items

        self.hidden_units = args.hidden_units

        self.lambda_value = args.lambda_value

        self.encoder = nn.Sequential(

            nn.Linear(self.num_items, self.hidden_units),

            nn.Sigmoid()

        )

        self.decoder = nn.Sequential(

            nn.Linear(self.hidden_units, self.num_items),

        )

    def forward(self,torch_input):

        encoder = self.encoder(torch_input)

        decoder = self.decoder(encoder)

        return decoder

## 损失函数部分

def loss(self, decoder, input, optimizer, mask_input):

    cost = 0

    temp2 = 0

    cost += ((decoder - input) * mask_input).pow(2).sum()

    rmse = cost

    for i in optimizer.param_groups:

        for j in i['params']:

            # print(type(j.data), j.shape,j.data.dim())

            if j.data.dim() == 2:

                temp2 += torch.t(j.data).pow(2).sum()

    cost += temp2 * self.lambda_value * 0.5

    return cost, rmse

参考

AutoRec: Autoencoders Meet Collaborative Filtering

Github:NeWnIx5991/AutoRec-for-CF

随机推荐

abp(net core)+easyui+efcore实现仓储管理系统——出库管理之六(五十五)
abp(net core)+easyui+efcore实现仓储管理系统目录 abp(net core)+easyui+efcore实现仓储管理系统--ABP总体介绍(一) abp(net core)+ ...
php 把一个数随机分成n份
$money_total=100; $personal_num=10; $min_money=0.01; $money_right=$money_total; $randMoney=[]; for($ ...
python-基础入门-7基础
1.语法和语句 Python中有一些基本规则和特殊字符 1)#符号之后的表示注释 2)\n符号表示换行 3)\继续上一行的内容推荐使用括号,这样可读性更好 4):将两个语句链接在一行中类似于c语言 ...
RabbitMQ+Redis模拟手机验证码登录
RabbitMQ+Redis模拟手机验证码登录依赖 <dependency> <groupId>org.springframework.boot</groupId> ...
一个神奇的bug：OOM？优雅终止线程？系统内存占用较高？
摘要:该项目是DAYU平台的数据开发(DLF),数据开发中一个重要的功能就是ETL(数据清洗).ETL由源端到目的端,中间的业务逻辑一般由用户自己编写的SQL模板实现,velocity是其中涉及的一种 ...
JAVA中删除文件夹下及其子文件夹下的某类文件
##定时删除拜访图片 ##cron表达式秒分时天月 ? ##每月1日整点执行 CRON1=0 0 0 1 * ? scheduled.enable1=false ##图片路径 filePat ...
Django的model.py
什么是ORM? 对象关系映射类 >>> 表对象 >>> 表记录对象的属性 >>> 一条记录某个字段对应的值 django的orm不能够自动帮 ...
C#（二）基础篇—操作符
2020-12-02 本随笔为个人复习巩固知识用,多从书上总结与理解得来,如有错误麻烦指正 1.数学操作符 int a=2,b=3,c=0; float d=0; c=a+b; //c=5 c++; ...
创建实验楼课程app模块以及配置图片路径
1.创建course模型 1.1 创建用户模型course python ../manage.py startapp course # 创建course模型 1.2 在setting.py中注册cou ...
CPU实现原子操作的原理
586之前的CPU, 会通过LOCK锁总线的形式来实现原子操作. 686开始则提供了存储一致性(Cache coherence), 这是多处理的基础, 也是原子操作的基础. 1. 存储的粒度存储的 ...

推荐系统实践 0x0f AutoRec

AutoRec

模型结构

推荐过程

局限性

代码

参考

推荐系统实践 0x0f AutoRec的更多相关文章

随机推荐

热门专题