主要内容:

Spotify是个类似酷我音乐的音乐站点。做个性化音乐推荐和音乐消费。作者利用deep learning结合协同过滤来做音乐推荐。

详细内容:

1. 协同过滤

基本原理:某两个用户听的歌曲都差点儿相同,说明这两个用户听歌的兴趣、品味类似。某两个歌曲,被同一群人听,说明这两个歌曲风格类似。
缺点:
(1)没有利用歌曲本身的特征(信息)
(2)无法对“层级”的item进行处理,对于歌曲来说,这样的层级关系体如今:专辑—主打歌—副歌,上面,这几种因素并非同等重要的
(3)冷启动问题:协同过滤的方法用用户行为来进行推荐,没有行为的用户和item怎么办?

2. 基于内容的推荐

spotify正在进行的尝试,用内容之间的关系(相似度)来进行推荐。content-based recommendation,除了用用户行为信息之外,歌曲内容的信息也能够被用来计算item之间的相似度。

而作者在这里要尝试的是,依据歌曲本身的音频信号来计算歌曲之间的相似度。

DL擅好处理音频、图像等原始信息,作者用DL在这里来处理歌曲的音频信息,从而计算歌曲之间的相似度。(个人补充:同一时候,用户听得歌曲列表,也能够看做是一首歌曲,这首歌曲也能够计算和其它歌曲的相似度。这样就计算了用户和某个歌曲的相似程度。进一步作为给当前用户做推荐的理由)


3. predicting listening preference with deep learning

将歌曲音频信息、以及歌曲的其它标记信息(专辑、作者等)通过深度神经网络的方式映射到一个低维latent space中,用这个低维空间向量来表示歌曲。

神经网络的结构例如以下:


最左端是音频输入层。然后是连个卷及网络,然后是几个全连接的正常神经网络。作者并没有解释为什么是这种网络结构。最后一层40个节点。输出是vector_exp算法的结果,不是softmax。只是从名字上看貌似他俩都差点儿相同,可能一个实现性函数。还有一个是非线性的函数。


用神经网络的一个问题就是:神经网络的输出是定长的,而歌曲音频(不管从时间还是从文件大小来看)都是变长的,怎样把边长的原始输入映射到定长的神经网络输入其中?——这个也是NLP领域在用神经网络的时候遇到的问题。作者的作法非常粗糙也非常干脆:把音频文件分成3秒钟一个段,然后各段的输入数值取平均值,作为整个歌曲的输入向量。

对于一个用户。历史上听过非常多歌曲,也是这么处理,终于得到用户的歌曲向量。


4. 训练

用MSE准则来训练。

另一个问题,DL是有监督学习方法。那么神经网络的标准输出是什么?也就是。对于一个给定歌曲,最后40维的标准输出结果是什么?我理解。文章中的意思是标准协同过滤模型、通过LDA等降维之后。当前歌曲相应的维度输出结果。那么,接下来的问题,既然用矩阵分解的结果作为标准,作者为什么还费事训练DL呢?一方面是解决冷启动问题(对于新歌的预測),另一方面,对音频信息与矩阵分解结果做映射,可能就像作者文章最開始说的。也能利用音频本身的信息吧。

在模型应用上面。训练好神经网络之后,对于一个新歌。可以通过既定的网络參数计算得出这个歌曲的相应的latent representation(40维输出结果);而对于一个用户,通过对他历史听歌习惯来进行计算。也能计算这样一个40维的结果,两个向量夹角就能计算这个用户是否是对这个歌曲感兴趣。

5. 其它尝试

作者还做了其它尝试。包含用不同的协同过滤模型分别训练出来40维结果。然后将这些向量拼起来。或者尝试用很多其它层的神经网络。



6. what is it learning?


分析详细的学习结果:音频片段等等。


完。


转载请注明出处:http://blog.csdn.net/xceman1997/article/details/38475083

【deep learning学习笔记】Recommending music on Spotify with deep learning的更多相关文章

  1. 【deep learning学习笔记】注释yusugomori的DA代码 --- dA.h

    DA就是“Denoising Autoencoders”的缩写.继续给yusugomori做注释,边注释边学习.看了一些DA的材料,基本上都在前面“转载”了.学习中间总有个疑问:DA和RBM到底啥区别 ...

  2. Deep Q-Network 学习笔记(二)—— Q-Learning与神经网络结合使用(有代码实现)

    参考资料: https://morvanzhou.github.io/ 非常感谢莫烦老师的教程 http://mnemstudio.org/path-finding-q-learning-tutori ...

  3. Deep Q-Network 学习笔记(一)—— Q-Learning 学习与实现过程中碰到的一些坑

    这方面的资料比较零散,学起来各种碰壁,碰到各种问题,这里就做下学习记录. 参考资料: https://morvanzhou.github.io/ 非常感谢莫烦老师的教程 http://mnemstud ...

  4. [Machine Learning]学习笔记-Logistic Regression

    [Machine Learning]学习笔记-Logistic Regression 模型-二分类任务 Logistic regression,亦称logtic regression,翻译为" ...

  5. Machine Learning 学习笔记

    点击标题可转到相关博客. 博客专栏:机器学习 PDF 文档下载地址:Machine Learning 学习笔记 机器学习 scikit-learn 图谱 人脸表情识别常用的几个数据库 机器学习 F1- ...

  6. Deep Learning 学习笔记(8):自编码器( Autoencoders )

    之前的笔记,算不上是 Deep Learning, 只是为理解Deep Learning 而需要学习的基础知识, 从下面开始,我会把我学习UFDL的笔记写出来 #主要是给自己用的,所以其他人不一定看得 ...

  7. machine learning学习笔记

    看到Max Welling教授主页上有不少学习notes,收藏一下吧,其最近出版了一本书呢还,还没看过. http://www.ics.uci.edu/~welling/classnotes/clas ...

  8. Recommending music on Spotify with deep learning 采用深度学习算法为Spotify做基于内容的音乐推荐

    本文参考http://blog.csdn.net/zdy0_2004/article/details/43896015译文以及原文file:///F:/%E6%9C%BA%E5%99%A8%E5%AD ...

  9. [置顶] Deep Learning 学习笔记

    一.文章来由 好久没写原创博客了,一直处于学习新知识的阶段.来新加坡也有一个星期,搞定签证.入学等杂事之后,今天上午与导师确定了接下来的研究任务,我平时基本也是把博客当作联机版的云笔记~~如果有写的不 ...

随机推荐

  1. Javascript的数组操作[转]

    1.shift:删除原数组第一项,并返回删除元素的值:如果数组为空则返回undefined var a = [1,2,3,4,5]; var b = a.shift(); // 结果 a:[2,3,4 ...

  2. linux LVM 逻辑卷

    fdisk pvcreate vgcreate lvcreate 查看显示 创建 删除 扩容 激活 扫描查找 LV lvdisplay lvcreate lvremove lvextend lvcha ...

  3. WebRTC 音视频开发

    WebRTC 音视频开发 webrtc   Android IOS WebRTC 音视频开发总结(七八)-- 为什么WebRTC端到端监控很关键? 摘要: 本文主要介绍WebRTC端到端监控(我们翻译 ...

  4. CDC不同模式在ODI中体现系列之一 同步模式

    CDC不同模式在ODI中体现系列之一 同步模式 Oracle Database Change Data Capture feature 变化数据捕获是一个通称,是用来描述捕捉增量变化应用到数据存储.随 ...

  5. NOI2014 Day2

    NOI2014 Day2 动物园 题目描述:给出一个字符串(长度为\(Len\)),设\(num[i]\)为字符串的前\(i\)个字符构成的子串(\(A\))中,满足\(A\)的前\(L\)个字符既是 ...

  6. C++中的句柄类

    初次在<C++ Primer>看到句柄,不是特别理解.在搜索相关资料后,终于有了点头绪. 首先明白句柄要解决什么问题.参考文章<C++ 沉思录>阅读笔记——代理类 场景: 我们 ...

  7. 10.30 NFLS-NOIP模拟赛 解题报告

    总结:今天去了NOIP模拟赛,其实是几道USACO的经典的题目,第一题和最后一题都有思路,第二题是我一开始写了个spfa,写了一半中途发现应该是矩阵乘法,然后没做完,然后就没有然后了!第二题的暴力都没 ...

  8. _.each的用法2

    有这样一个需求:一个对象数组: 内容如下: {[ {id:"ssss",position:"4"}, {id:"ssss",position ...

  9. USB OTG简单介绍

    1 引言 随着USB2.0版本号的公布,USB越来越流行,已经成为一种标准接口.如今,USB支持三种传输速率:低速(1.5Mb/s).全速(12Mb/s)和快速(480Mb/s),四种传输类型:块传输 ...

  10. HTML之学习笔记(三)文本标签

    标题标签 html的标题标签从h1~h6共六个级别,权值不断降低,即不断变小,不用使用CSS控制来取代h标签,因为网页搜索引擎通过搜索到你的页面,找到你页面的h标签并为h标签建立索引,如果h标签被替代 ...