1分钟了解协同过滤,pm都懂了
project架构方向的程序猿。看到推荐/搜索/广告等和算法相关的技术,心中或多或少有一丝胆怯。但认真研究之后。发现事实上没有这么难。
今天的1分钟系列,给大家介绍下推荐系统中的“协同过滤”,绝无不论什么公式,保证大伙弄懂。
什么是协同过滤(Collaborative Filtering)?
答:通过找到兴趣相投。或者有共同经验的群体。来向用户推荐感兴趣的信息。
举例。怎样协同过滤。来对用户A进行电影推荐?
答:简要过程例如以下
找到用户A(user_id_1)的兴趣爱好
找到与用户A(user_id_1)具有同样电影兴趣爱好的用户群体集合Set<user_id>
找到该群体喜欢的电影集合Set<movie_id>
将这些电影Set<Movie_id>推荐给用户A(user_id_1)
详细实施步骤怎样?
答:简要过程例如以下
(1)画一个大表格。横坐标是全部的movie_id,纵坐标全部的user_id,交叉处代表这个用户喜爱这部电影
http://mmbiz.qpic.cn/mmbiz_jpg/YrezxckhYOyX5wfsD9TdibFmicOBhTr04AIIc1InhzTkQl83wQiajKd1QqicphMXb76HGSEhZ9JIU7XEUavaUicxicFw/640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1" alt="640?
wx_fmt=jpeg&wxfrom=5&wx_lazy=1" />
如上表:
横坐标,如果有10w部电影。所以横坐标有10w个movie_id。数据来源自数据库
纵坐标,如果有100w个用户,所以纵坐标有100w个user_id,数据也来自数据库
交叉处,“1”代表用户喜爱这部电影,数据来自日志
画外音:什么是“喜欢”,须要人为定义,比如浏览过,查找过,点赞过,反正日志里有这些数据
(2)找到用户A(user_id_1)的兴趣爱好
https://mmbiz.qpic.cn/mmbiz_jpg/YrezxckhYOyX5wfsD9TdibFmicOBhTr04ASib9sXy8gXiaTr7TpxRrcxjgPtg2ARV34ut1bNmahgl1zscv2ApzsD8g/640?
wx_fmt=jpeg" alt="640?
wx_fmt=jpeg" />
如上表,能够看到,用户A喜欢电影{m1, m2, m3}
(3)找到与用户A(user_id_1)具有同样电影兴趣爱好的用户群体集合Set<user_id>
wx_fmt=jpeg" alt="640?
wx_fmt=jpeg" />
如上表。能够看到,喜欢{m1, m2, m3}的用户,除了u1。还有{u2, u3}
(4)找到该群体喜欢的电影集合Set<movie_id>
如上表。具备同样喜好的用户群里{u2, u3},还喜好的电影集合是{m4, m5}
画外音:“协同”就体如今这里。
(5)未来用户A(use_id_1)来訪问站点时,要推荐电影{m4, m5}给ta。
协同过滤大致原理如上。希望大家有收获。
推荐文章:
1分钟了解协同过滤,pm都懂了的更多相关文章
- 推荐系统算法学习(一)——协同过滤(CF) MF FM FFM
https://blog.csdn.net/qq_23269761/article/details/81355383 1.协同过滤(CF)[基于内存的协同过滤] 优点:简单,可解释 缺点:在稀疏情况下 ...
- 推荐召回--基于用户的协同过滤UserCF
目录 1. 前言 2. 原理 3. 数据及相似度计算 4. 根据相似度计算结果 5. 相关问题 5.1 如何提炼用户日志数据? 5.2 用户相似度计算很耗时,有什么好的方法? 5.3 有哪些改进措施? ...
- [Recommendation System] 推荐系统之协同过滤(CF)算法详解和实现
1 集体智慧和协同过滤 1.1 什么是集体智慧(社会计算)? 集体智慧 (Collective Intelligence) 并不是 Web2.0 时代特有的,只是在 Web2.0 时代,大家在 Web ...
- 协同过滤 CF & ALS 及在Spark上的实现
使用Spark进行ALS编程的例子可以看:http://www.cnblogs.com/charlesblc/p/6165201.html ALS:alternating least squares ...
- CF(协同过滤算法)
1 集体智慧和协同过滤 1.1 什么是集体智慧(社会计算)? 集体智慧 (Collective Intelligence) 并不是 Web2.0 时代特有的,只是在 Web2.0 时代,大家在 Web ...
- 协同过滤(CF)算法
1 集体智慧和协同过滤 1.1 什么是集体智慧(社会计算)? 集体智慧 (Collective Intelligence) 并不是 Web2.0 时代特有的,只是在 Web2.0 时代,大家在 Web ...
- 协同过滤的R语言实现及改进
欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 协同过滤算法是推荐系统最常用的算法之一,本文将介绍一种方法来使它可以在大型数据集上快速训练. 协同过滤算法(CF)是构建推荐系统时最常用的技 ...
- 从item-base到svd再到rbm,多种Collaborative Filtering(协同过滤算法)从原理到实现
http://blog.csdn.net/dark_scope/article/details/17228643 〇.说明 本文的所有代码均可在 DML 找到,欢迎点星星. 一.引入 推荐系统(主要是 ...
- 推荐召回--基于物品的协同过滤:ItemCF
目录 1. 前言 2. 原理&计算&改进 3. 总结 1. 前言 说完基于用户的协同过滤后,趁热打铁,我们来说说基于物品的协同过滤:"看了又看","买了又 ...
随机推荐
- Eclipse警告:The serializable class XXX does not declare a static final serialVersionUID field of type long
serialVersionUID作用: 序列化时为了保持版本的兼容性,即在版本升级时反序列化仍保持对象的唯一性. 在Eclipse中可以自动生成,有两种生成方式: 一个是默认的1L,比如:privat ...
- iOS - 转场时 appear 与 disappear 的调用顺序探索
不同的转场方式 A.B viewDidDisappear调用的流程不同 在A页面跳转到B页面的过程中 A 的 viewDidDisappear 方法和 B 的 viewDidAppear 谁先调用? ...
- javaBean的理解总结
javaBean简单理解:javaBean在MVC设计模型中是model,又称模型层,在一般的程序中,我们称它为数据层,就是用来设置数据的属性和一些行为,然后我会提供获取属性和设置属性的get/set ...
- 详解SQL中的GROUP BY语句
下面为您介绍SQL语句中GROUP BY 语句,GROUP BY 语句用于结合合计函数,根据一个或多个列对结果集进行分组. 希望对您学习SQL语句有所帮助. SQL GROUP BY 语法 SELEC ...
- 使用JDBC插入数据到ORACLE,使用标识列自增列
不同于SQL Server的是,Oracle中插入数据的时候,没有自增列或者是标识列,但是,我们又不想显式的进行主键的插入,这里,必须在Oracle数据库中指定一个标识列,或者说是一个序列.具体方法如 ...
- 关于windows下基于php7.0.2下编写的第一个扩展
网上的教程是比较多的,但是基于php7+windows的教程非常之少,通过几天的摸索及参考很多资料,终于发现如下可以运行. php7要求使用vc2015,同时安装sdk,我使用的是8.1的window ...
- 2-1 nodejs和npm的安装和环境搭建
1.安装node.js (最新已经集成npm) https://nodejs.org/en/ 2.升级npm $ npm install -g npm $ cnpm install -g cnpm ...
- OpenMax概述
一.OpenMax简介 OpenMAX是一个多媒体应用程序的标准.由NVIDIA公司和Khronos™在2006年推出. 它是无授权费的.跨平台的C语言程序接口序列,这些接口对音频.视频.静态图片的常 ...
- ASP.NET MVC 使用Redis共享Session
储存模式 1.InProc模式 这是ASP.NET默认的Session管理模式,在应用进程内维护Session. 2.StateServer模式 这是在服务器装了.NET环境后自带的一个StateSe ...
- Unity3D笔记十五 碰撞、移动
碰撞 Collision. [kəˈliʒən] 碰撞:冲突:(意见,看法)的抵触:(政党等的)倾轧 选择一个需要添加碰撞器的游戏对象后 Component->Physics- Unity一共为 ...