利用python实现电影推荐

“协同过滤”是推荐系统中的常用技术，按照分析维度的不同可实现“基于用户”和“基于产品”的推荐。

以下是利用python实现电影推荐的具体方法，其中数据集源于《集体编程智慧》一书，后续的编程实现则完全是自己实现的（原书中的实现比较支离、难懂）。

这里我采用的是“基于产品”的推荐方法，因为一般情况下，产品的种类往往较少，而用户的数量往往非常多，“基于产品”的推荐程序可以很好的减小计算量。

其实基本的思想很简单：

首先读入数据，形成用户-电影矩阵，如图所示：矩阵中的数据为用户（横坐标）对特定电影（纵坐标）的评分。

其次根据用户-电影矩阵计算不同电影之间的相关系数（一般用person相关系数），形成电影-电影相关度矩阵。

其次根据电影-电影相关度矩阵，以及用户已有的评分，通过加权平均计算用户未评分电影的预估评分。例如用户对A电影评3分、B电影评4分、C电影未评分，而C电影与A电影、B电影的相关度分别为0.3和0.8，则C电影的预估评分为(0.3*3+0.8*4)/(0.3+0.8)。

最后对于每一位用户，提取其未评分的电影并按预估评分值倒序排列，提取前n位的电影作为推荐电影。

以下为程序源代码，大块的注释还是比较详细的，便于理解各个模块的作用。此外，程序用到了pandas和numpy库，实现起来会比较简洁，因为许多功能如计算相关系数、排序等功能在这些库中已有实现，直接拿来用即可。

import pandas as pd

import numpy as np

#read the data

data={'Lisa Rose': {'Lady in the Water': 2.5, 'Snakes on a Plane': 3.5,

 'Just My Luck': 3.0, 'Superman Returns': 3.5, 'You, Me and Dupree': 2.5},

'Gene Seymour': {'Lady in the Water': 3.0, 'Snakes on a Plane': 3.5,

 'Just My Luck': 1.5, 'The Night Listener': 3.0},

'Michael Phillips': {'Lady in the Water': 2.5, 'Snakes on a Plane': 3.0,

 'Superman Returns': 3.5, 'The Night Listener': 4.0},

'Claudia Puig': {'Snakes on a Plane': 3.5, 'Just My Luck': 3.0,

 'The Night Listener': 4.5, 'You, Me and Dupree': 2.5},

'Mick LaSalle': {'Just My Luck': 2.0, 'Lady in the Water': 3.0,'Superman Returns': 3.0, 'The Night Listener': 3.0, 'You, Me and Dupree': 2.0},

'Jack Matthews': {'Snakes on a Plane': 4.0, 'The Night Listener': 3.0, 'Superman Returns': 5.0, 'You, Me and Dupree': 3.5},

'Toby': {'Snakes on a Plane':4.5,'You, Me and Dupree':1.0,'Superman Returns':4.0}}

#clean&transform the data

data = pd.DataFrame(data)

#0 represents not been rated

data = data.fillna(0)

#each column represents a movie

mdata = data.T

#calculate the simularity of different movies, normalize the data into [0,1]

np.set_printoptions(3)

mcors = np.corrcoef(mdata, rowvar=0)

mcors = 0.5+mcors*0.5

mcors = pd.DataFrame(mcors, columns=mdata.columns, index=mdata.columns)

#calculate the score of every item of every user

#matrix:the user-movie matrix

#mcors:the movie-movie correlation matrix

#item:the movie id

#user:the user id

#score:score of movie for the specific user

def cal_score(matrix,mcors,item,user):

    totscore = 0

    totsims = 0

    score = 0

    if pd.isnull(matrix[item][user]) or matrix[item][user]==0:

        for mitem in matrix.columns:

            if matrix[mitem][user]==0:

                continue

            else:

                totscore += matrix[mitem][user]*mcors[item][mitem]

                totsims += mcors[item][mitem]

        score = totscore/totsims

    else:

        score = matrix[item][user]

    return score

#calculate the socre matrix

#matrix:the user-movie matrix

#mcors:the movie-movie correlation matrix

#score_matrix:score matrix of movie for different users

def cal_matscore(matrix,mcors):

    score_matrix = np.zeros(matrix.shape)

    score_matrix = pd.DataFrame(score_matrix, columns=matrix.columns, index=matrix.index)

    for mitem in score_matrix.columns:

        for muser in score_matrix.index:

            score_matrix[mitem][muser]  = cal_score(matrix,mcors,mitem,muser)

    return score_matrix

#give recommendations: depending on the score matrix

#matrix:the user-movie matrix

#score_matrix:score matrix of movie for different users

#user:the user id

#n:the number of recommendations

def recommend(matrix,score_matrix,user,n):

    user_ratings = matrix.ix[user]

    not_rated_item = user_ratings[user_ratings==0]

    recom_items = {}

    #recom_items={'a':1,'b':7,'c':3}

    for item in not_rated_item.index:

        recom_items[item] = score_matrix[item][user]

    recom_items = pd.Series(recom_items)

    recom_items = recom_items.sort_values(ascending=False)

    return recom_items[:n]  

#main

score_matrix = cal_matscore(mdata,mcors)

for i in range(10):

    user = input(str(i)+' please input the name of user:')

    print recommend(mdata,score_matrix,user,2)

利用python实现电影推荐的更多相关文章

转利用python实现电影推荐
“协同过滤”是推荐系统中的常用技术,按照分析维度的不同可实现“基于用户”和“基于产品”的推荐. 以下是利用python实现电影推荐的具体方法,其中数据集源于<集体编程智慧>一书,后续的编程 ...
利用Surprise包进行电影推荐
Surprise(Simple Python Recommendation System Engine)是一款推荐系统库,是scikit系列中的一个.简单易用,同时支持多种推荐算法(基础算法.协同过滤 ...
【大数据 Spark】利用电影观看记录数据,进行电影推荐
利用电影观看记录数据,进行电影推荐. 目录利用电影观看记录数据,进行电影推荐. 准备 1.任务描述: 2.数据下载 3.部分数据展示实操 1.设置输入输出路径 2.配置spark 3.读取Rati ...
基于物品的协同过滤item-CF 之电影推荐 python
推荐算法有基于协同的Collaboration Filtering:包括 user Based和item Based:基于内容 : Content Based 协同过滤包括基于物品的协同过滤和基于用户 ...
Python实现个性化推荐二
基于内容的推荐引擎是怎么工作的基于内容的推荐系统,正如你的朋友和同事预期的那样,会考虑商品的实际属性,比如商品描述,商品名,价格等等.如果你以前从没接触过推荐系统,然后现在有人拿枪指着你的头,强迫你 ...
利用Python，四步掌握机器学习
为了理解和应用机器学习技术,你需要学习 Python 或者 R.这两者都是与 C.Java.PHP 相类似的编程语言.但是,因为 Python 与 R 都比较年轻,而且更加“远离”CPU,所以它们显得 ...
利用python 掌握机器学习的过程
转载:http://python.jobbole.com/84326/ 偶然看到的这篇文章,觉得对我挺有引导作用的.特此跟大家分享一下. 为了理解和应用机器学习技术,你需要学习 Python 或者 R ...
利用python进行数据分析－－（阅读笔记一）
以此记录阅读和学习<利用Python进行数据分析>这本书中的觉得重要的点! 第一章:准备工作 1.一组新闻文章可以被处理为一张词频表,这张词频表可以用于情感分析. 2.大多数软件是由两部分 ...
《利用python进行数据分析》读书笔记 --第一、二章准备与例子
http://www.cnblogs.com/batteryhp/p/4868348.html 第一章准备工作今天开始码这本书--<利用python进行数据分析>.R和python都得 ...

随机推荐

git 更新代码到本地
正规流程 git status(查看本地分支文件信息,确保更新时不产生冲突) git checkout – [file name] (若文件有修改,可以还原到最初状态; 若文件需要更新到服务器上,应该 ...
dfs的一个小实现（啊哈算法的例题）
给定n个盒子,将n个小球放进这些盒子里,判断都有多少种情况写深度优先搜索最重要的是理解当前步怎么做,下一步就当系统已经帮你实现好了(因为只要写好当前步,下一步解决方法和当前步是一样的). #incl ...
DVWA-CSRF
Low等级 image 抓包 image 正常跳转 image image 在这里我们把密码改为qwer image image image image image ...
php 中输入输出提交
</head> <body> 输出的两个位置 <? echo $_POST['sub']; ?> <form action="" meth ...
创建属性Attribute
XmlDocument xmlDoc = new XmlDocument(); xmlDoc.Load(xmlPath); var root = xmlDoc.DocumentElement;//取到 ...
在MongoDB中执行查询、创建索引
1. MongoDB中数据查询的方法 (1)find函数的使用: (2)条件操作符: (3)distinct找出给定键所有不同的值: (4)group分组: (5)游标: (6)存储过程. 文档查找 ...
Python学习之路【第三篇】--集合
语法结构: set1.issubset(set2)判断集合set1是否为set2的子集,返回布尔值. ? 1 2 3 4 5 6 s1 = {'Java', 'PHP', 'Python', 'C++ ...
pycharm 配置使用
1. 如何添加Package File-> Settings -> Project :XXXX -> Project Interpreter 点右边的"+"号,输 ...
learning scala write to file
scala 写文件功能: scala> import java.io.PrintWriterimport java.io.PrintWriter scala> val outputFile ...
【原创】QT 打印输出
list类 qDebug 的两种用法 #include <QDebug> int main(int argc,char *argv[]) { QList<int> list; ...

利用python实现电影推荐

利用python实现电影推荐的更多相关文章

随机推荐

热门专题