基于Spark的电影推荐系统(电影网站)
第一部分-电影网站:
软件架构: SpringBoot+Mybatis+JSP
项目描述:主要实现电影网站的展现 和 用户的所有动作的地方
技术选型:
| 技术 | 名称 | 官网 |
|---|---|---|
| Spring Boot | 容器 | https://projects.spring.io/spring-boot/ |
| Spring MVC | MVC框架 | http://docs.spring.io/spring/docs/current/spring-framework-reference/htmlsingle/#mvc |
| MyBatis | ORM框架 | http://www.mybatis.org/mybatis-3/zh/index.html |
| MyBatis Generator | 代码生成 | http://www.mybatis.org/generator/index.html |
| PageHelper | MyBatis物理分页插件 | http://git.oschina.net/free/Mybatis_PageHelper |
| Druid | 数据库连接池 | https://github.com/alibaba/druid |
| Redis (后期) | 分布式缓存数据库 | https://redis.io/ |
| Elasticsearch(后期) | 分布式全文搜索引擎 | http://lucene.apache.org/solr/ https://www.elastic.co/ |
| Logback | 日志组件 | https://logback.qos.ch/ |
| Swagger2 | 接口测试框架 | http://swagger.io/ |
| Maven | 项目构建管理 | http://maven.apache.org/ |
主要开发工具:
- MySql: 数据库
- Tomcat: 应用服务器
- Git: 版本管理
- IntelliJ IDEA: 开发IDE
开发环境
- JDK 1.8+
- Maven 3.3.9
- Mysql 5.7.20+
- Lombok , 需要开发环境(IDEA或eclipse)支持
项目架构
项目流程图
数据表设计
ps:推荐指的是spark推荐模型进行处理的表
- alstab 个人用户的推荐强度表 推荐 ps:用户登陆后,选取用户id关联的电影id 进行电影推荐
- similartab 相似的电影 推荐*
- topdefaultmovies 默认电影
- rectab 用户评价的时候将相似的电影写入此表
- browse 1. 新用户注册时喜欢的电影 2. 点击喜欢按钮的电影
- review 评价过的电影
所有数据表
admin 管理员表
id name password role
role 0代表超级管理员,1代表普通
alstab 强度表===推荐系统得到
userid movieid rating(评分)
browse 浏览表
id userid movieids browsetime (浏览时间)
category 电影类型
id category
movie 电影详情 50581条数据
movieid
moviename 电影名称
showyear上映时间
nation 国家
director 导演
leadactors 主演
screenwriter 编剧
picture 电影海报
averating 平均评分
numrating 多少人看过
description 描述
typelist 电影类型
backpost 电影背景图片
moviecategory 电影所属类型 88870条数据
id
movieid
categoryid
rectab
userid
movieids
review 用户对电影的评分,和评价
id
userid
movieid
content
star
reviewtime
similartab 类似度 68908条数据
itemid1
itemid2
similar
topdefaultmovies 默认的top
id
movieid
moviename
user 用户表
userid
username
password
email
registertime
lastlogintime
用户流程分析
步骤1:
开始直接从topdefaultmovies表中取出前五部电影
- 使用top表的movieid去关联查询movie表的数据
步骤2:
登录:
- 从ALS强度表中查询推荐强度8以上的电影
(这个是每个用户来说的,也就是说,带上userid去查询的强度表的)
更多文章:基于Spark的电影推荐系统:https://blog.csdn.net/liuge36/column/info/29285
基于Spark的电影推荐系统(电影网站)的更多相关文章
- 基于Spark的电影推荐系统(实战简介)
写在前面 一直不知道这个专栏该如何开始写,思来想去,还是暂时把自己对这个项目的一些想法 和大家分享 的形式来展现.有什么问题,欢迎大家一起留言讨论. 这个项目的源代码是在https://github. ...
- 基于Spark Mllib,SparkSQL的电影推荐系统
本文测试的Spark版本是1.3.1 本文将在Spark集群上搭建一个简单的小型的电影推荐系统,以为之后的完整项目做铺垫和知识积累 整个系统的工作流程描述如下: 1.某电影网站拥有可观的电影资源和用户 ...
- 基于Spark的电影推荐系统(推荐系统~2)
第四部分-推荐系统-数据ETL 本模块完成数据清洗,并将清洗后的数据load到Hive数据表里面去 前置准备: spark +hive vim $SPARK_HOME/conf/hive-site.x ...
- 基于Spark的电影推荐系统(推荐系统~4)
第四部分-推荐系统-模型训练 本模块基于第3节 数据加工得到的训练集和测试集数据 做模型训练,最后得到一系列的模型,进而做 预测. 训练多个模型,取其中最好,即取RMSE(均方根误差)值最小的模型 说 ...
- 基于Spark的电影推荐系统(推荐系统~7)
基于Spark的电影推荐系统(推荐系统~7) 22/100 发布文章 liuge36 第四部分-推荐系统-实时推荐 本模块基于第4节得到的模型,开始为用户做实时推荐,推荐用户最有可能喜爱的5部电影. ...
- 基于Spark的电影推荐系统(推荐系统~1)
第四部分-推荐系统-项目介绍 行业背景: 快速:Apache Spark以内存计算为核心 通用 :一站式解决各个问题,ADHOC SQL查询,流计算,数据挖掘,图计算 完整的生态圈 只要掌握Spark ...
- 基于Mahout的电影推荐系统
基于Mahout的电影推荐系统 1.Mahout 简介 Apache Mahout 是 Apache Software Foundation(ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域 ...
- 基于pytorch的电影推荐系统
本文介绍一个基于pytorch的电影推荐系统. 代码移植自https://github.com/chengstone/movie_recommender. 原作者用了tf1.0实现了这个基于movie ...
- 基于卷积神经网络CNN的电影推荐系统
本项目使用文本卷积神经网络,并使用MovieLens数据集完成电影推荐的任务. 推荐系统在日常的网络应用中无处不在,比如网上购物.网上买书.新闻app.社交网络.音乐网站.电影网站等等等等,有人的地方 ...
随机推荐
- Spring学习之旅(七)--SpringMVC视图
在之前的实例中我们只是在 Controller 中返回了 home 字符类型的值,而没有直接生成可以在浏览器中直接渲染的 HTML,这是因为 SpringMVC 将请求处理的逻辑和视图渲染的实现进行了 ...
- Liunx学习总结(九)--防火墙
防火墙的作用 防火墙作为一个边界防御工具,其监控流量要么允许它.要么屏蔽它. 多年来,防火墙的功能不断增强,现在大多数防火墙不仅可以阻止已知的一些威胁.执行高级访问控制列表策略,还可以深入检查流量中的 ...
- java日志框架笔记-log4j-springboot整合
# 日志框架slf4j log4j logback之间的关系 简答的讲就是slf4j是一系列的日志接口,而log4j logback是具体实现了的日志框架. ```java SLF4J获得logger ...
- Mybatis基于注解实现多表查询
对应的四种数据库表关系中存在四种关系:一对多,多对应,一对一,多对多.在前文中已经实现了xml配置方式实现表关系的查询,本文记录一下Mybatis怎么通过注解实现多表的查询,算是一个知识的补充. 同样 ...
- Dictionary的用法及用途
Dictionary<string, string>是一个泛型 他本身有集合的功能有时候可以把它看成数组 他的结构是这样的:Dictionary<[key], [value]> ...
- bdtrans 一个命令行下的机器翻译工具
现如今,机器翻译技术已经越来越成熟了,尽管从整体来看机器翻译的结果还不是特别如意,但是也足以应付一般的翻译需求了.近几年机器翻译平台层出不穷,国外比较出名的翻译平台有Google翻译.必应翻译等,国内 ...
- NN入门,手把手教你用Numpy手撕NN(2)
这是一篇包含较少数学推导的NN入门文章 上篇文章中简单介绍了如何手撕一个NN,但其中仍有可以改进的地方,将在这篇文章中进行完善. 误差反向传播 之前的NN计算梯度是利用数值微分法,虽容易实现,但是计算 ...
- SDU暑期集训排位(9)
SDU暑期集训排位(9) G. Just Some Permutations 基础 DP 练习部分 定义 \(f(S)\),表示让 S 中的人全 happy 的方案数. \(dp[i][j]\) 表示 ...
- Codefroces 939 C Convenient For Everybody
939 C 题意:若干年以后地球会变成n个时区, 为了方便计时, 每个时区的时间从1:00开始到n:00点结束, 现在将要举行一场c赛, 每个时区内都有ai个人参加,并且比赛开始时间不早于当地时间s: ...
- hdu 5969 最大的位或(贪心)
Problem Description B君和G君聊天的时候想到了如下的问题.给定自然数l和r ,选取2个整数x,y满足l <= x <= y <= r ,使得x|y最大.其中|表示 ...