一. 安装软件

需要安装如下文件:

java, Eclipse, Maven,Hadoop,mahout

二. 推荐系统简介

每天,我们都会对一些事物表达自己的看法,喜欢,或不喜欢,或不在乎。这些都在无意识地发生。当你从电台听到一首歌曲的时候,要么会注意到它(因为它好听或它难听),要么完全不会注意它。对其他事物也是如此,像T-shirt, 色拉,发型,电视节目等等。

尽管人们的品味不同,但是他们都遵从某种模式,人们若喜欢某件事物,若现在有另一个事物与起相似,那么人们对该事物也会表现喜欢的态度。因为我喜欢bacon-lettuce-and-tomato三明治,所以你可以猜测我也喜欢club三明治,因为这两种三明治很相似。

相应的,人们倾向于喜欢与其喜欢相似事物的其他人所喜欢的事物。

我们可以使用这些模式来预测喜欢或不喜欢。当我们放一个陌生人在你面前的时候,当问你他是否喜欢指环王III时,你没有其他办法,只能猜测,但是,若他告诉我们他喜欢指环王I和指环王II时,那么若他不喜欢指环王III的话,你会很震惊。

推荐即是预测这些品味模式,然后使用这些模式来发现你所不知道的新的或想要的事物。

前面提到过,我们可以从和我们品味相似的人那里来发现我们喜欢的事物,另一方面,我们可以寻找与已经喜欢的事物相似的事物。这两种类型是推荐引擎算法中最广泛的类别:
“基于用户”的推荐和“基于事件”的推荐

以下介绍一个推荐系统实例,主要用来mahout工程在Eclipse下建立以及运行

1.首先,准备好输入的数据。在本实例中,保存在文件intro.csv中。

1,101,5.0
1,102,3.0
1,103,2.5 2,101,2.0
2,102,2.5
2,103,5.0
2,104,2.0 3,101,2.5
3,104,4.0
3,105,4.5
3,107,5.0 4,101,5.0
4,103,3.0
4,104,4.5
4,106,4.0 5,101,4.0
5,102,3.0
5,103,2.0
5,104,4.0
5,105,3.5
5,106,4.0

其中,第一列是:User ID, 第二列是:Item ID, 第三列是:Preference Value

2.创建一个推荐系统工程,输入如下代码:

import org.apache.mahout.cf.taste.impl.model.file.*;
import org.apache.mahout.cf.taste.impl.neighborhood.*;
import org.apache.mahout.cf.taste.impl.recommender.*;
import org.apache.mahout.cf.taste.impl.similarity.*; import org.apache.mahout.cf.taste.model.*;
import org.apache.mahout.cf.taste.neighborhood.*;
import org.apache.mahout.cf.taste.recommender.*;
import org.apache.mahout.cf.taste.similarity.*;
import java.io.*;
import java.util.*; public class RecommenderIntro {
public static void main(String[] args) throws Exception{
DataModel model = new FileDataModel(new File("intro.csv"));
UserSimilarity similarity = new PearsonCorrelationSimilarity(model);
UserNeighborhood neighborhood = new NearestNUserNeighborhood(2, similarity, model);
Recommender recommender = new GenericUserBasedRecommender(
model, neighborhood, similarity);
List<RecommendedItem> recommendations = recommender.recommend(1, 1); for(RecommendedItem recommendation : recommendations){
System.out.println(recommendation); }
} }
DataModel model = new FileDataModel(new File("intro.csv"));

该句表示加载数据文件

Recommender recommender = new GenericUserBasedRecommender(
model, neighborhood, similarity);

表示创建推荐引擎

List<RecommendedItem> recommendations = recommender.recommend(1, 1);

表示对于用户1,推荐1件物品

3.运行结果

2013-7-31 21:43:18 org.slf4j.impl.JCLLoggerAdapter info
信息: Creating FileDataModel for file intro.csv
2013-7-31 21:43:19 org.slf4j.impl.JCLLoggerAdapter info
信息: Reading file info...
2013-7-31 21:43:19 org.slf4j.impl.JCLLoggerAdapter info
信息: Read lines: 21
2013-7-31 21:43:19 org.slf4j.impl.JCLLoggerAdapter info
信息: Processed 5 users
RecommendedItem[item:104, value:4.257081]

若把

List<RecommendedItem> recommendations = recommender.recommend(1, 1);

改为:

List<RecommendedItem> recommendations = recommender.recommend(1, 2);

表示向用户1推荐2件物品

输出结果如下:

2013-7-31 21:55:13 org.slf4j.impl.JCLLoggerAdapter info
信息: Creating FileDataModel for file intro.csv
2013-7-31 21:55:14 org.slf4j.impl.JCLLoggerAdapter info
信息: Reading file info...
2013-7-31 21:55:14 org.slf4j.impl.JCLLoggerAdapter info
信息: Read lines: 21
2013-7-31 21:55:14 org.slf4j.impl.JCLLoggerAdapter info
信息: Processed 5 users
RecommendedItem[item:104, value:4.257081]
RecommendedItem[item:106, value:4.0]

注:

在把mahout的工程文件导入Eclipse时,可能会出现错误,具体错误忘了记下来了,我的解决方法是:

把Windows ——> Preferences ——>Maven ——> User Setting 设置为Maven安装的文件位置。如下图所示

mahout学习-1的更多相关文章

  1. 转】Mahout学习路线图

    原博文出自于: http://blog.fens.me/hadoop-mahout-roadmap/ 感谢! Mahout学习路线图 Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目 ...

  2. mahout第一篇-----Mahout学习路线图

    Mahout学习路线图 前言 Mahout是Hadoop家族中与众不同的一个成员,是基于一个Hadoop的机器学习和数据挖掘的分布式计算框架.Mahout是一个跨学科产品,同时也是我认为Hadoop家 ...

  3. Mahout学习路线图

    转自:http://blog.fens.me/hadoop-mahout-roadmap/ Mahout学习路线图 Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop, ...

  4. Mahout学习路线图-张丹老师

    前言 Mahout是Hadoop家族中与众不同的一个成员,是基于一个Hadoop的机器学习和数据挖掘的分布式计算框架.Mahout是一个跨学科产品,同时也是我认为Hadoop家族中,最有竞争力,最难掌 ...

  5. Hadoop里的数据挖掘应用-Mahout——学习笔记<三>

    之前有幸在MOOC学院抽中小象学院hadoop体验课. 这是小象学院hadoop2.X的笔记 由于平时对数据挖掘做的比较多,所以优先看Mahout方向视频. Mahout有很好的扩展性与容错性(基于H ...

  6. Mahout学习之Mahout简介、安装、配置、入门程序测试

    一.Mahout简介 查了Mahout的中文意思——驭象的人,再看看Mahout的logo,好吧,想和小黄象happy地玩耍,得顺便陪陪这位驭象人耍耍了... 附logo: (就是他,骑在象头上的那个 ...

  7. Mahout学习之Mahout简单介绍、安装、配置、入门程序測试

    一.Mahout简单介绍 查了Mahout的中文意思--驭象的人,再看看Mahout的logo,好吧,想和小黄象happy地玩耍,得顺便陪陪这位驭象人耍耍了... 附logo: (就是他,骑在象头上的 ...

  8. mahout学习

    参考:http://www.360doc.com/content/14/0117/09/1200324_345883534.shtml Precondition: 启动Hadoop集群 bin/hdf ...

  9. Mahout学习资料

    Apache Mahout 简介 http://www.ibm.com/developerworks/cn/java/j-mahout/ 从源代码剖析Mahout推荐引擎 http://blog.fe ...

随机推荐

  1. 运行Capture.exe找不到cdn_sfl401as.dll

    今天运行capture Orcad16.6显示缺少cdn_sfl401as.dll,昨天运行时并没有发现这种情况,回想今天安装了modelsim之后才发生这种情况,于是将modelsim卸载掉,再次启 ...

  2. 构建高可用web站点学习(二)

    web站点的缓存学习 缓存在web应用里面十分常见,也有各种各样的缓存,从请求开始一直到代码处理的阶段都可以采取缓存.下面就逐一介绍: 一.客户端缓存(浏览器和http方面) 前端页面缓存主要遵循ht ...

  3. 上海招聘FPGA讲师(专兼职均可)

    上海招聘FPGA讲师(专兼职均可) 招聘FPGA培训讲师(专兼职均可) 诚聘FPGA培训讲师_软件无线电方向 ◆精通FPGA设计方法及技巧 ◆精通无线电知识及System View设计方法,有基于Sy ...

  4. Linux命令之yes

    yes命令用于重复输出字符串(output a string repeatedly until killed).这个命令可以帮你自动回答命令行提示,例如,进入一个含有多个文件的目录,执行 " ...

  5. refresh的停车场

    题目描述  refresh最近发了一笔横财,开了一家停车场.由于土地有限,停车场内停车数量有限,但是要求进停车场的车辆过多.当停车场满时,要进入的车辆会进入便道等待,最先进入便道的车辆会优先 进入停车 ...

  6. javascript对象拷贝

    浅拷贝 浅拷贝函数: function copy(p){ var c = {}; for (var i in p){ c[i] = p[i]; } c.uber = p; return c; } 测试 ...

  7. Number of Islands——LeetCode

    Given a 2d grid map of '1's (land) and '0's (water), count the number of islands. An island is surro ...

  8. ASPNET登陆总结

    昨天晚上看了视频,今天早上起来就凭着记忆与视频里的代码试着做了一个登陆,基本功能是实现了. 0x0:首先,第一步是做一个界面....直接扒别人做好的页面.....各种改改路径啥的,用浏览器打开,恩,发 ...

  9. [Java] 实例创建的步骤

    创建类的一个实例时,按照下面步骤进行创建: 1. 给当前类及其父.祖类的所有成员字段分配空间,并给它们赋予默认值 2. 开始执行当前类的构造器 3. 如果当前类有父类,则对父类创建一个实例:从第 2 ...

  10. Java中可变长参数的方法

    原文转自:http://www.cnblogs.com/lanxuezaipiao/p/3190673.html 在Java5 中提供了变长参数(varargs),也就是在方法定义中可以使用个数不确定 ...