Mapreduce案例之找共同好友

数据准备：

A:B,C,D,F,E,O
B:A,C,E,K
C:F,A,D,I
D:A,E,F,L
E:B,C,D,M,L
F:A,B,C,D,E,O,M
G:A,C,D,E,F
H:A,C,D,E,O
I:A,O
J:B,O
K:A,C,D
L:D,E,F
M:E,F,G
O:A,H,I,J

需求：

1.先求出A、B、C、….等是谁的好友

2.求出哪些人两两之间有共同好友，及他俩的共同好友都有谁？

需求解读：

1.有题目可得，该关系为单项关系可以理解为关注，即A关注的为BCDEF，B关注的为AK，所以求A B C...是谁的关注，即需要将冒号后边的作为key，前边的作为value进行map，在reduce的时候在合并即可。

2.求两两之间的共同关注，这时我们需要借助1题产生的结果文件，map是从后边的value值两两组合生成两两关系。作为新的key值输入，新的value为1题的key。

reduce的时候，将结果合并即可

源代码如下

第一题：

package Demo5;

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Job;

import org.apache.hadoop.mapreduce.Mapper;

import org.apache.hadoop.mapreduce.Reducer;

import org.apache.hadoop.mapreduce.Reducer.Context;

import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

/**

 * @author 星际毁灭

 * 找出ABC等人的好友

 * */

import Demo4.Log1;

public class Friend1 {

    public static class Map extends Mapper<Object , Text , Text , Text>{

        private static Text newKey=new Text();

        private static final IntWritable one = new IntWritable(1);

        public void map(Object key,Text value,Mapper<Object, Text, Text, Text>.Context context) throws IOException, InterruptedException{

            String line=value.toString();

            String[] array=line.split(":");  //数据实例  A:B,C,D,F,E,O

            String first=array[0];   //冒号前边部分

            String second=array[1];  //冒号后边部分

            String[] friend=second.split(",");  //冒号后边部分在切割

            System.out.println(first+"\t"+second);

            for(int i=0;i<friend.length;i++) {

                context.write(new Text(friend[i]),new Text(first));  //好友关系，即源文件的反向

            }

         }

    }

    public static class Reduce extends Reducer<Text, Text, Text, Text>{

        public void reduce(Text key,Iterable<Text> values,Context context) throws IOException, InterruptedException{

            String res="";

            for(Text val:values) {

                res+=val.toString()+",";  //将结果合并

            }

            context.write(key,new Text(res));

        }

     }

     public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException{

             System.setProperty("hadoop.home.dir", "H:\\文件\\hadoop\\hadoop-2.6.4");

            Configuration conf=new Configuration();

            Path in=new Path("hdfs://192.168.6.132:9000/wys/in/friend1.txt");

            Path out=new Path("hdfs://192.168.6.132:9000/wys/out/friend1");  

            Job job =new Job(conf,"OneSort");  

            FileInputFormat.addInputPath(job,in);

            FileOutputFormat.setOutputPath(job,out);

            job.setJarByClass(Friend1.class);

            job.setMapperClass(Friend1.Map.class);

            job.setReducerClass(Friend1.Reduce.class);

            job.setOutputKeyClass(Text.class);

            job.setOutputValueClass(Text.class);

            job.waitForCompletion(true);

            System.exit(job.waitForCompletion(true) ? 0 : 1);

      } 

}

第二题：

package Demo5;

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Job;

import org.apache.hadoop.mapreduce.Mapper;

import org.apache.hadoop.mapreduce.Reducer;

import org.apache.hadoop.mapreduce.Reducer.Context;

import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

/**

 * @author 王翌淞

 *

 * 求出他们的共同好友

 * */

public class Friend2 {

    public static class Map extends Mapper<Object , Text , Text , Text>{

        private static Text newKey=new Text();

        private static final IntWritable one = new IntWritable(1);

        public void map(Object key,Text value,Mapper<Object, Text, Text, Text>.Context context) throws IOException, InterruptedException{

            String line=value.toString();

            String[] array=line.split("\t");

            String first=array[0];

            String second=array[1];

            String[] friend=second.split(",");

            System.out.println(first+"\t"+second);

            //通过两层的for循环，A的好友进行组合，有顺序

            for(int i=0;i<friend.length;i++) {

                for(int j=i+1;j<friend.length;j++) {

                    context.write(new Text(friend[i]+"-"+friend[j]),new Text(first));  //正序关系

                    context.write(new Text(friend[j]+"-"+friend[i]),new Text(first));  //倒序关系

                }

            }

            //context.write(new Text(friend[i]),new Text(first));

         }

    }

    public static class Reduce extends Reducer<Text, Text, Text, Text>{

        public void reduce(Text key,Iterable<Text> values,Context context) throws IOException, InterruptedException{

            String res="";

            for(Text val:values) {

                res+=val.toString()+" ";

            }

            context.write(key,new Text(res));

           }

     }

     public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException{

             System.setProperty("hadoop.home.dir", "H:\\文件\\hadoop\\hadoop-2.6.4");

            Configuration conf=new Configuration();

            Path in=new Path("hdfs://192.168.6.132:9000/wys/out/friend1/part-r-00000");

            Path out=new Path("hdfs://192.168.6.132:9000/wys/out/friend2");  

            Job job =new Job(conf,"OneSort");  

            FileInputFormat.addInputPath(job,in);

            FileOutputFormat.setOutputPath(job,out);

            job.setJarByClass(Friend2.class);

            job.setMapperClass(Friend2.Map.class);

            job.setReducerClass(Friend2.Reduce.class);

            job.setOutputKeyClass(Text.class);

            job.setOutputValueClass(Text.class);

            job.waitForCompletion(true);

            System.exit(job.waitForCompletion(true) ? 0 : 1);

      } 

}

Mapreduce案例之找共同好友的更多相关文章

MapReduce案例：统计共同好友+订单表多表合并+求每个订单中最贵的商品
案例三: 统计共同好友任务需求: 如下的文本, A:B,C,D,F,E,OB:A,C,E,KC:F,A,D,ID:A,E,F,LE:B,C,D,M,LF:A,B,C,D,E,O,MG:A,C,D,E ...
mapreduce案例：获取PI的值
mapreduce案例:获取PI的值 * content:核心思想是向以(0,0),(0,1),(1,0),(1,1)为顶点的正方形中投掷随机点. * 统计(0.5,0.5)为圆心的单位圆中落点占总落 ...
【Hadoop离线基础总结】MapReduce案例之自定义groupingComparator
MapReduce案例之自定义groupingComparator 求取Top 1的数据需求求出每一个订单中成交金额最大的一笔交易订单id 商品id 成交金额 Order_0000005 Pdt ...
MapReduce案例-好友推荐
用过各种社交平台(如QQ.微博.朋友网等等)的小伙伴应该都知道有一个叫 "可能认识" 或者 "好友推荐" 的功能(如下图).它的算法主要是根据你们之间的共同好友 ...
【Hadoop学习之十】MapReduce案例分析二-好友推荐
环境虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 FTP:Xftp4 jdk8 hadoop-3.1.1 最应该推荐的好友TopN,如何排名 ...
MapReduce案例二：好友推荐
1.需求推荐好友的好友图1: 2.解决思路 3.代码 3.1MyFoF类代码说明: 该类定义了所加载的配置,以及执行的map,reduce程序所需要加载运行的类 package com.hado ...
【尚学堂·Hadoop学习】MapReduce案例2--好友推荐
案例描述根据好友列表,推荐好友的好友数据集 tom hello hadoop cat world hadoop hello hive cat tom hive mr hive hello hive ...
【尚学堂·Hadoop学习】MapReduce案例1--天气
案例描述找出每个月气温最高的2天数据集 -- :: 34c -- :: 38c -- :: 36c -- :: 32c -- :: 37c -- :: 23c -- :: 41c -- :: 27 ...
Hadoop Mapreduce 案例 wordcount+统计手机流量使用情况
mapreduce设计思想概念:它是一个分布式并行计算的应用框架它提供相应简单的api模型,我们只需按照这些模型规则编写程序,即可实现"分布式并行计算"的功能. 案例一:word ...

随机推荐

洛谷题解 P1336 【最佳课题选择】
详细解析解题过程设计状态 dp[i][j]表示前i节课题写j篇论文花费的最少时间初始数组 for(int i=0;i<=20;i++) for(int j=0;j<=200;j++)d ...
Java集合框架——List接口
第三阶段 JAVA常见对象的学习集合框架--List接口按照集合框架的继承体系,我们先从Collection中的List接口开始学习 (一) 概述及功能(ArrayList演示) (1) 概述 L ...
linux系统调用、库函数和内核函数关系与区别
看系统调用,还有库函数,以前一直不明白,总是以为系统调用跟库函数是一样的,但是今天才知道是不一样的. 库函数也就是我们通常所说的应用编程接口API,它其实就是一个函数定义,比如常见read().wr ...
Ural 1238 Folding 题解
目录 Ural 1238 Folding 题解题意题解程序 Ural 1238 Folding 题解题意定义折叠.展开为: 单个大写英文字母是一个折叠的串,把它展开后是它本身. 如果\(S\ ...
jquery【点击】导航按钮的来回切换
先获取元素的属性值,根据属性值进行判断,点击时对属性进行设置 <i class="layui-icon layui-icon-shrink-right" id="n ...
认识函数（python）
一般的函数都是有参数的,函数的参数都是放在函数定义的括号里的,函数参数的命名规则和我们说的变量的命名规则基本一样,一定要清晰明了.(能概括出它的意义,让人阅读你的代码,就知道这个参数是干嘛的就行).当 ...
DateTime.TryParse 日期时间字符串验证
DateTime applicationDatetime = new DateTime(); bool applicationDate = DateTime.TryParse("2019-0 ...
Linux下mysql创建用户并设置权限，设置远程连接
为了安全考虑,OneinStack仅允许云主机本机(localhost)连接数据库,如果需要远程连接数据库,需要如下操作:打开iptables 3306端口 # iptables -I INPUT 4 ...
泛型和DataTable的属性
泛型转DataTable public DataTable ToDataTable<TResult>(this IEnumerable<TResult> value) wher ...
操作系统中堆（heap）与栈（stack）的区别
主要区别如下: 一.空间分配: 1.堆(操作系统):一般由程序员分配释放,若程序员不释放,程序结束时可能由OS回收,分配方式类似于链表.PS:java中都是系统GC,程序员无法进行GC. 2.栈(操作 ...

Mapreduce案例之找共同好友

Mapreduce案例之找共同好友的更多相关文章

随机推荐

热门专题