Hadoop 学习笔记（十一） MapReduce 求平均成绩

china：
张三 78
李四 89
王五 96
赵六 67
english
张三 80
李四 82
王五    84
赵六 86
math
张三 88
李四 99
王五 66
赵六 77

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.FloatWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Job;

import org.apache.hadoop.mapreduce.Mapper;

import org.apache.hadoop.mapreduce.Reducer;

import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

import org.apache.hadoop.mapreduce.lib.input.TextInputFormat;

import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

import org.apache.hadoop.mapreduce.lib.reduce.IntSumReducer;

public class MyAverage {

    public static class FormatMapper extends Mapper<Object, Text, Text, IntWritable>{

        private IntWritable val = new IntWritable();

        public void map(Object key, Text value, Context context) throws IOException, InterruptedException{

            String line[] = value.toString().split("\\s");

            val.set(Integer.parseInt(line[]));

            context.write(new Text(line[]), val);

        }

    }

    public static class AverageReducer extends Reducer<Text, IntWritable, Text, FloatWritable>{

        public void reduce(Text key, Iterable<IntWritable> values, Context context) throws IOException, InterruptedException{

            int count = ;

            int sum = ;

            for (IntWritable val : values) {

                sum += val.get();

                count ++;

            }

            float ave = (float)sum / count;

            context.write(key, new FloatWritable(ave));

        }

    }

    public static void main(String[] args) throws Exception {

        String dir_in = "hdfs://localhost:9000/in_average";

        String dir_out = "hdfs://localhost:9000/out_average";

        Path in = new Path(dir_in);

        Path out = new Path(dir_out);

        Configuration conf = new Configuration();

        Job averageJob = new Job(conf, "my_average");

        averageJob.setJarByClass(MyAverage.class);

        averageJob.setInputFormatClass(TextInputFormat.class);

        averageJob.setMapperClass(FormatMapper.class);

        averageJob.setCombinerClass(IntSumReducer.class);

        //countJob.setPartitionerClass(HashPartitioner.class);

        averageJob.setMapOutputKeyClass(Text.class);

        averageJob.setMapOutputValueClass(IntWritable.class);

        FileInputFormat.addInputPath(averageJob, in);

        averageJob.setReducerClass(AverageReducer.class);

        //averageJob.setNumReduceTasks(1);

        averageJob.setOutputKeyClass(Text.class);

        averageJob.setOutputValueClass(FloatWritable.class);

        //countJob.setOutputFormatClass(SequenceFileOutputFormat.class);

        FileOutputFormat.setOutputPath(averageJob, out);

        averageJob.waitForCompletion(true);

    }

}

张三    82.0

李四    90.0

王五    82.0

赵六    76.666664

Hadoop 学习笔记（十一） MapReduce 求平均成绩的更多相关文章

hadoop 学习笔记：mapreduce框架详解
开始聊mapreduce,mapreduce是hadoop的计算框架,我学hadoop是从hive开始入手,再到hdfs,当我学习hdfs时候,就感觉到hdfs和mapreduce关系的紧密.这个可能 ...
Hadoop学习笔记：MapReduce框架详解
开始聊mapreduce,mapreduce是hadoop的计算框架,我学hadoop是从hive开始入手,再到hdfs,当我学习hdfs时候,就感觉到hdfs和mapreduce关系的紧密.这个可能 ...
【Big Data - Hadoop - MapReduce】hadoop 学习笔记：MapReduce框架详解
开始聊MapReduce,MapReduce是Hadoop的计算框架,我学Hadoop是从Hive开始入手,再到hdfs,当我学习hdfs时候,就感觉到hdfs和mapreduce关系的紧密.这个可能 ...
hadoop 学习笔记：mapreduce框架详解(转)
原文:http://www.cnblogs.com/sharpxiajun/p/3151395.html(有删减) Mapreduce运行机制下面我贴出几张图,这些图都是我在百度图片里找到的比较好的 ...
Hadoop学习笔记—11.MapReduce中的排序和分组
一.写在之前的 1.1 回顾Map阶段四大步骤首先,我们回顾一下在MapReduce中,排序和分组在哪里被执行: 从上图中可以清楚地看出,在Step1.4也就是第四步中,需要对不同分区中的数据进行排 ...
Hadoop学习笔记—12.MapReduce中的常见算法
一.MapReduce中有哪些常见算法 (1)经典之王:单词计数这个是MapReduce的经典案例,经典的不能再经典了! (2)数据去重 "数据去重"主要是为了掌握和利用并行化思 ...
Hadoop学习笔记： MapReduce二次排序
本文给出一个实现MapReduce二次排序的例子 package SortTest; import java.io.DataInput; import java.io.DataOutput; impo ...
Hadoop学习笔记： MapReduce Java编程简介
概述本文主要基于Hadoop 1.0.0后推出的新Java API为例介绍MapReduce的Java编程模型.新旧API主要区别在于新API(org.apache.hadoop.mapreduce ...
三、Hadoop学习笔记————从MapReduce到Yarn
Yarn减轻了JobTracker的负担,对其进行了解耦

随机推荐

Java 线程第三版第一章Thread导论、第二章Thread的创建与管理读书笔记
第一章 Thread导论为何要用Thread ? 非堵塞I/O I/O多路技术轮询(polling) 信号警告(Alarm)和定时器(Timer) 独立的任务(Ta ...
windows修改mysql默认字符集不成功
今天下午弄了半天,终于把mysql的默认字符集弄成了, 按照网上的说法,什么修改mysql下面的my.ini文件,把参数设置成utf-8,我反复操作,结果都是不成功,后来我把mysql5.0卸载了,网 ...
LabVIEW系列——自定义错误
1.自定义错误代码文本文件在labview中三处: a).E:\Program Files\National Instruments\LabVIEW 8.6\project\errors ...
Exploring Message Brokers: RabbitMQ, Kafka, ActiveMQ, and Kestrel--reference
[This article was originally written by Yves Trudeau.] http://java.dzone.com/articles/exploring-mess ...
Android开发之使用意图
意图的用途一般是连接活动,传递数据,从意图返回数据等,下面的例子就是利用意图来交互MainActivity和SecondActivity这两个活动. 效果图如下: 实现代码如下: MainActivi ...
基于bootstrap面板的类别多选栏
1.html部分 <div class="panel panel-default"> <div class="panel-heading"&g ...
asp.net 调用前台JS调用后台，后台掉前台JS
C#前台js调用后台代码前台js<script type="text/javascript" language="javascript"> func ...
javascript闭包分析
闭包是什么?闭包是Closure,简而言之,闭包就是: 闭包就是函数的局部变量集合,只是这些局部变量在函数返回后会继续存在. 闭包就是就是函数的“堆栈”在函数返回后并不释放,我们也可以理解为这些函数堆 ...
JAVA 循环在一个数字前面填充0.小例子
输入结果 00000000000567 String bala="567"; 固定长度是14位,怎么循环在bala前面填充00000000000 System.out.printl ...
[DEncrypt] RSACryption--RSA加密/解密字符串（转载）
点击下载 RSACryption.zip 这个类是关于加密,解密的操作,文件的一些高级操作1.RSACryption RSA 的密钥产生2.RSACryption RSA的加密函数3.RSACrypt ...

Hadoop 学习笔记 （十一） MapReduce 求平均成绩

Hadoop 学习笔记 （十一） MapReduce 求平均成绩的更多相关文章

随机推荐

热门专题

Hadoop 学习笔记（十一） MapReduce 求平均成绩

Hadoop 学习笔记（十一） MapReduce 求平均成绩的更多相关文章