MapReduce最大值

package com.bw.hadoop;

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class Max {

   public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException {

       Configuration config = new Configuration();
       config.set("fs.defaultFS", "hdfs://192.168.0.117:9000");
       config.set("yarn.resourcemanager.hostname", "192.168.0.117");

       Job job = Job.getInstance(config);

       //MR
       job.setMapperClass(MaxMapper.class);
       job.setReducerClass(MaxReducer.class);

       //M-O
       job.setMapOutputKeyClass(LongWritable.class);
       job.setMapOutputValueClass(NullWritable.class);

       //R-O
       job.setOutputKeyClass(LongWritable.class);
       job.setOutputValueClass(NullWritable.class);

       //I-O
       FileInputFormat.setInputPaths(job, new Path("/b"));
       FileOutputFormat.setOutputPath(job, new Path("/Out"));

       //boolean
       boolean B = job.waitForCompletion(true);
       if(B){
           System.out.println("Success");
       }else{
           System.out.println("Error");
       }
    }

    public static class MaxMapper extends Mapper<LongWritable, Text, LongWritable, NullWritable> {

       // 定义一个Long类型的最小值作为临时变量
        private Long max = Long.MIN_VALUE;

        // 定义输出去的value
        private LongWritable maxValue = new LongWritable();

        @Override
        protected void map(LongWritable key, Text value, Mapper<LongWritable, Text, LongWritable, NullWritable>.Context context) throws IOException,
                InterruptedException {

           // 获取输入的行
            String line = value.toString();

            // 抛弃无效记录
            if (line == null || line.equals("")) {
                return;
            }

            // 把line转换为数值
            long temp = Long.parseLong(line);

            // 比较大小
            if (temp > max) {
                // 把val赋值给tempMax
                max = temp;
            }

        }

        /**
         * cleanUp()是指map函数执行完成之后就会调用，刚好满足我们的要求因为map()函数执行完成之后我们单个任务的的最大值也就产生了
         */

        @Override
        protected void cleanup(Mapper<LongWritable, Text, LongWritable, NullWritable>.Context context) throws IOException, InterruptedException {
            // 把最后的处理结果写出去
            maxValue.set(max);
            context.write(maxValue, NullWritable.get());
        }

    }

    /**
     * 汇总多个任务产生的最大值，再次比较
     */
    public static class MaxReducer extends Reducer<LongWritable, NullWritable, LongWritable, NullWritable> {

       // 定义一个参考的临时变量
        private Long max = Long.MIN_VALUE;

        // 定义输出的key
        private LongWritable maxValue = new LongWritable();

        protected void reduce(LongWritable key, Iterable<NullWritable> value, Reducer<LongWritable, NullWritable, LongWritable, NullWritable>.Context context)
                throws IOException, InterruptedException {

           if (key.get() > max) {
                max = key.get();
            }

        }


        /**
         * reduce任务完成后写出去
         */
        protected void cleanup(Reducer<LongWritable, NullWritable, LongWritable, NullWritable>.Context context) throws IOException, InterruptedException {

           // 设置最大值
            maxValue.set(max);

            context.write(maxValue, NullWritable.get());
        }
    }
}

MapReduce最大值的更多相关文章

MapReduce——计算温度最大值（基于全新2.2.0API）
MapReduce——计算温度最大值 (基于全新2.2.0API) deprecated: Job类的所有Constructors, 新的API用静态方法getInstance(conf)来去的Job ...
MapReduce计算每年最大值
1. 测试文件生成程序,参考 https://www.cnblogs.com/jonban/p/10555364.html MapReduce程序示例如下: 2. 新建Maven项目 hadoop ...
MapReduce计算每年最大值测试样例生成程序
Demo.java package com.java; import java.io.BufferedWriter; import java.io.File; import java.io.FileW ...
MapReduce求最大值最小值问题
import java.io.File; import java.io.IOException; import org.apache.hadoop.conf.Configuration; import ...
使用mapreduce计算环比的实例
最近做了一个小的mapreduce程序,主要目的是计算环比值最高的前5名,本来打算使用spark计算,可是本人目前spark还只是简单看了下,因此就先改用mapreduce计算了,今天和大家分享下这个 ...
MapReduce剖析笔记之六：TaskTracker初始化任务并启动JVM过程
在上面一节我们分析了JobTracker调用JobQueueTaskScheduler进行任务分配,JobQueueTaskScheduler又调用JobInProgress按照一定顺序查找任务的流程 ...
MapReduce剖析笔记之五：Map与Reduce任务分配过程
在上一节分析了TaskTracker和JobTracker之间通过周期的心跳消息获取任务分配结果的过程.中间留了一个问题,就是任务到底是怎么分配的.任务的分配自然是由JobTracker做出来的,具体 ...
Hadoop MapReduce执行过程详解（带hadoop例子）
https://my.oschina.net/itblog/blog/275294 摘要: 本文通过一个例子,详细介绍Hadoop 的 MapReduce过程. 分析MapReduce执行过程 Map ...
Hadoop学习笔记—12.MapReduce中的常见算法
一.MapReduce中有哪些常见算法 (1)经典之王:单词计数这个是MapReduce的经典案例,经典的不能再经典了! (2)数据去重 "数据去重"主要是为了掌握和利用并行化思 ...

随机推荐

Thrift总结(二)创建RPC服务
前面介绍了thrift 基础的东西,怎么写thrift 语法规范编写脚本,如何生成相关的语言的接口.不清楚的可以看这个<Thrift总结(一)介绍>.做好之前的准备工作以后,下面就开始如何 ...
MySQL基础语法命令
1. 建表创建MySQL数据表需要以下信息: 表名表字段名定义每个表字段通用语法: CREATE TABLE table_name (column_name column_type); 实例: ...
一个简单的python选课系统
下面介绍一下自己写的python程序,主要是的知识点为sys.os.json.pickle的模块应用,python程序包的的使用,以及关于类的使用. 下面是我的程序目录: bin是存放一些执行文件co ...
seajs源码阅读
乘着周日有点时间,阅读一下玉伯大神的源码. seajs的源码写得真的很好,很是佩服,工整美观不愧是大神,造福百姓. 说起seajs不得不说,AMD和CMD的区别. CMD 推崇依赖就近,AMD 推崇 ...
Universal asynchronous receiver transmitter (UART)
UART基本介绍: 通用异步收发器UART他的功能非常强大我们只使用UART的全双工异步通信功能,使用中断接收数据. UART_RX:串行数据输入. UART_TX:串行数据输出. 硬件支持: 连接 ...
SSIM（结构相似度算法）不同实现版本的差异
前言最近用ssim测试图片画质损伤时,发现matlab自带ssim与之前一直使用的ssim计算得分有差异,故和同事开始确定差异所在. 不同的SSIM版本这里提到不同的ssim版本主要基于matla ...
Android源码博文集锦1
Android精选源码功能齐全的实用Android视频播放器实现滑动到底部,加载更多RecyclerViewDemo 使用Kotlin语言编写Android MVP案例KotlinMVPDemo ...
（转载）VB 查询Oracle中blob类型字段,并且把blob中的图片以流的方式显示在Image上
原文摘自:http://heisetoufa.iteye.com/blog/ '模块代码 Private Declare Function CreateStreamOnHGlobal Lib &quo ...
ISO18000-6B和ISO18000-6C(EPC C1G2)标准的区别
ISO18000-6B和ISO18000-6C(EPC C1G2)标准的区别日期:2009-4-2 22:10:26 目前,有两个标准可供选择.一是ISO18000-6B,另一个是已被ISO接纳为I ...
IIS 反向代理 golang web开发
一. beego 开发编译 bee run 后会编译成 exe文件编译生成后发布文件结构为 cmd 运行 cd D:/run beegoDemo.exe run 默认配置端口不能为 80 跟iis ...

MapReduce最大值

MapReduce最大值的更多相关文章

随机推荐

热门专题