hadoop2.2.0 MapReduce求和并排序

javabean必须实现WritableComparable接口，并实现该接口的序列化，反序列话和比较方法

package com.my.hadoop.mapreduce.sort;

import java.io.DataInput;
import java.io.DataOutput;
import java.io.IOException;

import org.apache.hadoop.io.WritableComparable;

public class InfoBean implements WritableComparable<InfoBean> {

   private String account;
   private double income;
   private double expences;
   private double surplus;

public void set(String account, double income, double expences){
       this.account = account;
       this.income = income;
       this.expences = expences;
       this.surplus = income - expences;
   }

   @Override
   public String toString() {
       return income+"\t"+expences+"\t"+surplus;
   }

@Override
   public void readFields(DataInput in) throws IOException {
       this.account = in.readUTF();
       this.income = in.readDouble();
       this.expences = in.readDouble();
       this.surplus = in.readDouble();
   }

@Override
   public void write(DataOutput out) throws IOException {
       out.writeUTF(this.account);
       out.writeDouble(this.income);
       out.writeDouble(this.expences);
       out.writeDouble(this.surplus);
   }

@Override
   public int compareTo(InfoBean o) {
       if (this.income == o.getIncome()) {
           return this.expences > o.getExpences() ? 1 : -1;
       } else {
           return this.income > o.getIncome() ? -1 : 1;
       }
   }

public String getAccount() {
return account;
}

public void setAccount(String account) {
this.account = account;
}

public double getIncome() {
return income;
}

public void setIncome(double income) {
this.income = income;
}

public double getExpences() {
return expences;
}

public void setExpences(double expences) {
this.expences = expences;
}

public double getSurplus() {
return surplus;
}

public void setSurplus(double surplus) {
this.surplus = surplus;
}

}

先求和

package com.my.hadoop.mapreduce.sort;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class SumStep {

public static class SumMap extends Mapper<LongWritable, Text, Text, InfoBean>{
       private Text k = new Text();
       private InfoBean v = new InfoBean();

       @Override
       public void map(LongWritable key, Text value, Context context) throws java.io.IOException ,InterruptedException {
           String[] fields = value.toString().split("\t");
           String account = fields[0];
           double in = Double.parseDouble(fields[1]);
           double out = Double.parseDouble(fields[2]);
           k.set(account);
           v.set(account, in, out);
           context.write(k, v);
       }
   }

   public static class SumReduce extends Reducer<Text, InfoBean, Text, InfoBean>{
       private InfoBean v = new InfoBean();

       @Override
       public void reduce(Text key, Iterable<InfoBean> value, Context context) throws java.io.IOException ,InterruptedException {
           double in_sum = 0;
           double out_sum = 0;
           for (InfoBean bean : value) {
               in_sum += bean.getIncome();
               out_sum += bean.getExpences();
           }
           v.set("", in_sum, out_sum);
           context.write(key, v);
       }
   }

   public static void main(String[] args) throws Exception {
       Configuration conf = new Configuration();
       Job job = Job.getInstance(conf, SumStep.class.getSimpleName());
       job.setJarByClass(SumStep.class);

       FileInputFormat.setInputPaths(job, new Path(args[0]));
       job.setMapperClass(SumMap.class);
       job.setMapOutputKeyClass(Text.class);
       job.setMapOutputValueClass(InfoBean.class);

       job.setReducerClass(SumReduce.class);
       job.setOutputKeyClass(Text.class);
       job.setOutputValueClass(InfoBean.class);
       FileOutputFormat.setOutputPath(job, new Path(args[1]));

       System.exit(job.waitForCompletion(true) ? 0 :1);

   }

}

后排序

package com.my.hadoop.mapreduce.sort;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class SortStep {

public static class SortMap extends Mapper<LongWritable, Text, InfoBean, NullWritable>{
       private InfoBean k = new InfoBean();

       @Override
       public void map(LongWritable key, Text value, Context context) throws java.io.IOException ,InterruptedException {
           System.out.println("===="+value.toString()+"====");
           String[] fields = value.toString().split("\t");
           String account = fields[0];
           double in = Double.parseDouble(fields[1]);
           double out = Double.parseDouble(fields[2]);
           k.set(account, in, out);
           context.write(k, NullWritable.get());
       }
   }

   public static class SortReduce extends Reducer<InfoBean, NullWritable, Text, InfoBean>{
       private Text k = new Text();

       @Override
       public void reduce(InfoBean bean, Iterable<NullWritable> value, Context context) throws java.io.IOException ,InterruptedException {
           k.set(bean.getAccount());
           context.write(k, bean);
       }
   }

   public static void main(String[] args) throws Exception {
       Configuration conf = new Configuration();
       Job job = Job.getInstance(conf, SortStep.class.getSimpleName());
       job.setJarByClass(SortStep.class);

       FileInputFormat.setInputPaths(job, new Path(args[0]));
       job.setMapperClass(SortMap.class);
       job.setMapOutputKeyClass(InfoBean.class);
       job.setMapOutputValueClass(NullWritable.class);

       job.setReducerClass(SortReduce.class);
       job.setOutputKeyClass(Text.class);
       job.setOutputValueClass(InfoBean.class);
       FileOutputFormat.setOutputPath(job, new Path(args[1]));

       System.exit(job.waitForCompletion(true) ? 0 :1);

   }

}

hadoop2.2.0 MapReduce求和并排序的更多相关文章

hadoop2.2.0 MapReduce分区
package com.my.hadoop.mapreduce.partition; import java.util.HashMap;import java.util.Map; import org ...
hadoop2.2.0 MapReduce的序列化
package com.my.hadoop.mapreduce.dataformat; import java.io.DataInput;import java.io.DataOutput;impor ...
【hadoop2.6.0】用C++ 编写mapreduce
hadoop通过hadoop streaming 来实现用非Java语言写的mapreduce代码. 对于一个一点Java都不会的我来说,这真是个天大的好消息. 官网上hadoop streaming ...
一脸懵逼学习Hadoop中的序列化机制——流量求和统计MapReduce的程序开发案例——流量求和统计排序
一:序列化概念序列化(Serialization)是指把结构化对象转化为字节流.反序列化(Deserialization)是序列化的逆过程.即把字节流转回结构化对象.Java序列化(java.io. ...
国内最全最详细的hadoop2.2.0集群的MapReduce的最简单配置
简介 hadoop2的中的MapReduce不再是hadoop1中的结构已经没有了JobTracker,而是分解成ResourceManager和ApplicationMaster.这次大变革被称为M ...
编写简单的Mapreduce程序并部署在Hadoop2.2.0上运行
今天主要来说说怎么在Hadoop2.2.0分布式上面运行写好的 Mapreduce 程序. 可以在eclipse写好程序,export或用fatjar打包成jar文件. 先给出这个程序所依赖的Mave ...
Hadoop2.2.0 第一步完成MapReduce wordcount计算文本数量
1.完成Hadoop2.2.0单机版环境搭建之后需要利用一个例子程序来检验hadoop2 的mapreduce的功能 //启动hdfs和yarn sbin/start-dfs.sh sbin/star ...
使用命令行编译打包运行自己的MapReduce程序 Hadoop2.6.0
使用命令行编译打包运行自己的MapReduce程序 Hadoop2.6.0 网上的 MapReduce WordCount 教程对于如何编译 WordCount.java 几乎是一笔带过… 而有写到的 ...
Eclipse中部署hadoop2.3.0
1 eclipse中hadoop环境部署概览 eclipse 中部署hadoop包括两大部分:hdfs环境部署和mapreduce任务执行环境部署.一般hdfs环境部署比较简单,部署后就可以在ecl ...

随机推荐

C#txt文件读写基本操作
string strFileName=@"C:\Users\Administrator\Desktop\记事2.txt"; //判断是否存在 if (File.Exists(str ...
Windows与自定义USB HID设备通信说明.
1 ．所使用的典型 Windows API CreateFile ReadFile WriteFile 以下函数是 DDK 的内容: HidD_SetFeature HidD_GetFeatur ...
Citrix Presentation server can not contact the license server
If you come across the above error, you may also come across one or more of the errors below within ...
elasticsearch中的概念简述
Near Realtime(NRT) Elasticsearch接近实时.从为一个文档建立索引到可被搜索,正常情况下有1秒延迟. Cluster 一个集群有一个唯一的名字,默认是"elast ...
仿写Windows7桌面和任务栏 HTML5+CSS3+Jquery实现
过去一段时间零零散散的自学了一点点jquery的相关用法,基本上属于用到哪个了,就去查然后就学一点,没有系统的学过,深入的用法也不是特别了解,毕竟javascript基础就比较薄弱.经过一段时间的零敲 ...
（转）精通 JS正则表达式
精通 JS正则表达式 (精通?标题党 ) 正则表达式可以: •测试字符串的某个模式.例如,可以对一个输入字符串进行测试,看在该字符串是否存在一个电话号码模式或一个信用卡号码模式.这称为数据有效性验证 ...
方形布局SquareLayout
public class SquareLayout extends RelativeLayout { public SquareLayout(Context context, AttributeSet ...
linux学习笔记<命令介绍>
主要介绍日常工作中一些常用的命令,内容均整理自慕课网命令提示符 [root@hgs ~]# 其中: root : 当前登录用户 hgs : 主机名 ~ : 当前所在目录(家目录),对于root用户, ...
（三）Angularjs - 小实例
AngularJS处理数据表格使用 np-repeat 指令 <table> ...  <tr ng- ...
Intellij idea 12和设置快捷键修改（加快项目的开发速度与养成良好习惯）
1.为了养成良好的代码习惯idead中的javascript jSLint能显示不良的代码设置如下 2.Intellij idea 12每一次修改,保存生成都要按ctrl+shift+F9非常影 ...

hadoop2.2.0 MapReduce求和并排序

hadoop2.2.0 MapReduce求和并排序的更多相关文章

随机推荐

热门专题