MapReduce- 数据的排序处理

package com.huhu.day02;

import java.io.DataInput;

import java.io.DataOutput;

import java.io.IOException;

import org.apache.hadoop.io.WritableComparable;

/**

 * 6 9

 * 3 8

 * 4 8

 * 1 0

 * 3 0

 * 8 8

 * 6 7

 * 第一列升序，第二列降序

 * @author huhu_k

 *

 */

public class Number implements WritableComparable<Number> {

	private int first;

	private int second;

	// private int third;

	public Number() {

		super();

	}

	public Number(int first, int second) {

		super();

		this.first = first;

		this.second = second;

	}

	public int getFirst() {

		return first;

	}

	public void setFirst(int first) {

		this.first = first;

	}

	public int getSecond() {

		return second;

	}

	public void setSecond(int second) {

		this.second = second;

	}

	@Override

	public int hashCode() {

		final int prime = 31;

		int result = 1;

		result = prime * result + first;

		result = prime * result + second;

		return result;

	}

	@Override

	public boolean equals(Object obj) {

		if (this == obj)

			return true;

		if (obj == null)

			return false;

		if (getClass() != obj.getClass())

			return false;

		Number other = (Number) obj;

		if (first != other.first)

			return false;

		if (second != other.second)

			return false;

		return true;

	}

	@Override

	public String toString() {

		return "Number [first=" + first + ", second=" + second + "]";

	}

	@Override

	public void readFields(DataInput in) throws IOException {

		this.first = in.readInt();

		this.second = in.readInt();

	}

	@Override

	public void write(DataOutput out) throws IOException {

		out.writeInt(this.first);

		out.writeInt(this.second);

	}

	@Override

	public int compareTo(Number o) {

		if (this.first== o.first) {

			//第二行数据降序

			return o.second - this.second;

		}

		//第一行升序

		return this.first - o.first;

	}

}

package com.huhu.day02;

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.LongWritable;

import org.apache.hadoop.io.NullWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Job;

import org.apache.hadoop.mapreduce.Mapper;

import org.apache.hadoop.mapreduce.Reducer;

import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

import org.apache.hadoop.util.GenericOptionsParser;

import org.apache.hadoop.util.Tool;

import org.apache.hadoop.util.ToolRunner;

public class NumericSorting extends ToolRunner implements Tool {

	public static class MyMapper extends Mapper<LongWritable, Text, Number, NullWritable> {

		@Override

		protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {

			String[] line = value.toString().split(" ");

			Number number = null;

			if (line.length == 2) {

				number = new Number(Integer.parseInt(line[0]), Integer.parseInt(line[1]));

			}

			context.write(number, NullWritable.get());

		}

	}

	public static class MyReduce extends Reducer<Number, NullWritable, Number, Text> {

		@Override

		protected void reduce(Number key, Iterable<NullWritable> values, Context context)

				throws IOException, InterruptedException {

			for (NullWritable n : values) {

				context.write(key, new Text("---"));

			}

		}

	}

	@Override

	public Configuration getConf() {

		return new Configuration();

	}

	@Override

	public void setConf(Configuration arg0) {

	}

	@Override

	public int run(String[] other) throws Exception {

		Job job = Job.getInstance(getConf(), "NumbericSorting");

		job.setJarByClass(NumericSorting.class);

		job.setMapperClass(MyMapper.class);

		job.setMapOutputKeyClass(Number.class);

		job.setMapOutputValueClass(NullWritable.class);

		job.setReducerClass(MyReduce.class);

		job.setOutputKeyClass(Number.class);

		job.setOutputValueClass(Text.class);

		FileInputFormat.addInputPath(job, new Path(other[0]));

		FileOutputFormat.setOutputPath(job, new Path(other[1]));

		return job.waitForCompletion(true) ? 0 : 1;

	}

	public static void main(String[] args) throws Exception {

		Configuration conf = new Configuration();

		String[] other = new GenericOptionsParser(conf, args).getRemainingArgs();

		if (other.length != 2) {

			System.out.println("your input args number is fail,you need input <in> and <out>");

			System.exit(0);

		}

		ToolRunner.run(conf, new NumericSorting(), other);

	}

}

运行结果：

MapReduce- 数据的排序处理的更多相关文章

Hadoop学习笔记—11.MapReduce中的排序和分组
一.写在之前的 1.1 回顾Map阶段四大步骤首先,我们回顾一下在MapReduce中,排序和分组在哪里被执行: 从上图中可以清楚地看出,在Step1.4也就是第四步中,需要对不同分区中的数据进行排 ...
MapReduce二次排序
默认情况下,Map 输出的结果会对 Key 进行默认的排序,但是有时候需要对 Key 排序的同时再对 Value 进行排序,这时候就要用到二次排序了.下面让我们来介绍一下什么是二次排序. 二次排序原理 ...
(转)MapReduce二次排序
一.概述 MapReduce框架对处理结果的输出会根据key值进行默认的排序,这个默认排序可以满足一部分需求,但是也是十分有限的.在我们实际的需求当中,往往有要对reduce输出结果进行二次排序的需求 ...
Hadoop MapReduce 二次排序原理及其应用
关于二次排序主要涉及到这么几个东西: 在0.20.0 以前使用的是 setPartitionerClass setOutputkeyComparatorClass setOutputValueGrou ...
关于MapReduce二次排序的一点解答
上一篇博客说明了怎么自定义Key,而且用了二次排序的例子来做测试,但没有详细的说明二次排序,这一篇说详细的说明二次排序,为了说明曾经一个思想的误区,特地做了一个3个字段的二次排序来说明.后面称其为“三 ...
mapreduce 实现数子排序
设计思路: 使用mapreduce的默认排序,按照key值进行排序的,如果key为封装int的IntWritable类型,那么MapReduce按照数字大小对key排序,如果key为封装为String ...
详细讲解MapReduce二次排序过程
我在15年处理大数据的时候还都是使用MapReduce, 随着时间的推移, 计算工具的发展, 内存越来越便宜, 计算方式也有了极大的改变. 到现在再做大数据开发的好多同学都是直接使用spark, hi ...
MapReduce 二次排序
默认情况下,Map 输出的结果会对 Key 进行默认的排序,但是有时候需要对 Key 排序的同时再对 Value 进行排序,这时候就要用到二次排序了.下面让我们来介绍一下什么是二次排序. 二次排序原理 ...
Spark 颠覆 MapReduce 保持的排序记录
在过去几年,Apache Spark的採用以惊人的速度添加着,通常被作为MapReduce后继,能够支撑数千节点规模的集群部署. 在内存中数据处理上,Apache Spark比MapReduce更加 ...
mapreduce数据处理——统计排序
接上篇https://www.cnblogs.com/sengzhao666/p/11850849.html 2.数据处理: ·统计最受欢迎的视频/文章的Top10访问次数 (id) ·按照地市统计最 ...

随机推荐

SAP 财务模块 FI-TV 差旅管理
SAP 财务模块 FI-TV 差旅管理 Travel Management差旅管理事务码描述PRT3 Trip Costs: Maintain Postings ...
完美解决百度网盘、浏览器下载限速问题proxyee-down(附带win破解版云盘)
win版破解云盘下载: <PanDownload> 使用文档: <PanDownload使用> Mac方法限速.限速! 平时下载东西限速倒无所谓,遇到急一点的.盯着80km ...
宠物属性控制_pet
classIndex 职业索引 DmgAddPct 根据职业的法伤或攻强来计算宠物增加的物理伤害,增加的伤害值等于玩家法伤或攻强的百分比 SpAddPct 根据职业的法伤或攻强来计算宠物增加的法术伤害 ...
Codeforces 600E. Lomsat gelral(Dsu on tree学习)
题目链接:http://codeforces.com/problemset/problem/600/E n个点的有根树,以1为根,每个点有一种颜色.我们称一种颜色占领了一个子树当且仅当没有其他颜色在这 ...
mysql Percona-XtraBackup backup
全量备份FULL BACKUP https://www.percona.com/doc/percona-xtrabackup/2.4/backup_scenarios/full_backup.html ...
【教程】手写简易web服务器
package com.littlepage.testjdbc; import java.io.BufferedReader; import java.io.FileReader; import ja ...
大规模集群下的Hadoop NameNode
本文我们来看看,如果大量客户端对NameNode发起高并发(比如每秒上千次)访问来修改元数据,此时NameNode该如何抗住? 二.问题源起我们先来分析一下,高并发请求NameNode会遇到什么样的 ...
vue-cli3+cordova实现app混合开发
一.安装vue-cli3 安装并建新项目二.进入项目安装cordova npm install -g cordova 下载完之后,输入 cordova -v 查看是否成功安装,出现相应的版本号则成功 ...
java 虹软ArcFace 2.0，java SDK使用-进行人脸检测
虹软产品地址:http://ai.arcsoft.com.cn/product/arcface.html虹软ArcFace功能简介人脸检测人脸跟踪人脸属性检测(性别.年龄)人脸三维角度检测人脸对比 ...
Restful Api 的好与坏
restful 的特色是接口少 get,put,post,delete 好处是容易记, 统一. 但是业务上往往不会这么简单. 不同的 user/roles 调用同一个 get 接口, 出来的结果不一定 ...

MapReduce- 数据的排序处理

MapReduce- 数据的排序处理的更多相关文章

随机推荐

热门专题