一、MapReduce主要继承两个父类：

Map

 protected void map(KEY key,VALUE value,Context context) throws IOException,InterruptedException{

 }

Reduce

 1 protected void reduce(KEY key,Iterable<VALUE> values,Context context) throws IOException,InterruptedException{

 2 }

二、使用代码实现WordCount：

 package com.laowang.mapreduce;

 import org.apache.hadoop.conf.Configuration;

 import org.apache.hadoop.fs.Path;

 import org.apache.hadoop.io.IntWritable;

 import org.apache.hadoop.io.LongWritable;

 import org.apache.hadoop.io.Text;

 import org.apache.hadoop.mapreduce.Job;

 import org.apache.hadoop.mapreduce.Mapper;

 import org.apache.hadoop.mapreduce.Reducer;

 import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

 import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

 import java.io.IOException;

 import java.util.StringTokenizer;

 public class MR {

     /**

      * @author laowang

      * @version v1.0.0

      * @apiNote Mapper

      * @since 2018/4/27 10:44

      * <p>

      * KEYIN, VALUEIN, KEYOUT, VALUEOUT  输入key类型，输入value类型，输出KEY类型，输出value类型

      */

     static class MyMapper extends Mapper<LongWritable, Text, Text, IntWritable> {

         private final static IntWritable ONE = new IntWritable(1);

         private Text word = new Text();

         @Override

         protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {

             //获取每一行的数据

             String lineStr = value.toString();

             //以 空格、/t、/n、/r、/f 分割

             StringTokenizer stringTokenizer = new StringTokenizer(lineStr);

             //遍历

             while (stringTokenizer.hasMoreTokens()) {

                 //获取截取后的每一个字符串

                 String wordValue = stringTokenizer.nextToken();

                 //拼接到word里面去

                 word.set(wordValue);

                 //写入到输出中

                 context.write(word, ONE);

             }

         }

     }

     /**

      * @author laowang

      * @version v1.0.0

      * @apiNote Reducer

      * @since 2018/4/27 10:44

      * <p>

      * KEYIN, VALUEIN, KEYOUT, VALUEOUT  输入key类型，输入value类型，输出KEY类型，输出value类型

      */

     static class MyReducer extends Reducer<Text, IntWritable, Text, IntWritable> {

         private IntWritable result = new IntWritable();

         @Override

         protected void reduce(Text key, Iterable<IntWritable> values, Context context) throws IOException, InterruptedException {

             int sum = 0;

             for (IntWritable value : values) {

                 sum += value.get();

             }

             result.set(sum);

             context.write(key, result);

         }

     }

     /**

      * @author laowang

      * @version v1.0.0

      * @apiNote Client

      * @since 2018/4/27 10:47

      */

     public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException {

         //获取配置信息

         Configuration configuration = new Configuration();

         //创建job

         Job job = new Job(configuration,"wc");

         //设置JOB运行的类

         job.setJarByClass(MR.class);

         //设置Mapper和Reducer

         job.setMapperClass(MyMapper.class);

         job.setReducerClass(MyReducer.class);

         //设置输入和输出路径

         FileInputFormat.addInputPath(job,new Path(args[0]));

         FileOutputFormat.setOutputPath(job,new Path(args[1]));

         //设置输出key和value的类型

         job.setOutputKeyClass(Text.class);

         job.setOutputValueClass(IntWritable.class);

         //提交job

         boolean b = job.waitForCompletion(true);

         //结束程序

         System.exit(b ? 0 : 1);

     }

 }

hadoop学习笔记（九）：MapReduce程序的编写的更多相关文章

hadoop 学习笔记：mapreduce框架详解
开始聊mapreduce,mapreduce是hadoop的计算框架,我学hadoop是从hive开始入手,再到hdfs,当我学习hdfs时候,就感觉到hdfs和mapreduce关系的紧密.这个可能 ...
Hadoop学习笔记：MapReduce框架详解
开始聊mapreduce,mapreduce是hadoop的计算框架,我学hadoop是从hive开始入手,再到hdfs,当我学习hdfs时候,就感觉到hdfs和mapreduce关系的紧密.这个可能 ...
【Big Data - Hadoop - MapReduce】hadoop 学习笔记：MapReduce框架详解
开始聊MapReduce,MapReduce是Hadoop的计算框架,我学Hadoop是从Hive开始入手,再到hdfs,当我学习hdfs时候,就感觉到hdfs和mapreduce关系的紧密.这个可能 ...
hadoop 学习笔记：mapreduce框架详解(转)
原文:http://www.cnblogs.com/sharpxiajun/p/3151395.html(有删减) Mapreduce运行机制下面我贴出几张图,这些图都是我在百度图片里找到的比较好的 ...
Hadoop学习笔记： MapReduce Java编程简介
概述本文主要基于Hadoop 1.0.0后推出的新Java API为例介绍MapReduce的Java编程模型.新旧API主要区别在于新API(org.apache.hadoop.mapreduce ...
Hadoop学习笔记：使用Mrjob框架编写MapReduce
1.mrjob介绍一个通过mapreduce编程接口(streamming)扩展出来的Python编程框架. 2.安装方法 pip install mrjob,略.初学,叙述的可能不是很细致,可以加 ...
Hadoop学习笔记—12.MapReduce中的常见算法
一.MapReduce中有哪些常见算法 (1)经典之王:单词计数这个是MapReduce的经典案例,经典的不能再经典了! (2)数据去重 "数据去重"主要是为了掌握和利用并行化思 ...
Hadoop学习笔记—11.MapReduce中的排序和分组
一.写在之前的 1.1 回顾Map阶段四大步骤首先,我们回顾一下在MapReduce中,排序和分组在哪里被执行: 从上图中可以清楚地看出,在Step1.4也就是第四步中,需要对不同分区中的数据进行排 ...
[原创] hadoop学习笔记：wordcout程序实践
看了官网上的示例:但是给的不是很清楚,这里依托官网给出的示例,加上自己的实践,解析worcount程序的操作 1.首先你的确定你的集群正确安装,并且启动你的集群,应为这个是hadoop2.6.0,所以 ...
Hadoop学习笔记： MapReduce二次排序
本文给出一个实现MapReduce二次排序的例子 package SortTest; import java.io.DataInput; import java.io.DataOutput; impo ...

随机推荐

Tempdb--关于表变量的一点疑问和测试
在思考表变量与临时表之间区别时,表变量不会受事务回滚的影响,那么是否意味着表变量无需写入日志呢? 测试方式: 分别对tempdb上的用户表/临时表/表变量进行10000次插入,查看日志写入次数,使用 ...
C# volatile 关键字
volatile 就像大家更熟悉的const一样,volatile是一个类型修饰符(type specifier).它是被设计用来修饰被不同线程访问和修改的变量.如果不加入volatile,基本上会导 ...
ASP.Net Core 2.2 InProcess托管的Bug：unable to open database file
最近把项目更新到了ASP.Net Core 2.2,发布之后发现在IIS下使用SQLite数据库不行了,报异常说不能打开数据库."unable to open database file&q ...
【cocos2d-x 手游研发----地图活起来了】
谈到地图不少人都说要做地图编辑器了,但是我暂时绕过这一步,如果不用寻路地图就不能移动?寻路就是会绕过障碍物的算法. 我做了一个简单的地图的思想,就是地图分层3层:背景层.可行区域层.遮罩层,但是地图就 ...
Python 读取大文件的方式
对于读取容量小的文件,可以使用下面的方法: with open("path", "r") as f: f.read() 但是如果文件容量很大,高达几个G或者十几 ...
Binary Search-483. Smallest Good Base
For an integer n, we call k>=2 a good base of n, if all digits of n base k are 1. Now given a str ...
萝卜保卫战3内购破解+Toast窗口增加（Love版）
涉及到一些不同的破解的方法,以及不同的破解思路,还有一些重要权限的删除等. 作者:HAI_ 这次目标是经常玩的萝卜保卫战,不知不觉,已经更新到3了.详细分析请参考https://bbs.ichunqi ...
[Auto Testing] 工具准备：Selenium 与 ChromeDriver
<留存> Selenium http://selenium-release.storage.googleapis.com/index.html https://www.seleniumhq ...
C# - 反射与编译
编译首先了解下,如何区分编译生成的 .dll的版本方法1:ILSpy反编译工具通过 assembly属性,release版本没有或仅有如下一种属性 [assembly: Debuggable(De ...
ionic的基础学习（第一篇）
1.ioinc的头部与底部 1.Header 固定在屏幕的顶端的组件,可包含标题,左右的功能按钮.(提供很多颜色的样式,及调用不同的样式名,亦可自定义) bar-light,bar-stable,ba ...

hadoop学习笔记（九）：MapReduce程序的编写

一、MapReduce主要继承两个父类：

Map

Reduce

二、使用代码实现WordCount：

hadoop学习笔记（九）：MapReduce程序的编写的更多相关文章

随机推荐

热门专题