mapreduce代码实现入门

　　mapreduce代码主要包括三个类，map类、reduce类以及测试类！

以wordcount为例，

map类为：

    static class WordMapper extends Mapper<Object, Text, Text, IntWritable>{

        private final static IntWritable one = new IntWritable(1);

        private Text word = new Text();

        public void map(Object key, Text value, Context context)

            throws IOException, InterruptedException{

            StringTokenizer itr = new StringTokenizer(value.toString());

            while (itr.hasMoreElements()) {

                word.set(itr.nextToken());

                context.write(word, one);

            }

        }

    }

reduce类为：

    static class WordReducer extends Reducer<Text, IntWritable, Text, IntWritable>{

        private IntWritable res = new IntWritable();

        public void reduce(Text key, Iterable<IntWritable> values, Context context)

            throws IOException, InterruptedException

        {

            int sum = 0;

            for(IntWritable val:values){

                sum += val.get();

            }

            res.set(sum);

            context.write(key, res);

        }

    }

主函数代码为：

    public static void main(String args[]) throws Exception{

        String inputfilepath = "hdfs://localhost:9000/input1";

        String outputfilepath = "hdfs://localhost:9000/output4";

        Configuration conf = new Configuration();

        Job job = new Job(conf);

        job.setJarByClass(WordCount.class);

        job.setJobName("word-count");

        job.setOutputKeyClass(Text.class);

        job.setOutputValueClass(IntWritable.class);

        job.setMapperClass(WordMapper.class);

        job.setReducerClass(WordReducer.class);

        job.setInputFormatClass(TextInputFormat.class);

        job.setOutputFormatClass(TextOutputFormat.class);

        FileInputFormat.addInputPath(job, new Path(inputfilepath));

        FileOutputFormat.setOutputPath(job, new Path(outputfilepath));

        job.waitForCompletion(true);

    }

其他的hadoop简单实例代码如：

数字求和：

 package goal;

 import java.io.IOException;

 import java.util.StringTokenizer;

 import org.apache.hadoop.conf.Configuration;

 import org.apache.hadoop.fs.Path;

 import org.apache.hadoop.io.FloatWritable;

 import org.apache.hadoop.io.LongWritable;

 import org.apache.hadoop.io.Text;

 import org.apache.hadoop.mapreduce.Job;

 import org.apache.hadoop.mapreduce.Mapper;

 import org.apache.hadoop.mapreduce.Reducer;

 import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

 import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

 import org.apache.hadoop.util.GenericOptionsParser;

 public class Sum {

     public static class SumMapper extends

         Mapper<Object, Text, Text, FloatWritable>{

         private Text word = new Text("sum");

         private static FloatWritable nv = new FloatWritable(1.0f);

         public void map(Object key, Text value, Context context)

             throws IOException, InterruptedException

         {

             StringTokenizer str = new StringTokenizer(value.toString());

             float sum = 0;

             while(str.hasMoreTokens()){

                 String s = str.nextToken();

                 float val = Float.parseFloat(s);

                 sum = val;

             }

             nv.set(sum);

             context.write(word, nv);

         }

     }

     public static class SumReducer extends

         Reducer<Text, FloatWritable, Text, FloatWritable>{

         private Text k = new Text("sum");

         private FloatWritable res = new FloatWritable();

         public void reduce(Text key, Iterable<FloatWritable> values,

                 Context context) throws IOException, InterruptedException{

             float sum = 0;

             for(FloatWritable val : values){

                 float v = val.get();

                 sum += v;

             }

             res.set(sum);

             context.write(k, res);

         }

     }

     public static void main(String args[])throws Exception{

         String other[] = {"hdfs://localhost:9000/input2/1.txt", "hdfs://localhost:9000/output3"};

         Configuration conf = new Configuration();

         System.out.println("yes");

         Job job = new Job(conf, "number sum");

         job.setJarByClass(Sum.class);

         job.setMapperClass(SumMapper.class);

         job.setReducerClass(SumReducer.class);

         job.setOutputKeyClass(Text.class);

         job.setOutputValueClass(FloatWritable.class);

         FileInputFormat.addInputPath(job, new Path(other[0]));

         FileOutputFormat.setOutputPath(job, new Path(other[1]));

         System.exit(job.waitForCompletion(true) ? 0 : 1);

         System.out.println("yes");

     }

 }

mapreduce代码实现入门的更多相关文章

Hadoop MapReduce编程 API入门系列之压缩和计数器（三十）
不多说,直接上代码. Hadoop MapReduce编程 API入门系列之小文件合并(二十九) 生成的结果,作为输入源. 代码 package zhouls.bigdata.myMapReduce. ...
Hadoop MapReduce编程 API入门系列之挖掘气象数据版本3（九）
不多说,直接上干货! 下面,是版本1. Hadoop MapReduce编程 API入门系列之挖掘气象数据版本1(一) 下面是版本2. Hadoop MapReduce编程 API入门系列之挖掘气象数 ...
Hadoop MapReduce编程 API入门系列之挖掘气象数据版本2（十）
下面,是版本1. Hadoop MapReduce编程 API入门系列之挖掘气象数据版本1(一) 这篇博文,包括了,实际生产开发非常重要的,单元测试和调试代码.这里不多赘述,直接送上代码. MRUni ...
Centos下命令行编译MapReduce代码(Java)并打包在Hadoop中执行
前提条件:搭建好Hadoop系统新建文件夹:input 和 output hdfs dfs -mkdir /inputhdfs dfs -mkdir /output 查看文件系统 hdfs df ...
【甘道夫】官方网站MapReduce代码注释具体实例
引言 1.本文不描写叙述MapReduce入门知识,这类知识网上非常多.请自行查阅 2.本文的实例代码来自官网 http://hadoop.apache.org/docs/current/hadoop ...
大数据(6) - MapReduce简易介绍入门
一 MapReduce入门 MapReduce定义(简单来说就是hadoop的数据分析核心,理解其中的原理,则可以分析聚合一切需求) Mapreduce是一个分布式运算程序的编程框架,是用户开发“基于 ...
Hadoop MapReduce编程 API入门系列之薪水统计（三十一）
不多说,直接上代码. 代码 package zhouls.bigdata.myMapReduce.SalaryCount; import java.io.IOException; import jav ...
Hadoop MapReduce编程 API入门系列之小文件合并（二十九）
不多说,直接上代码. Hadoop 自身提供了几种机制来解决相关的问题,包括HAR,SequeueFile和CombineFileInputFormat. Hadoop 自身提供的几种小文件合并机制 ...
Hadoop MapReduce编程 API入门系列之mr编程快捷键活用技巧详解（四）
1.Shift + Alt + S Hadoop没有使用jdk自带的默认序列化机制. 现在呢,hadoop-2.*里有两套序列化机制.一个是自己hadoop的序列化机制,一个是谷歌的. 所以,要改为. ...

随机推荐

用Gen4消除电容触摸屏设计屏障【转】
转自:http://www.cntronics.com/sensor-art/80015498?page=2 中心议题: 电容式触摸屏设计到产品的各种挑战解决方案: 用Gen4消除电容触摸屏设计屏障 ...
IDEA 2017.3 新版本中创建 JSF Web 应用程序缺少 web.xml 的解决办法
IDEA 2017.3 新版本中默认创建一个 Web 应用程序很可能不会自动创建 web.xml 文件.虽然说从 JavaEE 6.0 开始 Servlet 3.0 规范中就新增了一些注解可以免去传统 ...
解决 Mac OS X 下 IntelliJ IDEA、jEdit 等 Java 程序中文标点输入无效的方法
Mac OS X 下基于 Java 的程序(如 IntelliJ IDEA.jEdit 等)会出现中文标点输入无效的问题,在中文输入法状态,可以输入中文字,但输入中文标点最后上去的是英文标点.查阅了相 ...
终极CRUD-3-用Jackson解析json
目录 1 jackson json基本介绍和使用 2 jackson 常用的注解 2.1@JsonProperty 2.2 @JsonIgnore 2.3 @JsonIgnoreProperties ...
集合点-Jmeter-集合点详解
集合点:简单来理解一下,虽然我们的“性能测试”理解为“多用户并发测试”,但真正的并发是不存在的,为了更真实的实现并发这感念,我们可以在需要压力的地方设置集合点, 还拿那个用户和密码的地方,每到输入用户 ...
ActiveMQ 使用spring模板发布消息过程分析
convertAndSend()方法中获得dstination,即发送信息的目的地dstination可以在spring的配置文件中指定自定义的,在JmsTemplate类中,pubSubDomain ...
基于WPF系统框架设计(9)-多值绑定之IMultiValueConverter
应用场景我想把View层的一个布局控件和功能按钮传到ViewModel层,达到动态变更布局,同时灵活获取功能按钮的属性,让View和ViewModel完全分离,而不受View层影响. 最后我想到使用 ...
【POI】导出xls文件报错：The maximum number of cell styles was exceeded. You can define up to 4000 styles in a .xls workbook
使用POI导出xls文件,由于数据过多,导致导出xls报错如下: The maximum number of cell styles was exceeded. You can define up t ...
【Maven】3.使用IntelliJ IDEA 使用本地搭建的maven私服，而不是使用默认的maven设置
安装Idea的教程:http://www.cnblogs.com/sxdcgaq8080/p/7641379.html 搭建maven私服的教程:http://www.cnblogs.com/sxdc ...
查看linux 系统当前使用的网卡
使用ifconfig命令查看到linux 系统有三个网卡 ,其实我只要其中一个启用就可以了,用什么命令查看或者切换网卡,或者停用掉其他两个网卡? watch cat /proc/net/dev 看下哪 ...

mapreduce代码实现入门

mapreduce代码实现入门的更多相关文章

随机推荐

热门专题