map reduce相关程序

Test_1.java

/**

 * Hadoop网络课程模板程序

 * 编写者：James

 */  

import java.io.IOException;

import java.text.DateFormat;

import java.text.SimpleDateFormat;

import java.util.Date;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.conf.Configured;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.*;

import org.apache.hadoop.mapreduce.*;

import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

import org.apache.hadoop.mapreduce.lib.output.TextOutputFormat;

import org.apache.hadoop.util.Tool;

import org.apache.hadoop.util.ToolRunner;

/**

 * 无Reducer版本

 */

public class Test_1 extends Configured implements Tool {    

    /**

     * 计数器

     * 用于计数各种异常数据

     */

    enum Counter

    {

        LINESKIP,    //出错的行

    }

    /**

     * MAP任务

     */

    public static class Map extends Mapper<LongWritable, Text, NullWritable, Text>

    {

        public void map ( LongWritable key, Text value, Context context ) throws IOException, InterruptedException

        {

            String line = value.toString();                //读取源数据

            try

            {

                //数据处理

                String [] lineSplit = line.split(" ");

                String month = lineSplit[0];

                String time = lineSplit[1];

                String mac = lineSplit[6];

                Text out = new Text(month + ' ' + time + ' ' + mac);

                context.write( NullWritable.get(), out);    //输出

            }

            catch ( java.lang.ArrayIndexOutOfBoundsException e )

            {

                context.getCounter(Counter.LINESKIP).increment(1);    //出错令计数器+1

                return;

            }

        }

    }

    @Override

    public int run(String[] args) throws Exception

    {

        Configuration conf = getConf();

        Job job = new Job(conf, "Test_1");                                //任务名

        job.setJarByClass(Test_1.class);                                //指定Class

        FileInputFormat.addInputPath( job, new Path(args[0]) );            //输入路径

        FileOutputFormat.setOutputPath( job, new Path(args[1]) );        //输出路径

        job.setMapperClass( Map.class );                                //调用上面Map类作为Map任务代码

        job.setOutputFormatClass( TextOutputFormat.class );

        job.setOutputKeyClass( NullWritable.class );                    //指定输出的KEY的格式

        job.setOutputValueClass( Text.class );                            //指定输出的VALUE的格式

        job.waitForCompletion(true);

        //输出任务完成情况

        System.out.println( "任务名称：" + job.getJobName() );

        System.out.println( "任务成功：" + ( job.isSuccessful()?"是":"否" ) );

        System.out.println( "输入行数：" + job.getCounters().findCounter("org.apache.hadoop.mapred.Task$Counter", "MAP_INPUT_RECORDS").getValue() );

        System.out.println( "输出行数：" + job.getCounters().findCounter("org.apache.hadoop.mapred.Task$Counter", "MAP_OUTPUT_RECORDS").getValue() );

        System.out.println( "跳过的行：" + job.getCounters().findCounter(Counter.LINESKIP).getValue() );

        return job.isSuccessful() ? 0 : 1;

    }

    /**

     * 设置系统说明

     * 设置MapReduce任务

     */

    public static void main(String[] args) throws Exception

    {

        //判断参数个数是否正确

        //如果无参数运行则显示以作程序说明

        if ( args.length != 2 )

        {

            System.err.println("");

            System.err.println("Usage: Test_1 < input path > < output path > ");

            System.err.println("Example: hadoop jar ~/Test_1.jar hdfs://localhost:9000/home/james/Test_1 hdfs://localhost:9000/home/james/output");

            System.err.println("Counter:");

            System.err.println("\t"+"LINESKIP"+"\t"+"Lines which are too short");

            System.exit(-1);

        }

        //记录开始时间

        DateFormat formatter = new SimpleDateFormat( "yyyy-MM-dd HH:mm:ss" );

        Date start = new Date();

        //运行任务

        int res = ToolRunner.run(new Configuration(), new Test_1(), args);

        //输出任务耗时

        Date end = new Date();

        float time =  (float) (( end.getTime() - start.getTime() ) / 60000.0) ;

        System.out.println( "任务开始：" + formatter.format(start) );

        System.out.println( "任务结束：" + formatter.format(end) );

        System.out.println( "任务耗时：" + String.valueOf( time ) + " 分钟" ); 

        System.exit(res);

    }

}

Test_1数据

Apr 23 11:49:54 hostapd: wlan0: STA 14:7d:c5:9e:fb:84

Apr 23 11:49:52 hostapd: wlan0: STA 74:e5:0b:04:28:f2

Apr 23 11:49:50 hostapd: wlan0: STA cc:af:78:cc:d5:5d

Apr 23 11:49:44 hostapd: wlan0: STA cc:af:78:cc:d5:5d

Apr 23 11:49:43 hostapd: wlan0: STA 74:e5:0b:04:28:f2

Apr 23 11:49:42 hostapd: wlan0: STA 14:7d:c5:9e:fb:84

Test_2.java

/**

 * Hadoop网络课程模板程序

 * 编写者：James

 */  

import java.io.IOException;

import java.text.DateFormat;

import java.text.SimpleDateFormat;

import java.util.Date;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.conf.Configured;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.*;

import org.apache.hadoop.mapreduce.*;

import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

import org.apache.hadoop.mapreduce.lib.output.TextOutputFormat;

import org.apache.hadoop.util.Tool;

import org.apache.hadoop.util.ToolRunner;

/**

 * 有Reducer版本

 */

public class Test_2 extends Configured implements Tool {    

    /**

     * 计数器

     * 用于计数各种异常数据

     */

    enum Counter

    {

        LINESKIP,    //出错的行

    }

    /**

     * MAP任务

     */

    public static class Map extends Mapper<LongWritable, Text, Text, Text>

    {

        public void map ( LongWritable key, Text value, Context context ) throws IOException, InterruptedException

        {

            String line = value.toString();                //读取源数据

            try

            {

                //数据处理

                String [] lineSplit = line.split(" ");

                String anum = lineSplit[0];

                String bnum = lineSplit[1];

                context.write( new Text(bnum), new Text(anum) );    //输出

            }

            catch ( java.lang.ArrayIndexOutOfBoundsException e )

            {

                context.getCounter(Counter.LINESKIP).increment(1);    //出错令计数器+1

                return;

            }

        }

    }

    /**

     * REDUCE任务

     */

    public static class Reduce extends Reducer<Text, Text, Text, Text>

    {

        public void reduce ( Text key, Iterable<Text> values, Context context ) throws IOException, InterruptedException

        {

            String valueString;

            String out = "";

            for ( Text value : values )

            {

                valueString = value.toString();

                out += valueString + "|";

            }

            context.write( key, new Text(out) );

        }

    }

    @Override

    public int run(String[] args) throws Exception

    {

        Configuration conf = getConf();

        Job job = new Job(conf, "Test_2");                                //任务名

        job.setJarByClass(Test_2.class);                                //指定Class

        FileInputFormat.addInputPath( job, new Path(args[0]) );            //输入路径

        FileOutputFormat.setOutputPath( job, new Path(args[1]) );        //输出路径

        job.setMapperClass( Map.class );                                //调用上面Map类作为Map任务代码

        job.setReducerClass ( Reduce.class );                            //调用上面Reduce类作为Reduce任务代码

        job.setOutputFormatClass( TextOutputFormat.class );

        job.setOutputKeyClass( Text.class );                            //指定输出的KEY的格式

        job.setOutputValueClass( Text.class );                            //指定输出的VALUE的格式

        job.waitForCompletion(true);

        //输出任务完成情况

        System.out.println( "任务名称：" + job.getJobName() );

        System.out.println( "任务成功：" + ( job.isSuccessful()?"是":"否" ) );

        System.out.println( "输入行数：" + job.getCounters().findCounter("org.apache.hadoop.mapred.Task$Counter", "MAP_INPUT_RECORDS").getValue() );

        System.out.println( "输出行数：" + job.getCounters().findCounter("org.apache.hadoop.mapred.Task$Counter", "MAP_OUTPUT_RECORDS").getValue() );

        System.out.println( "跳过的行：" + job.getCounters().findCounter(Counter.LINESKIP).getValue() );

        return job.isSuccessful() ? 0 : 1;

    }

    /**

     * 设置系统说明

     * 设置MapReduce任务

     */

    public static void main(String[] args) throws Exception

    {

        //判断参数个数是否正确

        //如果无参数运行则显示以作程序说明

        if ( args.length != 2 )

        {

            System.err.println("");

            System.err.println("Usage: Test_2 < input path > < output path > ");

            System.err.println("Example: hadoop jar ~/Test_2.jar hdfs://localhost:9000/home/james/Test_2 hdfs://localhost:9000/home/james/output");

            System.err.println("Counter:");

            System.err.println("\t"+"LINESKIP"+"\t"+"Lines which are too short");

            System.exit(-1);

        }

        //记录开始时间

        DateFormat formatter = new SimpleDateFormat( "yyyy-MM-dd HH:mm:ss" );

        Date start = new Date();

        //运行任务

        int res = ToolRunner.run(new Configuration(), new Test_2(), args);

        //输出任务耗时

        Date end = new Date();

        float time =  (float) (( end.getTime() - start.getTime() ) / 60000.0) ;

        System.out.println( "任务开始：" + formatter.format(start) );

        System.out.println( "任务结束：" + formatter.format(end) );

        System.out.println( "任务耗时：" + String.valueOf( time ) + " 分钟" ); 

        System.exit(res);

    }

}

Test_2数据

13599999999 10086

13899999999    120

13944444444 13800138000

13722222222 13800138000

18800000000 120

13722222222 10086

18944444444 10086

Exercise_1.java

/**

 * Hadoop网络课程作业程序

 * 编写者：James

 */  

import java.io.IOException;

import java.text.DateFormat;

import java.text.SimpleDateFormat;

import java.util.Date;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.conf.Configured;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.*;

import org.apache.hadoop.mapreduce.*;

import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

import org.apache.hadoop.mapreduce.lib.output.TextOutputFormat;

import org.apache.hadoop.util.Tool;

import org.apache.hadoop.util.ToolRunner;

public class Exercise_1 extends Configured implements Tool {    

    /**

     * 计数器

     * 用于计数各种异常数据

     */

    enum Counter

    {

        LINESKIP,    //出错的行

    }

    /**

     * MAP任务

     */

    public static class Map extends Mapper<LongWritable, Text, NullWritable, Text>

    {

        public void map ( LongWritable key, Text value, Context context ) throws IOException, InterruptedException

        {

            String line = value.toString();                //读取源数据

            try

            {

                //数据处理

                String [] lineSplit = line.split(" ");

                String month = lineSplit[0];

                String time = lineSplit[1];

                String mac = lineSplit[6];

                /**  需要注意的部分       **/ 

                String name = context.getConfiguration().get("name");

                Text out = new Text(name + ' ' + month + ' ' + time + ' ' + mac);

                /**  需要注意的部分       **/ 

                context.write( NullWritable.get(), out);    //输出

            }

            catch ( java.lang.ArrayIndexOutOfBoundsException e )

            {

                context.getCounter(Counter.LINESKIP).increment(1);    //出错令计数器+1

                return;

            }

        }

    }

    @Override

    public int run(String[] args) throws Exception

    {

        Configuration conf = getConf();

        /**  需要注意的部分       **/ 

        conf.set("name", args[2]);

        /**  需要注意的部分       **/ 

        Job job = new Job(conf, "Exercise_1");                            //任务名

        job.setJarByClass(Exercise_1.class);                            //指定Class

        FileInputFormat.addInputPath( job, new Path(args[0]) );            //输入路径

        FileOutputFormat.setOutputPath( job, new Path(args[1]) );        //输出路径

        job.setMapperClass( Map.class );                                //调用上面Map类作为Map任务代码

        job.setOutputFormatClass( TextOutputFormat.class );

        job.setOutputKeyClass( NullWritable.class );                    //指定输出的KEY的格式

        job.setOutputValueClass( Text.class );                            //指定输出的VALUE的格式

        job.waitForCompletion(true);

        //输出任务完成情况

        System.out.println( "任务名称：" + job.getJobName() );

        System.out.println( "任务成功：" + ( job.isSuccessful()?"是":"否" ) );

        System.out.println( "输入行数：" + job.getCounters().findCounter("org.apache.hadoop.mapred.Task$Counter", "MAP_INPUT_RECORDS").getValue() );

        System.out.println( "输出行数：" + job.getCounters().findCounter("org.apache.hadoop.mapred.Task$Counter", "MAP_OUTPUT_RECORDS").getValue() );

        System.out.println( "跳过的行：" + job.getCounters().findCounter(Counter.LINESKIP).getValue() );

        return job.isSuccessful() ? 0 : 1;

    }

    /**

     * 设置系统说明

     * 设置MapReduce任务

     */

    public static void main(String[] args) throws Exception

    {

        //判断参数个数是否正确

        //如果无参数运行则显示以作程序说明

        if ( args.length != 3 )

        {

            System.err.println("");

            System.err.println("Usage: Test_1 < input path > < output path > < name >");

            System.err.println("Example: hadoop jar ~/Test_1.jar hdfs://localhost:9000/home/james/Test_1 
hdfs://localhost:9000/home/james/output hadoop");

            System.err.println("Counter:");

            System.err.println("\t"+"LINESKIP"+"\t"+"Lines which are too short");

            System.exit(-1);

        }

        //记录开始时间

        DateFormat formatter = new SimpleDateFormat( "yyyy-MM-dd HH:mm:ss" );

        Date start = new Date();

        //运行任务

        int res = ToolRunner.run(new Configuration(), new Exercise_1(), args);

        //输出任务耗时

        Date end = new Date();

        float time =  (float) (( end.getTime() - start.getTime() ) / 60000.0) ;

        System.out.println( "任务开始：" + formatter.format(start) );

        System.out.println( "任务结束：" + formatter.format(end) );

        System.out.println( "任务耗时：" + String.valueOf( time ) + " 分钟" ); 

        System.exit(res);

    }

}

result_1

hadoop Apr 23 14:7d:c5:9e:fb:84

hadoop Apr 23 74:e5:0b:04:28:f2

hadoop Apr 23 cc:af:78:cc:d5:5d

hadoop Apr 23 cc:af:78:cc:d5:5d

hadoop Apr 23 74:e5:0b:04:28:f2

hadoop Apr 23 14:7d:c5:9e:fb:84

Exercise_2.java

/**

 * Hadoop网络课程作业程序

 * 编写者：James

 */  

import java.io.IOException;

import java.text.DateFormat;

import java.text.SimpleDateFormat;

import java.util.Date;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.conf.Configured;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.*;

import org.apache.hadoop.mapreduce.*;

import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

import org.apache.hadoop.mapreduce.lib.output.TextOutputFormat;

import org.apache.hadoop.util.Tool;

import org.apache.hadoop.util.ToolRunner;

public class Exercise_2 extends Configured implements Tool {    

    /**

     * 计数器

     * 用于计数各种异常数据

     */

    enum Counter

    {

        LINESKIP,    //出错的行

    }

    /**

     * MAP任务

     */

    public static class Map extends Mapper<LongWritable, Text, NullWritable, Text>

    {

        /**  需要注意的部分       **/

        private String name;

        public void setup ( Context context )

        {

            this.name = context.getConfiguration().get("name");                    //读取名字

        }

        /**  需要注意的部分       **/

        public void map ( LongWritable key, Text value, Context context ) throws IOException, InterruptedException

        {

            String line = value.toString();                //读取源数据

            try

            {

                //数据处理

                String [] lineSplit = line.split(" ");

                String month = lineSplit[0];

                String time = lineSplit[1];

                String mac = lineSplit[6];

                /**  需要注意的部分       **/ 

                Text out = new Text(this.name + ' ' + month + ' ' + time + ' ' + mac);

                /**  需要注意的部分       **/ 

                context.write( NullWritable.get(), out);    //输出

            }

            catch ( java.lang.ArrayIndexOutOfBoundsException e )

            {

                context.getCounter(Counter.LINESKIP).increment(1);    //出错令计数器+1

                return;

            }

        }

    }

    @Override

    public int run(String[] args) throws Exception

    {

        Configuration conf = getConf();

        /**  需要注意的部分       **/ 

        conf.set("name", args[2]);

        /**  需要注意的部分       **/ 

        Job job = new Job(conf, "Exercise_2");                            //任务名

        job.setJarByClass(Exercise_2.class);                            //指定Class

        FileInputFormat.addInputPath( job, new Path(args[0]) );            //输入路径

        FileOutputFormat.setOutputPath( job, new Path(args[1]) );        //输出路径

        job.setMapperClass( Map.class );                                //调用上面Map类作为Map任务代码

        job.setOutputFormatClass( TextOutputFormat.class );

        job.setOutputKeyClass( NullWritable.class );                    //指定输出的KEY的格式

        job.setOutputValueClass( Text.class );                            //指定输出的VALUE的格式

        job.waitForCompletion(true);

        //输出任务完成情况

        System.out.println( "任务名称：" + job.getJobName() );

        System.out.println( "任务成功：" + ( job.isSuccessful()?"是":"否" ) );

        System.out.println( "输入行数：" + job.getCounters().findCounter("org.apache.hadoop.mapred.Task$Counter", "MAP_INPUT_RECORDS").getValue() );

        System.out.println( "输出行数：" + job.getCounters().findCounter("org.apache.hadoop.mapred.Task$Counter", "MAP_OUTPUT_RECORDS").getValue() );

        System.out.println( "跳过的行：" + job.getCounters().findCounter(Counter.LINESKIP).getValue() );

        return job.isSuccessful() ? 0 : 1;

    }

    /**

     * 设置系统说明

     * 设置MapReduce任务

     */

    public static void main(String[] args) throws Exception

    {

        //判断参数个数是否正确

        //如果无参数运行则显示以作程序说明

        if ( args.length != 3 )

        {

            System.err.println("");

            System.err.println("Usage: Test_1 < input path > < output path > < name >");

            System.err.println("Example: hadoop jar ~/Test_1.jar hdfs://localhost:9000/home/james/Test_1 
hdfs://localhost:9000/home/james/output hadoop");

            System.err.println("Counter:");

            System.err.println("\t"+"LINESKIP"+"\t"+"Lines which are too short");

            System.exit(-1);

        }

        //记录开始时间

        DateFormat formatter = new SimpleDateFormat( "yyyy-MM-dd HH:mm:ss" );

        Date start = new Date();

        //运行任务

        int res = ToolRunner.run(new Configuration(), new Exercise_2(), args);

        //输出任务耗时

        Date end = new Date();

        float time =  (float) (( end.getTime() - start.getTime() ) / 60000.0) ;

        System.out.println( "任务开始：" + formatter.format(start) );

        System.out.println( "任务结束：" + formatter.format(end) );

        System.out.println( "任务耗时：" + String.valueOf( time ) + " 分钟" ); 

        System.exit(res);

    }

}

改写test_2

/**

 * Hadoop网络课程模板程序

 * 编写者：James

 */  

import java.io.IOException;

import java.text.DateFormat;

import java.text.SimpleDateFormat;

import java.util.Date;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.conf.Configured;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.*;

import org.apache.hadoop.mapreduce.*;

import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

import org.apache.hadoop.mapreduce.lib.output.TextOutputFormat;

import org.apache.hadoop.util.Tool;

import org.apache.hadoop.util.ToolRunner;

/**

 * 有Reducer版本

 */

public class Test_2 extends Configured implements Tool {    

    /**

     * 计数器

     * 用于计数各种异常数据

     */

    enum Counter

    {

        LINESKIP,    //出错的行

    }

    /**

     * MAP任务

     */

    public static class Map extends Mapper<LongWritable, Text, Text, Text>

    {

        public void map ( LongWritable key, Text value, Context context ) throws IOException, InterruptedException

        {

            String line = value.toString();                //读取源数据

            try

            {

                //数据处理

                String [] lineSplit = line.split(" ");

                String anum = lineSplit[0];

                String bnum = lineSplit[1];

                context.write( new Text(bnum), new Text(anum) );    //输出

            }

            catch ( java.lang.ArrayIndexOutOfBoundsException e )

            {

                context.getCounter(Counter.LINESKIP).increment(1);    //出错令计数器+1

                return;

            }

        }

    }

    /**

     * REDUCE任务

     */

    public static class Reduce extends Reducer<Text, Text, Text, Text>

    {

        public void reduce ( Text key, Iterable<Text> values, Context context ) throws IOException, InterruptedException

        {

            String valueString;

            String out = "";

            String name = context.getConfiguration().get("name");

            for ( Text value : values )

            {

                valueString = value.toString();

                out += valueString + "|";

            }

            context.write( key, new Text(out) + "|" + name );

        }

    }

    @Override

    public int run(String[] args) throws Exception

    {

        Configuration conf = getConf();

        conf.set("name", args[2]);

        Job job = new Job(conf, "Test_2");                                //任务名

        job.setJarByClass(Test_2.class);                                //指定Class

        FileInputFormat.addInputPath( job, new Path(args[0]) );            //输入路径

        FileOutputFormat.setOutputPath( job, new Path(args[1]) );        //输出路径

        job.setMapperClass( Map.class );                                //调用上面Map类作为Map任务代码

        job.setReducerClass ( Reduce.class );                            //调用上面Reduce类作为Reduce任务代码

        job.setOutputFormatClass( TextOutputFormat.class );

        job.setOutputKeyClass( Text.class );                            //指定输出的KEY的格式

        job.setOutputValueClass( Text.class );                            //指定输出的VALUE的格式

        job.waitForCompletion(true);

        //输出任务完成情况

        System.out.println( "任务名称：" + job.getJobName() );

        System.out.println( "任务成功：" + ( job.isSuccessful()?"是":"否" ) );

        System.out.println( "输入行数：" + job.getCounters().findCounter("org.apache.hadoop.mapred.Task$Counter", "MAP_INPUT_RECORDS").getValue() );

        System.out.println( "输出行数：" + job.getCounters().findCounter("org.apache.hadoop.mapred.Task$Counter", "MAP_OUTPUT_RECORDS").getValue() );

        System.out.println( "跳过的行：" + job.getCounters().findCounter(Counter.LINESKIP).getValue() );

        return job.isSuccessful() ? 0 : 1;

    }

    /**

     * 设置系统说明

     * 设置MapReduce任务

     */

    public static void main(String[] args) throws Exception

    {

        //判断参数个数是否正确

        //如果无参数运行则显示以作程序说明

        if ( args.length != 3 )

        {

            System.err.println("");

            System.err.println("Usage: Test_2 < input path > < output path > ");

            System.err.println("Example: hadoop jar ~/Test_2.jar hdfs://localhost:9000/home/james/Test_2 hdfs://localhost:9000/home/james/output hadoop");

            System.err.println("Counter:");

            System.err.println("\t"+"LINESKIP"+"\t"+"Lines which are too short");

            System.exit(-1);

        }

        //记录开始时间

        DateFormat formatter = new SimpleDateFormat( "yyyy-MM-dd HH:mm:ss" );

        Date start = new Date();

        //运行任务

        int res = ToolRunner.run(new Configuration(), new Test_2(), args);

        //输出任务耗时

        Date end = new Date();

        float time =  (float) (( end.getTime() - start.getTime() ) / 60000.0) ;

        System.out.println( "任务开始：" + formatter.format(start) );

        System.out.println( "任务结束：" + formatter.format(end) );

        System.out.println( "任务耗时：" + String.valueOf( time ) + " 分钟" ); 

        System.exit(res);

    }

}

result_2

10086    13599999999|13722222222|18944444444|hadoop

120    18800000000|hadoop

13800138000    13944444444|13722222222|hadoop

map reduce相关程序的更多相关文章

Hadoop Map/Reduce 示例程序WordCount
#进入hadoop安装目录 cd /usr/local/hadoop #创建示例文件:input #在里面输入以下内容: #Hello world, Bye world! vim input #在hd ...
Hadoop Map/Reduce教程
原文地址:http://hadoop.apache.org/docs/r1.0.4/cn/mapred_tutorial.html 目的先决条件概述输入与输出例子:WordCount v1.0 ...
Map/Reduce应用开发基础知识-摘录
Map/Reduce 这部分文档为用户将会面临的Map/Reduce框架中的各个环节提供了适当的细节.这应该会帮助用户更细粒度地去实现.配置和调优作业.然而,请注意每个类/接口的javadoc文档提供 ...
一步一步跟我学习hadoop(5)----hadoop Map/Reduce教程（2）
Map/Reduce用户界面本节为用户採用框架要面对的各个环节提供了具体的描写叙述,旨在与帮助用户对实现.配置和调优进行具体的设置.然而,开发时候还是要相应着API进行相关操作. 首先我们须要了解M ...
hadoop入门级总结二：Map/Reduce
在上一篇博客:hadoop入门级总结一:HDFS中,简单的介绍了hadoop分布式文件系统HDFS的整体框架及文件写入读出机制.接下来,简要的总结一下hadoop的另外一大关键技术之一分布式计算框架: ...
马士兵hadoop第四课：Yarn和Map/Reduce配置启动和原理讲解
马士兵hadoop第一课:虚拟机搭建和安装hadoop及启动马士兵hadoop第二课:hdfs集群集中管理和hadoop文件操作马士兵hadoop第三课:java开发hdfs 马士兵hadoop第 ...
马士兵hadoop第四课：Yarn和Map/Reduce配置启动和原理讲解(转)
马士兵hadoop第一课:虚拟机搭建和安装hadoop及启动马士兵hadoop第二课:hdfs集群集中管理和hadoop文件操作马士兵hadoop第三课:java开发hdfs 马士兵hadoop第 ...
Hadoop学习笔记2 - 第一和第二个Map Reduce程序
转载请标注原链接http://www.cnblogs.com/xczyd/p/8608906.html 在Hdfs学习笔记1 - 使用Java API访问远程hdfs集群中,我们已经可以完成了访问hd ...
map reduce程序示例
map reduce程序示例 package test2; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop. ...

随机推荐

使用 kubeadm 搭建 kubernetes1.10 集群
PS:所有节点安装之前记得先把镜像准备好,否者将无法启动,也不报错. $ cat /etc/hosts192.168.11.1 master192.168.11.2 node 禁用防火墙: $ sys ...
【XJOI】【NOI考前模拟赛7】
DP+卡常数+高精度/ 计算几何+二分+判区间交/ 凸包首先感谢徐老师的慷慨,让蒟蒻有幸膜拜了学军的神题.祝NOI2015圆满成功同时膜拜碾压了蒟蒻的众神QAQ 填填填我的DP比较逗比……( ...
@SpringContext通过实现ApplicationContextAware接口动态获取bean
场景: 在代码中需要动态获取spring管理的bean 目前遇到的主要有两种场景:1.在工具类中需要调用某一个Service完成某一个功能,如DictUtils2.在实现了Runnable接口的任务类 ...
@Java类加载器及双亲委派模型
类与类加载器虚拟机设计团队把类加载阶段的"通过一个类的全限定名来获取此类的二进制字节流"这个动作放到Java虚拟机外部去实现,以便让应用程序自己决定如何去获取所需要的类.实现这个 ...
crtmpserver实现防盗流和流推送验证之二
IV. Catching the thieves 抓住小偷 Well, we have just added a secure mechanism to our little streaming se ...
springboot securyt 默认的用户名和密码
用户名:user 密码在控制台,每次启动的时候会生成一个随机的密码,如下:
MySQL源码升级
mysql源码升级升级的方法一般有两类: 1.利用mysqldump来直接导出sql文件,导入到新库中,这种方法是最省事儿的,也是最保险的,缺点的话,也显而易见,大库的mysqldump费时费力. ...
ORACLE关于锁表查询的部分SQL
http://www.cnblogs.com/quanweiru/archive/2012/08/28/2660700.html --查询表空间名称和大小 SELECT UPPER (F.TABLES ...
PHP的CLI综合
tip1:传入参数使用标准的输入和输出 PHP CLI会定义三个常量,以便让在命令行提示符下与解释器进行交互操作更加容易.这些常量见表格A.表格A 常量说明STDIN 标准的输入设备STDO ...
Linux文件类型(学习笔记六)
一.Linux下的文件类型普通文件:在由 ls –al 所显示出来的属性方面,第一个属性为 [ - ] 目录文件:在由 ls –al 所显示出来的属性方面,第一个属性为 [ d ] 设备文件:一般都 ...

map reduce相关程序

map reduce相关程序的更多相关文章

随机推荐

热门专题