一、安装Hadoop插件

　　1. 所需环境

　　　　　 hadoop2.0伪分布式环境平台正常运行

　　　　所需压缩包：eclipse-jee-luna-SR2-linux-gtk-x86_64.tar.gz
　　　　　　　　　　在Linux环境下运行的eclipse软件压缩包,解压后文件名为eclipse
　　　　　　　　　　hadoop2x-eclipse-plugin-master.zip
　　　　　　　　　　在eclipse中需要安装的Hadoop插件,解压后文件名为hadoop2x-eclipse-plugin-master

　　　　如图所示，将所有的压缩包放在同一个文件夹下并解压。

　　2.编译jar包

　　　　　　编译hadoop2x-eclipse-plugin-master的plugin 的插件源码，需要先安装ant工具

　　　　　　接着输入命令（注意ant命令在什么路径下使用，具体路径在下一张截图中，不然这个命令会用不了）：

ant jar -Dversion=2.6.0 -Declipse.home='/home/xiaow/hadoop2.0/eclipse'  # 刚才放进去的eclipse软件包的路径 -Dversion=2.6.0 hadoop的版本号

　　　　　　　　　　　　　　-Dhadoop.home='/home/xiaow/hadoop2.0/hadoop-2.6.0'  # hadoop安装文件的路径

　　　　　　等待一小会时间就好了
　　　　编译成功后，找到放在 /home/xiaow/ hadoop2.0/hadoop2x-eclipse-pluginmaster/build/contrib/eclipse-plugin下，名为hadoop-eclipse-plugin-2.6.0.jar的jar包，并将其拷贝到/hadoop2.0/eclipse/plugins下

　　　　输入命令：

cp -r /home/xiaow/hadoop2.0/hadoop2x-eclipse-plugin-master/build/contrib/eclipse-plugin/hadoop-eclipse-plugin-2.6.0.jar /home/xiaow/hadoop2.0/eclipse/plugins/

二、Eclipse配置

　　　　接下来打开eclipse软件

　　　　一定要出现这个图标，没有出现的话前面步骤可能错了，或者重新启动几次Eclipse

　　　　然后按照下面的截图操作：

　　　　如此，Eclipse环境搭建完成。

三、wordcount程序

　　　　建工程：

　　　　输入如下代码：

package wordcount;

import java.io.IOException;

import java.util.StringTokenizer;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.LongWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Job;

import org.apache.hadoop.mapreduce.Mapper;

import org.apache.hadoop.mapreduce.Reducer;

import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

import org.apache.hadoop.mapreduce.lib.input.TextInputFormat;

import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

import org.apache.hadoop.mapreduce.lib.output.TextOutputFormat;

import org.apache.hadoop.mapreduce.lib.reduce.IntSumReducer;

import org.apache.hadoop.util.GenericOptionsParser;

public class wordcount {  

	// 自定义的mapper，继承org.apache.hadoop.mapreduce.Mapper

    public static class WordCountMap extends Mapper<LongWritable, Text, Text, IntWritable> {  

        private final IntWritable one = new IntWritable(1);

        private Text word = new Text();  

        //  Mapper<LongWritable, Text, Text, LongWritable>.Context context

        public void map(LongWritable key, Text value, Context context)   throws IOException, InterruptedException {

            String line = value.toString();

            System.out.println(line);

            // split 函数是用于按指定字符（串）或正则去分割某个字符串，结果以字符串数组形式返回，这里按照“\t”来分割text文件中字符，即一个制表符

            // ，这就是为什么我在文本中用了空格分割，导致最后的结果有很大的出入

            StringTokenizer token = new StringTokenizer(line);

            while (token.hasMoreTokens()) {

                word.set(token.nextToken());

                context.write(word, one);

            }

        }

    }  

    // 自定义的reducer，继承org.apache.hadoop.mapreduce.Reducer

    public static class WordCountReduce extends Reducer<Text, IntWritable, Text, IntWritable> {  

    	// Reducer<Text, LongWritable, Text, LongWritable>.Context context

        public void reduce(Text key, Iterable<IntWritable> values, Context context) throws IOException, InterruptedException {

        	System.out.println(key);

        	System.out.println(values);

            int sum = 0;

            for (IntWritable val : values) {

                sum += val.get();

            }

            context.write(key, new IntWritable(sum));

        }

    }  

    //  客户端代码，写完交给ResourceManager框架去执行

    public static void main(String[] args) throws Exception {

        Configuration conf = new Configuration();

        Job job = new Job(conf,"word count"); 

        //  打成jar执行

        job.setJarByClass(wordcount.class);     

        //  数据在哪里？

        FileInputFormat.addInputPath(job, new Path(args[0])); 

        //  使用哪个mapper处理输入的数据？

        job.setMapperClass(WordCountMap.class);

        //  map输出的数据类型是什么？

        //job.setMapOutputKeyClass(Text.class);

        //job.setMapOutputValueClass(LongWritable.class);

        job.setCombinerClass(IntSumReducer.class);

        //  使用哪个reducer处理输入的数据

        job.setReducerClass(WordCountReduce.class); 

        //  reduce输出的数据类型是什么？

        job.setOutputKeyClass(Text.class);

        job.setOutputValueClass(IntWritable.class);  

//        job.setInputFormatClass(TextInputFormat.class);

//        job.setOutputFormatClass(TextOutputFormat.class);  

        //  数据输出到哪里？

        FileOutputFormat.setOutputPath(job, new Path(args[1]));  

        //  交给yarn去执行，直到执行结束才退出本程序

        job.waitForCompletion(true);  

        /*

        String[] otherArgs = new GenericOptionsParser(conf,args).getRemainingArgs();

        if(otherArgs.length<2){

        	System.out.println("Usage:wordcount <in> [<in>...] <out>");

        	System.exit(2);

        }

        for(int i=0;i<otherArgs.length-1;i++){

        	FileInputFormat.addInputPath(job, new Path(otherArgs[i]));

        }

        System.exit(job.waitForCompletion(tr0ue)?0:1);

        */

    }

}

　　　　将准备到的文档导入进去

　　　　目录结构如下：

　　　　运行mapreduce程序

　　　　OK，搞定收工！！！

Eclipse环境搭建并且运行wordcount程序的更多相关文章

（三）配置Hadoop1.2.1+eclipse(Juno版)开发环境，并运行WordCount程序
配置Hadoop1.2.1+eclipse(Juno版)开发环境,并运行WordCount程序一. 需求部分在ubuntu上用Eclipse IDE进行hadoop相关的开发,需要在Eclip ...
021_在Eclipse Indigo中安装插件hadoop-eclipse-plugin-1.2.1.jar，直接运行wordcount程序
1.工具介绍 Eclipse Idigo.JDK1.7-32bit.hadoop1.2.1.hadoop-eclipse-plugin-1.2.1.jar(自己网上下载) 2.插件安装步骤 1)将ha ...
《从0到1学习Flink》—— Mac 上搭建 Flink 1.6.0 环境并构建运行简单程序入门
准备工作 1.安装查看 Java 的版本号,推荐使用 Java 8. 安装 Flink 2.在 Mac OS X 上安装 Flink 是非常方便的.推荐通过 homebrew 来安装. brew in ...
OSGI企业应用开发（二）Eclipse中搭建Felix运行环境
上篇文章介绍了什么是OSGI以及使用OSGI构建应用的优点,接着介绍了两款常用的OSGI实现,分别为Apache Felix和Equinox,接下来开始介绍如何在Eclipse中使用Apache Fe ...
scala 入门Eclipse环境搭建及第一个入门经典程序HelloWorld
scala 入门Eclipse环境搭建及第一个入门经典程序HelloWorld 学习了: http://blog.csdn.net/wangmuming/article/details/3407911 ...
eclipse连hadoop2.x运行wordcount 转载
转载地址:http://my.oschina.net/cjun/blog/475576 一.新建java工程,并且导入hadoop相关jar包此处可以直接创建mapreduce项目就可以,不用下面折 ...
Java学习不走弯路教程（7.Eclipse环境搭建）
7.Eclipse环境搭建在前几章,我们熟悉了DOS环境下编译和运行Java程序,对于大规模的程序编写,开发工具是必不可少的.Java的开发工具比较常用的是Eclipse.在接下来的教程中,我们将基 ...
scala 入门Eclipse环境搭建
scala 入门Eclipse环境搭建及第一个入门经典程序HelloWorld IDE选择并下载: scala for eclipse 下载: http://scala-ide.org/downloa ...
Cesium入门2 - Cesium环境搭建及第一个示例程序
Cesium入门2 - Cesium环境搭建及第一个示例程序 Cesium中文网:http://cesiumcn.org/ | 国内快速访问:http://cesium.coinidea.com/ 验 ...

随机推荐

十二、针对单个工程来配置jdk版本
转载自:https://jingyan.baidu.com/article/9f63fb91427b06c8400f0e98.html 首先小编这里的eclipse工作空间默认的jdk版本是jdk1. ...
Qt跨平台开发Wince5.0和Android程序
所谓跨平台是指维护一份代码,可编译出多平台的应用程序.Qt这方面虽然已经做的不错,但性能还是体验,和原生开发工具开发的程序相比,差距还是不小的.但单从生产应用的角度来说,可以采用,不失为一种好的解决方 ...
C#使用CefSharp开源库开发Chrome 浏览器
一.介绍这个东西我以前没有接触过,但是公司项目里面有用到这个东西,所以就顺便研究一下.今天只是做了 WinForm 的测试,有时间了在试试 WPF 是如何实现的.刚开始一塌糊涂,有点麻 ...
hbase-读操作
(学习笔记) client和regionServer连接,通过rowkey查找对应的region 多个列簇生成多个storeScaner 每个storeScaner生成一个MemstoreScanne ...
Windows10开机pin界面循环重启解决办法
昨天电脑在开机时,进入pin界面,输入pin码之后系统没反应,也不显示登陆成功,大概一分钟之后自动重启,遂百度答案:大部分建议都是在开机显示win图标时强制关机,强制关机两次即自动进入疑难解答页面,以 ...
SSH 免密码登陆到多台机器
场景: 需要从主机1.100免密码多了到1.115及1.116 实现: 登陆1.100 $ cd ~/.ssh/ $ ssh-keygen -t rsa 然后三个回车会有两个文件产生,id_rsa ...
Spring Cloud的小改进（五）
1.在Eureka中不能看到具体服务的实例信息: 问题点:服务注册到 Eureka 之后,可以看到在 “Status” 显示的服务信息不明确(不知道具体的服务名等信息),如下图所示: 解决方法: 在服 ...
oracle异机恢复 open resetlogs 报：ORA-00392
参考文档:ALTER DATABASE OPEN RESETLOGS fails with ORA-00392 (Doc ID 1352133.1) 打开一个克隆数据库报以下错误: SQL> a ...
28. pt-table-sync
前提:得有checksum表 pt-table-sync --replicate=pt.checksum \h=192.168.100.101,P=3306,u=admin,p=admin \h=19 ...
第二阶段第七次spring会议
昨天我将尝试对软件进行添加搜索引擎的界面. private void linkLabel1_LinkClicked_1(object sender, LinkLabelLinkClickedEvent ...

Eclipse环境搭建并且运行wordcount程序

一、安装Hadoop插件

1. 所需环境

2.编译jar包

二、Eclipse配置

三、wordcount程序

Eclipse环境搭建并且运行wordcount程序的更多相关文章

随机推荐

热门专题

　　1. 所需环境

　　2.编译jar包