Ubuntu环境下eclipse的hadoop开发

在安装好hadoop伪分布式后，开始搭建eclipse的hadoop开发环境

我的版本信息如下：

Ubuntu 版本 12.10

Hadoop版本 1.2.1

Java版本 1.6.0_31（命令java -version）

于2014年8月1日安装成功

1.安装Eclipse

调用我写的这篇博客点击打开链接

2.复制eclipse_hadoop插件

在网上下载hadoop-1.2.1-eclipse-plugin.jar插件（插件版本一定要与hadoop的版本匹配,否则无法成功启动）后复制到eclipse/plugins目录下，重启eclipse

3.安装成功的表现

第一在open perspective >other里

有mapreduce

第二在 windows -> preferences里面会多一个hadoop
map/reduce的选项，

4.在终端（terminal）启动hadoop

先切换用户

naomi@ubuntu:~$ su hadoop

输入密码

Password:

转到hadoop目录下

hadoop@ubuntu:/home/naomi$ cd /usr/local/hadoop

启动所有东东

hadoop@ubuntu:/usr/local/hadoop$bin/start-all.sh

这一步不做就无法连接到hadoop

5.配置参数

点击这个蓝大象就会new hadoop location

可以发现很多都是默认填好的，不需要去改，更不需要去查安装时的配置文件，在这个设置页面中，你只需要填两项

1.location name 随便取名字

2.确认user name一定是hadoop(安装hadoop时的用户),如果不是hadoop,而是root或其他用户，必须退出以hadoop用户的身份启动eclipse（若此时启动eclipse出错参见我的另一篇博客 http://blog.csdn.net/unflynaomi/article/details/38340383 ），否则出错

然后选择上面的advanced parameter选项卡

改这两项即可，其他不动这两个参数在“hadoop/conf/core-site.xml”进行了配置,可以查看

点击ok

6.加载hdfs文件系统

配置完后，就在左面有了hdfs文件系统了

如果没有出来那么一定参数配置错误选择

edit hadoop location即可重新编辑

7.创建工程

File
-> New -> Project 选择“Map/Reduce Project”，然后输入项目名称，创建项目。插件会自动把hadoop根目录和lib目录下的所有jar包导入。

8.添加wordcount class

在工程上右键，new class即可，class名字为wordcount

9.运行mapreduce

源代码为：

package com.baison.action;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.io.LongWritable;

import org.apache.hadoop.mapred.FileInputFormat;

import org.apache.hadoop.mapred.FileOutputFormat;

import org.apache.hadoop.mapred.JobClient;

import org.apache.hadoop.mapred.JobConf;

import org.apache.hadoop.mapred.lib.TokenCountMapper;

import org.apache.hadoop.mapred.lib.LongSumReducer;

public class WordCount {

    public static void main(String[] args) {

        JobClient client = new JobClient();

        JobConf conf = new JobConf(WordCount.class);

        String[] arg = { "hdfs://localhost:9000/user/hadoop/input",  

                "hdfs://localhost:9000/user/hadoop/output3" };  //这句指明了输入输出文件，input文件夹下所有文件都是输入文件，输出目录不可重复

        FileInputFormat.addInputPath(conf, new Path(arg[0]));

        FileOutputFormat.setOutputPath(conf, new Path(arg[1]));

        conf.setOutputKeyClass(Text.class);

        conf.setOutputValueClass(LongWritable.class);

        conf.setMapperClass(TokenCountMapper.class);

        conf.setCombinerClass(LongSumReducer.class);

        conf.setReducerClass(LongSumReducer.class);

        client.setConf(conf);

        try {

            JobClient.runJob(conf);

        } catch (Exception e) {

            e.printStackTrace();

        }

    }

}

Run As -> Run on Hadoop

部分运行过程如下

14/08/01 10:36:27 INFO mapred.JobClient: Total committed heap usage (bytes)=3001692160

14/08/01 10:36:27 INFO mapred.JobClient: CPU time spent (ms)=0

14/08/01 10:36:27 INFO mapred.JobClient: Map input bytes=34768

14/08/01 10:36:27 INFO mapred.JobClient: SPLIT_RAW_BYTES=2074

14/08/01 10:36:27 INFO mapred.JobClient: Combine input records=3452

14/08/01 10:36:27 INFO mapred.JobClient: Reduce input records=1654

14/08/01 10:36:27 INFO mapred.JobClient: Reduce input groups=871

14/08/01 10:36:27 INFO mapred.JobClient: Combine output records=1654

14/08/01 10:36:27 INFO mapred.JobClient: Physical memory (bytes) snapshot=0

14/08/01 10:36:27 INFO mapred.JobClient: Reduce output records=871

14/08/01 10:36:27 INFO mapred.JobClient: Virtual memory (bytes) snapshot=0

14/08/01 10:36:27 INFO mapred.JobClient: Map output records=3452

部分运行结果如下：（可以直接在eclipse中查看）

"". 4

"*" 10

"AS 6

"License"); 6

"alice,bob 10

"console" 2

"hadoop.root.logger". 2

"jks". 4

圆满成功

本文部分参考http://blog.csdn.net/xiaotom5/article/details/8080595#

Ubuntu环境下eclipse的hadoop开发的更多相关文章

ubuntu环境下eclipse的安装以及hadoop插件的配置
ubuntu环境下eclipse的安装以及hadoop插件的配置一.eclipse的安装在ubuntu桌面模式下,点击任务栏中的ubuntu软件中心,在搜索栏搜索eclipse 注意:安装过程需要 ...
在windows环境中用eclipse搭建hadoop开发环境
1. 整体环境和设置 1.1 hadoo1.0.4集群部署在4台VMWare虚拟机中,这四台虚拟机都是通过NAT模式连接主机集群中/etc/hosts文件配置 #本机127.0.0.1 localh ...
在ubuntu下使用Eclipse搭建Hadoop开发环境
一.安装准备1.JDK版本:jdk1.7.0(jdk-7-linux-i586.tar.gz)2.hadoop版本:hadoop-1.1.1(hadoop-1.1.1.tar.gz)3.eclipse ...
Windows下搭建Spark+Hadoop开发环境
Windows下搭建Spark+Hadoop开发环境需要一些工具支持. 只需要确保您的电脑已装好Java环境,那么就可以开始了. 一. 准备工作 1. 下载Hadoop2.7.1版本(写Spark和H ...
mac10.9下eclipse的storm开发环境搭建
--------------------------------------- 博文作者:迦壹博客地址:http://idoall.org/home.php?mod=space&uid=1& ...
windows环境下Eclipse开发MapReduce程序遇到的四个问题及解决办法
按此文章<Hadoop集群(第7期)_Eclipse开发环境设置>进行MapReduce开发环境搭建的过程中遇到一些问题,饶了一些弯路,解决办法记录在此: 文档目的: 记录windows环 ...
ubuntu环境配置eclipse+opencv
blockquote { direction: ltr; color: rgb(0, 0, 0) } blockquote.western { font-family: "Liberatio ...
Ubuntu环境下配置Android Studio【转】
本文转载自:https://www.jianshu.com/p/1f6295f9c955 之前学习Android开发的时候,一直跟各种教程一样,使用的是Eclipse+ADT,主要是比较方便,容易上手 ...
Linux(Ubuntu)环境下使用Fiddler
自己的开发环境是Ubuntu, 对于很多优秀的软件但是又没有Linux版本这件事,还是有点遗憾的.比如最近遇到一个问题,在分析某个网站的请求路径和cookie时就遇到了问题.本来Chome浏览器自带的 ...

随机推荐

Weblogic环境下hibernate、antlr类加载冲突问题分析及解决方案
公司应用项目在客户部署时经常遇到此类问题,为避免实施部署时增加配置量,花了点时间找到了此问题的终极解决办法(方案二.修改org.hibernate.hql.ast.HqlLexer的源代码).在此进行 ...
Mac下safari、chrome打开开发者工具快捷键
mac下safari和chrome打开开发者工具的快捷键相同,都是option(alt)+command+i 这个是我的默认配置,没有更改过的.
深入探讨Java类加载机制
一.前言毕业至今,已经三年光景,平时基本接触不到关于类加载器的技术(工作上),相信很多同行在开始工作后很长一段时间,对于类的加载机制都没有深入的了解过,之前偶然的机会接触了相关的知识,感觉挺有意思, ...
理解CSS3里的Flex布局用法
一.Flex布局是什么? Flex是Flexible Box的缩写,意为"弹性布局",用来为盒状模型提供最大的灵活性. 任何一个容器都可以指定为Flex布局. .box{ disp ...
spring framework项目源码github托管地址
方法一:直接下载,github托管地址:http://repo.spring.io/simple/libs-release-local/org/springframework/spring/ 方法二: ...
IIS8托管WCF服务
WCF服务程序本身不能运行,需要通过其他的宿主程序进行托管才能调用WCF服务功能,常见的宿主程序有IIS,WAS,Windows服务,当然在学习WCF技术的时候一般使用控制台应用程序或WinForm程 ...
Feature Engineering versus Feature Extraction: Game On!
Feature Engineering versus Feature Extraction: Game On! "Feature engineering" is a fancy t ...
ASP.NET为图片加上水印
为我们发布的图片加上一个水印,也是我们经常要做的事情,那怎么样来做呢,下面就一步步开始吧首先是一个制作水印的类:ImageHandler,代码如下: using System; using Syst ...
HDU 4022 Bombing（stl，map，multiset，iterater遍历）
题目参考了 1 2 #define _CRT_SECURE_NO_WARNINGS //用的是STL中的map 和 multiset 来做的,代码写起来比较简洁,也比较好容易理解. ...
HDU 4576 Robot(概率dp)
题目 /*********************复制来的大致题意********************** 有N个数字,M个操作, 区间L, R. 然后问经过M个操作后落在[L, R]的概率. * ...

Ubuntu环境下eclipse的hadoop开发

Ubuntu环境下eclipse的hadoop开发的更多相关文章

随机推荐

热门专题