Hadoop2 自己动手编译Hadoop的eclipse插件

前言:

毕业两年了，之前的工作一直没有接触过大数据的东西，对hadoop等比较陌生，所以最近开始学习了。对于我这样第一次学的人，过程还是充满了很多疑惑和不解的，不过我采取的策略是还是先让环境跑起来，然后在能用的基础上在多想想为什么。

通过这三个礼拜(基本上就是周六周日，其他时间都在加班啊T T)的探索，我目前主要完成的是:

　　1.在Linux环境中伪分布式部署hadoop(SSH免登陆)，运行WordCount实例成功。 http://www.cnblogs.com/PurpleDream/p/4009070.html

2.自己打包hadoop在eclipse中的插件。 http://www.cnblogs.com/PurpleDream/p/4014751.html

3.在eclipse中访问hadoop运行WordCount成功。 http://www.cnblogs.com/PurpleDream/p/4021191.html

所以我下边会分三次记录下我的过程，为自己以后查阅方便，要是能帮助到其他人，自然是更好了！

===============================================================长长的分割线====================================================================

正文:

如果你想在eclipse中安装hadoop的插件，一个很重要的问题就是hadoop的版本与eclipse版本的匹配问题，如果不匹配，可能会导致很多问题。

综上，我在完成了在Linux的CentOS系统中安装hadoop并简单运行WordCount之后(具体参看本文前言中的博客链接)，将学习的重点放到了hadoop的eclipse插件上。其实网上也有部分文章在介绍如何编写插件，但是由于我的eclispe版本是Juno，而之前在CentOS安装的是hadoop-1.0.1，所以没有找到完全匹配的成功案例。所以最终决定自己也动手变异一个自己的hadoop插件。

在有了这个想法之后，一开始会觉得特别困难，但是在真正去做之后，会发现很多问题其实还是可以解决的，只要你懂得如果使用百度和谷歌，多参考一下别人的文章，汲取精华，最终一定会成功的。

第一步，确定大致流程:

　　 1.首先我需要ant编译，然后就是hadoop-1.0.1.tar.gz这个安装包，还有就是eclipse。

2.针对我自己的环境，电脑是Win7，eclispe是Juno，下载了hadoop-1.0.1.tar.gz，就差ant之前没有安装。

第二步，安装ant：

　　 1.我参考的是这篇文章http://blog.csdn.net/yang382197207/article/details/10185251，我当时下载的是apache-ant-1.9.4，其他的步骤按照这篇文章介绍的配置就会成功。

第三步，在正式建立项目之前，我在介绍下我的环境： OS: windows 7, Eclipse: Juno, JDK: 1.6.0_43, Hadoop: 1.0.1

1.首先在Eclipse中新建一个Java项目，名字叫hadoop-1.0.1-eclipse-plugin，其实这个名字你可以随意的。

2.解压hadoop-1.0.1.tar.gz，在解压后的目录中(我的是D:\SettingUp\ITSettingUp\Hadoop\hadoop-1.0\hadoop-1.0.1)，依次将下面的文件放到项目中:

(1).将\hadoop-1.0.1\src\contrib\eclipse-plugin里面的所有文件以及\hadoop-1.0.1\src\contrib\build-contrib.xml拖拽到项目中

(2).将根目录\hadoop-1.0.1里的所有.jar文件拖拽到eclipse项目中bin目录下。

3.打开项目中的build-contrib.xml，做如下的配置：

(1).找到<property name="hadoop.root" location="hadoop-1.0.1解压缩后的目录"/>

(2).找到<property name="eclipse.home" location="自己的eclipse的目录"/>

(3).找到<property name="version" value="hadoop的版本号"/>

可以参考我的配置，如图:

<property name="name" value="${ant.project.name}"/>

<property name="root" value="${basedir}"/>

<property name="hadoop.root" location="D:/SettingUp/ITSettingUp/Hadoop/hadoop-1.0/hadoop-1.0.1"/>

<property name="eclipse.home" location="D:/HaveSetted/ITHaveSetted/Eclipse"/>

<property name="version" value="1.0.1"/>

4.打开项目中的build.xml，做如下的配置：

(1).将文件开头的 <import file="../build-contrib.xml"/> 修改为 <import file="build-contrib.xml"/>

(2).在<javac...>里如下图加入includeantruntime="on"，效果如下：

<target name="compile" depends="init, ivy-retrieve-common" unless="skip.contrib">

    <echo message="contrib: ${name}"/>

    <javac

     encoding="${build.encoding}"

     srcdir="${src.dir}"

     includes="**/*.java"

     destdir="${build.classes}"

     debug="${javac.debug}"

     deprecation="${javac.deprecation}"

     includeantruntime="on">

     <classpath refid="classpath"/>

    </javac>

</target>

(3).在<path id="classpath">中添加：<path refid="hadoop-jars"/>，效果如下：

<!-- Override classpath to include Eclipse SDK jars -->

<path id="classpath">

    <pathelement location="${build.classes}"/>

    <pathelement location="${hadoop.root}/build/classes"/>

    <path refid="eclipse-sdk-jars"/>

    <path refid="hadoop-jars"/>

</path>

(4).在<target name="jar" depends="compile" unless="skip.contrib">这个标签里，在<copy file="${hadoop.root}/build/ivy/lib/Hadoop/common/commons-cli-${commons-cli.version}.jar" todir="${build.dir}/lib" verbose="true"/>这个配置的下面添加如下几个jar包的配置：

<copy file="${hadoop.root}/lib/commons-configuration-1.6.jar"  todir="${build.dir}/lib" verbose="true"/>

<copy file="${hadoop.root}/lib/commons-httpclient-3.0.1.jar"  todir="${build.dir}/lib" verbose="true"/>

<copy file="${hadoop.root}/lib/commons-lang-2.4.jar"  todir="${build.dir}/lib" verbose="true"/>

<copy file="${hadoop.root}/lib/jackson-core-asl-1.8.8.jar"  todir="${build.dir}/lib" verbose="true"/>

<copy file="${hadoop.root}/lib/jackson-mapper-asl-1.8.8.jar"  todir="${build.dir}/lib" verbose="true"/>

最终效果如图：

<!-- Override jar target to specify manifest -->

  <target name="jar" depends="compile" unless="skip.contrib">

    <mkdir dir="${build.dir}/lib"/>

    <copy file="${hadoop.root}/build/hadoop-core-${version}.jar" tofile="${build.dir}/lib/hadoop-core-1.0.1.jar" verbose="true"/>

    <copy file="${hadoop.root}/build/ivy/lib/Hadoop/common/commons-cli-${commons-cli.version}.jar"  todir="${build.dir}/lib" verbose="true"/>

    <copy file="${hadoop.root}/lib/commons-configuration-1.6.jar"  todir="${build.dir}/lib" verbose="true"/>

    <copy file="${hadoop.root}/lib/commons-httpclient-3.0.1.jar"  todir="${build.dir}/lib" verbose="true"/>

    <copy file="${hadoop.root}/lib/commons-lang-2.4.jar"  todir="${build.dir}/lib" verbose="true"/>

    <copy file="${hadoop.root}/lib/jackson-core-asl-1.8.8.jar"  todir="${build.dir}/lib" verbose="true"/>

    <copy file="${hadoop.root}/lib/jackson-mapper-asl-1.8.8.jar"  todir="${build.dir}/lib" verbose="true"/>

    <jar

      jarfile="${build.dir}/hadoop-${name}-${version}.jar"

      manifest="${root}/META-INF/MANIFEST.MF">

      <fileset dir="${build.dir}" includes="classes/ lib/"/>

      <fileset dir="${root}" includes="resources/ plugin.xml"/>

    </jar>

</target>

(5).在文件末尾</project>标签之前添加配置：

<path id="hadoop-jars">

     <fileset dir="${hadoop.root}/">

         <include name="hadoop-*.jar"/>

     </fileset>

</path>

5.打开hadoop-1.0.1的解压缩目录(我的是D:\SettingUp\ITSettingUp\Hadoop\hadoop-1.0\hadoop-1.0.1)，复制两个jar包到对应的目录文件夹，以我的文件目录结构举例如下：

(1).将D:\SettingUp\ITSettingUp\Hadoop\hadoop-1.0\hadoop-1.0.1\hadoop-core-1.0.1.jar 复制到D:\SettingUp\ITSettingUp\Hadoop\hadoop-1.0\hadoop-1.0.1\build\这个文件夹中

(2).将D:\SettingUp\ITSettingUp\Hadoop\hadoop-1.0\hadoop-1.0.1\lib\commons-cli-1.2.jar复制到D:\SettingUp\ITSettingUp\Hadoop\hadoop-1.0\hadoop-1.0.1\build\ivy\lib\Hadoop\common这个文件夹中

6.再回到eclipse，打开项目中的\META-INF\MANIFEST.MF文件，做如下的添加：

Bundle-ClassPath: classes/,

 lib/hadoop-core-1.0.1.jar,

 lib/commons-cli-1.2.jar,

 lib/commons-configuration-1.6.jar,

 lib/commons-httpclient-3.0.1.jar,

 lib/commons-lang-2.4.jar,

 lib/jackson-core-asl-1.8.8.jar,

 lib/jackson-mapper-asl-1.8.8.ja,

7.经过上边的配置，基本已经完成，我们可以编译项目了。右击build.xml文件选择 Run As Ant Build，编译成功，生成的hadoop-1.0.1-eclipse-plugin.jar在hadoop-1.0.1解压目录的\build\contrib\eclipse-plugin文件夹里面。

第四步，当然就是在eclipse中配置我们编译好的插件。

1.把hadoop-1.0.1-eclipse-plugin.jar文件放到eclipse安装目录的plugins中，重启eclipse。重启后，会在Window->Open Perspective->Other里，看到大象图标的Map/Reduce出现，或者是window->Preferences中看到Hadoop Map/Reduce这个选项。

2.window->Preferences中点击Hadoop Map/Reduce这个选项，将Hadoop的那个解压缩目录(我的是D:\SettingUp\ITSettingUp\Hadoop\hadoop-1.0\hadoop-1.0.1)的路径配置上，配置效果图如下：

3.然后我们在Window->Open Perspective->Other里，点击Map/Reduce,切换到这个模式，截图如下：

4.切换到Map/Reduce模式后，我们看到画面(4)中的截图，点击右下角的两个小图标，测试有没有反应，如果有反应，暂时先别配置，这个我下篇博客会具体讲。如果怎么点都没有反应，则可以做如下操作：

(1).打开项目中的\META-INF\MANIFEST.MF文件，找到之前编译时，添加的Bundle-ClassPath: classes/ 这个位置，之前我们添加了7个jar包的配置，再增加四个，如下：

 lib/hadoop-common-0.21.0.jar,

 lib/hadoop-hdfs-0.21.0.jar,

 lib/log4j-1.2.15.jar,

 lib/hadoop-mapred-0.21.0.jar

(2).然后我们还需要去网上下载这四个jar包放到下面的文件夹中，以我的目录举例：D:\SettingUp\ITSettingUp\Hadoop\hadoop-1.0\hadoop-1.0.1\lib。

(3).然后在重新编译即可，在替换原来的插件时，在重启eclipse的过程中，你可以这样做：先删除原来的插件，原来重启eclipse，确认Map/Reduce没了；然后再关掉eclipse，将新的插件放到plugins里，之后再次启动eclipse。解决这个问题时我在网上参考的文章是：http://blog.csdn.net/kky2010_110/article/details/7774747，大家也可以看看~。

(4).上边所提到的截图如下：

经过上边说的这些步骤，eclipse中的hadoop插件我们算是编译完了，这个过程中一定要注意的是，不要怕失败，多尝试，因为hadoop版本与eclipse版本是有关系的，所以导致你的版本和我的不太一致，可能会失败，但是也可能会成功。所以在这里再次提醒，注意文章开始，我对自己的环境的版本的介绍，尤其是eclipse和hadoop的版本。建议大家如果有时间的话，可以先不管版本，按照我的步骤先走一遍，如果实在是不成功的话，则可以找个和我一样的eclipse和hadoop版本，再体验一回。因为，我在这个过程中，就发现，由于是第一次学hadoop，不见到成功的效果，总觉得少点什么，总想见识一下，莫取笑哈~

至于下一步，如果配置Location和运行WordCount，我会在下一篇博客中具体说明，谢谢支持，觉得文章还不错的话，多多点赞，多多留言哈，这将使我充满动力!

Hadoop2 自己动手编译Hadoop的eclipse插件的更多相关文章

【Linux下Hadoop-eclipse-plus-3.2.0】编译Hadoop连接eclipse的插件遇见的一系列错误，崩溃的操作
2019-09-02 23:35:22 前言:首先,我想吐槽下自己,居然花费了4到5个夜晚和中午的时间来做这件事情,直到刚才才顺利解决,我也挺佩服自己的! 我在这个过程中参考其他人的博客,非常感谢他们 ...
如何自己编译生成hadoop的eclipse插件，如hadoop-eclipse-plugin-2.6.0.jar
不多说,直接上干货! 如何自己编译生成Eclipse插件,如hadoop-eclipse-plugin-2.6.0.jar 一.相关软件的安装和配置 (一)JDK的安装和配置 Jdk 1.7*安装并配 ...
Hadoop－eclipse插件配置
1.准备jar包与安装eclipse. 2.将jar包拷贝到eclipse/plugin.
Hadoop学习之编译eclipse插件
近期准备開始学习Hadoop1.2.1的源码,感觉最好的方法还是能够在运行Hadoop及hadoop作业时跟踪调试代码的实际运行情况.因为选择的IDE为eclipse,所以准备编译一下hadoop的e ...
配置Hadoop的Eclipse开发环境
前言在先前的文章中,已经介绍了如何在Ubuntu Kylin操作系统下搭建Hadoop运行环境,而现在将在之前工作的基础上搭建Eclipse开发环境. 配置开发环境:Eclipse 4.2 其他同 ...
第三篇：配置Hadoop的Eclipse开发环境
前言在先前的文章中,已经介绍了如何在Ubuntu Kylin操作系统下搭建Hadoop运行环境,而现在将在之前工作的基础上搭建Eclipse开发环境. 配置开发环境:Eclipse 4.2,其他同 ...
hadoop 1.2.1 eclipse 插件编译
hadoop-1.2.1 eclipse插件编译在ubuntu上进行hadoop相关的开发,需要在eclipse上安装hadoop开发插件.最新释放出的hadoop包含源码的包,以had ...
在fedora20下配置hadoop2.5.1的eclipse插件
(博客园-番茄酱原创) 在我的系统中,hadoop-2.5.1的安装路径是/opt/lib64/hadoop-2.5.1下面,然后hadoop-2.2.0的路径是/home/hadoop/下载/had ...
自己动手一步一步安装hadoop（含编译hadoop的native本地包）
近期项目须要用到hadoop.边学习边应用,第一步无疑是安装hadoop.我安装的是hadoop-2.4.1.以下是具体步骤,做备忘以后查看一.下载依赖软件 1.java hadoop官网说明仅仅支 ...

随机推荐

Java 线程
线程:线程是进程的组成部分,一个进程可以拥有多个线程,而一个线程必须拥有一个父进程.线程可以拥有自己的堆栈,自己的程序计数器和自己的局部变量,但不能拥有系统资源.它与父进程的其他线程共享该进程的所有资 ...
C语言 · 阶乘计算 · 基础练习
问题描述输入一个正整数n,输出n!的值. 其中n!=1*2*3*-*n. 算法描述 n!可能很大,而计算机能表示的整数范围有限,需要使用高精度计算的方法.使用一个数组A来表示一个大整数a,A[0]表 ...
Angular企业级开发(1)-AngularJS简介
AngularJS介绍 AngularJS是一个功能完善的JavaScript前端框架,同时是基于MVC(Model-View-Controller理念的框架,使用它能够高效的开发桌面web app和 ...
Python爬虫小白入门（四）PhatomJS+Selenium第一篇
一.前言在上一篇博文中,我们的爬虫面临着一个问题,在爬取Unsplash网站的时候,由于网站是下拉刷新,并没有分页.所以不能够通过页码获取页面的url来分别发送网络请求.我也尝试了其他方式,比如下拉 ...
[原]Paste.deploy 与 WSGI, keystone 小记
Paste.deploy 与 WSGI, keystone 小记名词解释: Paste.deploy 是一个WSGI工具包,用于更方便的管理WSGI应用, 可以通过配置文件,将WSGI应用加载起来. ...
spring boot 部署为jar
前言一直在ide中敲代码,使用命令行mvn spring-boot:run或者gradlew bootRun来运行spring boot项目.想来放到prod上面也应该很简单.然而今天试了下,各种问 ...
setCapture、releasCapture 浅析
1. setCapture 简介 setCapture可以将鼠标事件锁定在指定的元素上,当元素捕获了鼠标事件后,该事件只能作用在当前元素上. 以下情况会导致事件锁定失败: 当窗口失去焦点时,锁定的事件 ...
使用EF CodeFirst 创建数据库
EntityFramework 在VS2015添加新建项时,选择数据->ADO.NET 实体数据模型,有一下选项来自数据库的EF设计器,这个就是我们最常用的EntityFramework设计模 ...
StrategyPattern （策略模式）
/** * 策略模式 * @author TMAC-J * 根据环境的不同选择不同的策略,把策略用接口抽象出来 */ public class StrategyPattern { interface ...
【从零开始学BPM，Day1】工作流管理平台架构学习
[课程主题] 主题:5天,一起从零开始学习BPM [课程形式] 1.为期5天的短任务学习 2.每天观看一个视频,视频学习时间自由安排. [第一天课程] Step 1 软件下载:H3 BPM10.0全开 ...

Hadoop2 自己动手编译Hadoop的eclipse插件

Hadoop2 自己动手编译Hadoop的eclipse插件的更多相关文章

随机推荐

热门专题