Eclipse导入Hadoop源码项目及编写Hadoop程序

一

Eclipse导入Hadoop源码项目

基本步骤：

1）在Eclipse新建一个java项目【hadoop-1.2.1】

2)将Hadoop压缩包解压目录src下的core，hdfs，mapred，tools，example四个目录copy到上述新建项目的src目录下

3）右击选择 Build Path，修改Java Build Path中【Source】，删除src，添加src/core,src/hdfs,src/mapred,src/tools几个源码目录；

4）在项目中新建一个lib目录，添加项目依赖jar包，导入Hadoop解压缩目录的lib下所有jar包（去掉两个文档），不要漏掉其子目录jsp-2.1中的jar包，导入ant程序lib下所有jar包

5）选择lib目录下的所有jar包，然后右击选择Build Path添加

6)右击项目选择Build Project，重新编译一下工程，发现有错误

7）导入ant包，把ant下的所有jar包导入lib目录下，右击项目选择Build Path-->Libraries-->Add JARs-->Hadoop-1.2.1-->lib就会显示为加进来的包，点击ok结束。

8）在编译一下工程，发现还是有错，接着右击项目选择Build Path-->Libraries找到JRE System Library-->点击Access rules:No rules defined -->选择Edit

Resolution框改为Accessible，Rule Pattern填**/*点ok

至此完成。

二、在Eclipse下编写Hadoop程序

基本步骤：

1）新建Hadoop工程，在工程中新建一个lib目录，copy Hadoop压缩包解压目录lib下的几个jar包，分别为：

其中，Hadoop-core-1.2.1.jar就在Hadoop-1.2.1目录下，然后添加到Build Path路经下

2）添加Hadoop的配置文件

点击项目新建一个文件夹，命名为conf，在里面需要放两个配置文件，分别为core-site.xml和hdfs-site.xml

3)添加单元测试包JUnit4

选择项目右击选择Build Path-->Libraries-->Add Library-->JUnit -->JUnit4-->ok

到此就可以在项目的src下建立包和测试类对hdfs进行增、删、改、查等操作

例：查看hdfs下的某个文件类容并在控制台上显示，代码如下：

package org.chaofn.hadoop.hdfs;

import java.io.InputStream;

import java.net.URL;

import org.apache.hadoop.fs.FsUrlStreamHandlerFactory;

import org.apache.hadoop.io.IOUtils;

import org.junit.Test;

public class HDFSUrlTest {

   //让java程序识别HDFS的URL

    static{

        URL.setURLStreamHandlerFactory(new FsUrlStreamHandlerFactory());

    }

    //查看文件内容

    @Test

    public void testRead() throws Exception{

        InputStream in=null;

        //文件路径

        String fileUrl="hdfs://linux.chaofn.org:9000/wc/input/core-site.xml";

        try{

            in=new URL(fileUrl).openStream();

        //将文件内容读出来打印到控制台

        IOUtils.copyBytes(in, System.out, 4096, false);

        }finally{

            IOUtils.closeStream(in);

        }

    }

}

Eclipse导入Hadoop源码项目及编写Hadoop程序的更多相关文章

Hadoop1.x目录结构及Eclipse导入Hadoop源码项目
这是解压hadoop后,hadoop-1.2.1目录各目录结构及说明: Eclipse导入Hadoop源码项目: 注意:如果没有ant的包可以去网上下,不是hadoop里面的. 然后如果通过以上还报 ...
eclipse导入Java源码
eclipse导入Java源码下载源码包(一般jdk都自带了, 我的没有) src.zip eclipse -> window -> preferences -> JAVA -&g ...
eclipse导入tomcat源码
我的开发环境:windows7 64位一.官网下载tomcat源码.在此奉上一站地址:http://archive.apache.org/dist/tomcat/: 二.编译源码生成.jar文件: ...
Eclipse导入Elasticsearch源码
Eclipse导入Elasticsearch源码的步骤, 基于Elasticsearch 6.2.2的源码版本. 1.安装JDK1.9 Elasticsearch 6.2.2需要JDK1.9编译,否则 ...
Eclipse导入Zookeeper源码Version2017.11.3
将Zookeeper源码导入Eclipse, Zookeeper源码需要使用ant构建后才能导入Eclipse, 和Solr的源码一样也是使用ant构建的, 大部分可以参考Eclipse导入Solr源 ...
安装Hadoop系列 — 导入Hadoop源码项目
将Hadoop源码导入Eclipse有个最大好处就是通过 "ctrl + shift + r" 可以快速打开Hadoop源码文件. 第一步:在Eclipse新建一个Java项目,h ...
spring源码学习（一）：eclipse导入spring源码
前言对于一门技术,我们最先是了解它(what),然后再熟练的使用它(how)以及何时用它(when),最后肯定要看透它(why).spring作为Java开发人员可以说是最熟悉不过的了,基本每个Ja ...
Eclipse导入Solr源码Version5.5.3
将Solr的5.5.3版本源码导入Eclipse, Solr源码需要使用ant构建后才能导入Eclipse. 1.JDK安装 Solr要求jdk1.7+: 请参考Windows下安装配置jdk 2.A ...
Eclipse导入Tomcat源码（转）
想要研究下Tomcat的体系结构或者源码,最好将Tomcat的源码导入到ide中,编写实例进行代码跟踪(debug). 这里参考了网上一些资料,将自己操作过程记个流水账. 准备: 1.Tomcat源码 ...

随机推荐

centos6.5安装禅道
1.安装禅道需要安装以下环境 mysql php 5 apache 2 2.安装命令 1.安装mysql yum install mysql mysql-server 2.安装apache yum i ...
【java】对象序列化Serializable、transient
package 对象序列化; import java.io.Serializable; @SuppressWarnings("serial") class A implements ...
HTML基础教程-段落
HTML 段落段落是通过 <p> 标签定义的. <p>This is a paragraph</p> <p>This is another parag ...
网口划VLAN
do sho run int g0/28 int g0/18 sw mo acc sw acc vlan 220 span portfa exit do wr exit
springboot学习（三）————使用HttpMessageConverter进行http序列化和反序列化
以下内容,如有问题,烦请指出,谢谢! 对象的序列化/反序列化大家应该都比较熟悉:序列化就是将object转化为可以传输的二进制,反序列化就是将二进制转化为程序内部的对象.序列化/反序列化主要体现在程序 ...
bzoj 3718: [PA2014]Parking
Description 你的老板命令你将停车场里的车移动成他想要的样子. 停车场是一个长条矩形,宽度为w.我们以其左下角顶点为原点,坐标轴平行于矩形的边,建立直角坐标系.停车场很长,我们可以认为它一直 ...
bzoj 3653 [湖南集训]谈笑风生
题目描述设 T 为一棵有根树,我们做如下的定义: • 设 a 和 b 为 T 中的两个不同节点.如果 a 是 b 的祖先,那么称"a 比 b 不知道高明到哪里去了". • 设 a ...
入门级Nginx反向代理nodejs
本着想实现前后端分离开发的初衷,我决定学习一下关于nignx反向代理的配置. 1.下载Nginx稳定版本 2.打开nginx配置文件 nginx.conf: 3.在http模块的server部分配置 ...
php+中文分词scws+sphinx+mysql打造千万级数据全文搜索
转载自:http://blog.csdn.net/nuli888/article/details/51892776 Sphinx是由俄罗斯人Andrew Aksyonoff开发的一个全文检索引擎.意图 ...
删除redis 失效节点
cluster forget命令 cluster forget nodeid

Eclipse导入Hadoop源码项目及编写Hadoop程序

Eclipse导入Hadoop源码项目及编写Hadoop程序的更多相关文章

随机推荐

热门专题