Hadoop学习历程（一、编译）

近期对Hadoop很感兴趣，下面是在CentOS系统上进行编译的分享

系统情况如下：

1. CentOS 6.2 64位
    2. hadoop-2.2.0
    3. jdk 1.6.0_31
    4. maven 3.1.0
    5. protobuf-2.5.0
    6. cmake 2.8.12.1

系统中已经安装好了JDK，并正确进行了设置，这里不说明JDK的安装与设置，请自行查阅

第一步：安装maven

　　　　1.1 下载文件 apache-maven-3.1.0-alpha-1-bin.tar.gz

　　　　1.2 执行命令 tar zvxf apache-maven-3.1.0-alpha-1-bin.tar.gz

　　　　1.3 配置环境变量，编辑etc/profile文件，添加如下代码

MAVEN_HOME=/home/youUser/apache-maven-3.1.-alpha-

PATH=$MAVEN_HOME/bin:$PATH

export MAVEN_HOME

export PATH

　　　　1.4 保存文件，并运行如下命令使环境变量生效

source /etc/profile

　　　　1.5 通过如下命令可以查看是否安装正常

mvn -version

　　第二步：安装protobuf

　　　　2.1 下载文件 protobuf-2.5.0.tar.gz

　　　　2.2 执行命令 tar zvxf protobuf-2.5.0.tar.gz

　　　　2.3 进入 protobuf-2.5.0 目录，执行下面的命令

 ./configure

 make

 make check

 make install

　　　　2.4 通过如下命令可以查看是否安装正常

protoc --version

　　第三步：安装cmake

　　　　3.1 下载安装文件 cmake-2.8.12.1.tar.gz

　　　　3.2 执行如下命令 tar zvxf cmake-2.8.12.1.tar.gz

　　　　3.3 进人 cmake-2.8.12.1 目录，执行如下命令

./bootstrap

make

make install

　　　　3.4 通过如下命令检查安装是否正常

cmake -version

　　第四步：安装必要的包

　　　　4.1 执行如下命令，安装 autotool

yum install autoconf automake libtool

　　　　4.2 执行如下命令，安装 openssl-devel

yum install openssl-devel

　　第五步：正式编译hadoop

　　　　5.1 下载源码包 hadoop-2.2.0-src.tar.gz

　　　　5.2 执行解包命令 tar zvxf hadoop-2.2.0-src.tar.gz

　　　　5.3 由于源码有问题，需要进行修改，修改 hadoop-common-project/hadoop-auth/pom.xml 文件，添加如下内容

     </dependency>

     <dependency>

       <groupId>org.mortbay.jetty</groupId>

       <artifactId>jetty-util</artifactId>

       <scope>test</scope>

     </dependency>

     <dependency>

       <groupId>org.mortbay.jetty</groupId>

       <artifactId>jetty</artifactId>

       <scope>test</scope>

     </dependency>

　　　　5.4 进入 hadoop-2.2.0-src 目录，执行如下命令

mvn clean package -Pdist,native -DskipTests -Dtar

　　　　5.5 如果能看到类型下面的输出就证明编程成功，这个过程中要保证网络通畅，需要下载很多包。

　　　　5.6 进入 hadoop-dist/target 目录，看一下编译成果吧

　　注明：

　　　　有人说可能还需要安装 ncurses-devel ，可以通过 yum install ncurses-devel 进行安装

Hadoop学习历程（一、编译）的更多相关文章

[Hadoop] Hadoop学习历程 [持续更新中…]
1. Hadoop FS Shell Hadoop之所以可以实现分布式计算,主要的原因之一是因为其背后的分布式文件系统(HDFS).所以,对于Hadoop的文件操作需要有一套全新的shell指令来完成 ...
Hadoop学习历程（五、真正的分布式系统搭建）
之前都是单节点进行的操作与测试,现在进行真正的多节点系统搭建 1. 准备系统与配置共准备4台机器搭建Hadoop集群.基于CentOS6.2,jdk1.6.0_31,Hadoop2.2.0版本 19 ...
Hadoop学习历程（二、配置）
以下是进行单节点Hadoop配置的内容,多节点也类似 1. 进行Hadoop的安装 1.1 上文进行了Hadoop的编译,将编译结果目录 hadoop-2.2.0 拷贝为 /usr/hadoop 目录 ...
Hadoop学习历程（四、运行一个真正的MapReduce程序）
上次的程序只是操作文件系统,本次运行一个真正的MapReduce程序. 运行的是官方提供的例子程序wordcount,这个例子类似其他程序的hello world. 1. 首先确认启动的正常:运行 s ...
Hadoop学习历程（三、第一个程序）
根据之前的操作,我们已经可以正常的启动Hadoop了,关于真正的集群我会在之后进行说明.现在我们来看一下第一个程序吧 1. 在eclipse上建立一个java项目 2. 将 /usr/hadoop/s ...
Hadoop学习之旅三：MapReduce
MapReduce编程模型在Google的一篇重要的论文MapReduce: Simplified Data Processing on Large Clusters中提到,Google公司有大量的 ...
Hadoop学习（5）-- Hadoop2
在Hadoop1(版本<=0.22)中,由于NameNode和JobTracker存在单点中,这制约了hadoop的发展,当集群规模超过2000台时,NameNode和JobTracker已经不 ...
Hadoop学习笔记(5) ——编写HelloWorld(2)
Hadoop学习笔记(5) ——编写HelloWorld(2) 前面我们写了一个Hadoop程序,并让它跑起来了.但想想不对啊,Hadoop不是有两块功能么,DFS和MapReduce.没错,上一节我 ...
Hadoop学习笔记(3)——分布式环境搭建
Hadoop学习笔记(3) ——分布式环境搭建前面,我们已经在单机上把Hadoop运行起来了,但我们知道Hadoop支持分布式的,而它的优点就是在分布上突出的,所以我们得搭个环境模拟一下. 在这里, ...

随机推荐

Ubuntu14.04 weblogic11g集群环境测试
在当前域下面新建两个服务器,服务器信息设置: server1:127.0.0.1:7010 server2:127.0.0.1:7020 第一步:新建服务器 (1)进入“服务器”,点击新建: (2)填 ...
我只能说，CDH5真的屌爆了！！！
参考URL http://blog.csdn.net/yangzhaohui168/article/details/34185579 http://blog.csdn.net/yangzhaohui1 ...
一道考验你设计能力的C++编程题
http://www.cppblog.com/weiym/archive/2012/06/12/178472.html
android 通过post方式提交数据的最简便有效的方法
public boolean post(String username, String password) throws Exception { username = URLEncoder.encod ...
【转】Beaglebone Black
原文网址:http://bbs.eeworld.com.cn/thread-431409-1-1.html 开源硬件在国外火得一塌糊涂,国内却没有那么多人玩,直接导致中文论坛资料严重缺乏……但这也挡不 ...
有关UITableViewCell的侧滑删除以及使用相关大神框架MGSwipeTableCell遇到的小问题
提起笔,却不知道从何写起了,今天一整天都耗费在了这个可能根本不算是问题的小问题上,至今仍有一种蛋蛋的忧桑..(噢,不是提笔,是键盘手T_T) 表格视图在项目中就像是每日的家常便饭,在cell上添加侧滑 ...
详解Java反射各种应用
Java除了给我们提供在编译期得到类的各种信息之外,还通过反射让我们可以在运行期间得到类的各种信息.通过反射获取类的信息,得到类的信息之后,就可以获取以下相关内容: Class对象构造器变量方法 ...
Java组合与继承生成的类中构造函数的执行顺序
[程序实例] import java.util.*; class Meal{ Meal() { System.out.println("Meal Constructor"); } ...
svn出现“Previous operation has not finished; run 'cleanup' if it was interrupted”，解决方法
1.首先不需要动svn的服务器端.2.在客户端安装svn的客户端工具,自定义工具中为:command line client tools 安装完之后,在本地目录有svn.exe执行程序3.然后c ...
贪心-poj-3040-Allowance
题目链接: http://poj.org/problem?id=3040 题目意思: 有n种(n<=20)面额的硬币,每种硬币面值能整除比它大的面值.给一个c,告诉每种硬币的面值和数量,求最多能 ...

Hadoop学习历程（一、编译）

Hadoop学习历程（一、编译）的更多相关文章

随机推荐

热门专题