[Hadoop] - Hadoop3.0.x编译

这里仅介绍一种Hadoop3.0.x版本的源码编译方式

编译过程

1. 下载源码

2. 安装依赖环境

3. 源码编译

=============================================

一、下载源码

直接从apache的归档网站中下载对应版本的源码，比如需要下载的hadoop-3.0.0-alpha2的地址为http://archive.apache.org/dist/hadoop/core/hadoop-3.0.0-alpha2/; 直接下载源码包：hadoop-3.0.0-alpha2-src.tar.gz

二、安装依赖环境

hadoop的编译需要依赖cmake、openssl等相关依赖环境，如果在编译hadoop之前没有进行必要环境的安装的话，可能会出一些异常问题，部分异常解决将博客：[Hadoop] - Cannot run program "cmake"、[Hadoop] - Protocol Buffer安装；必要服务列表为：

* Unix System ## Unix类型的操作系统

* JDK 1.8+ ## JDK至少1.8版本

* Maven 3.0 or later ## Maven环境3.x版本以上，最好将maven的源修改为国内源，默认国外源可能连接不上

* Findbugs 1.3.9 (if running findbugs) ## 可选

* ProtocolBuffer 2.5.0 ## 必须，版本不要选择错误了

* CMake 2.6 or newer (if compiling native code), must be 3.0 or newer on Mac ## 进行native编译过程中必须服务

* Zlib devel (if compiling native code) ## cmake服务需要

* openssl devel (if compiling native hadoop-pipes and to get the best HDFS encryption performance) ## cmake服务需要

* Linux FUSE (Filesystem in Userspace) version 2.6 or above (if compiling fuse_dfs)

* Internet connection for first build (to fetch all Maven and Hadoop dependencies)

* python (for releasedocs)

* bats (for shell code testing)

* Node.js / bower / Ember-cli (for YARN UI v2 building)

三、源码编译

进行源码压缩包解压，然后进入解压后的文件夹，执行相关maven命令进行源码编译操作

假设解压后，hadoop源码位于文件夹：/opt/workspaces/hadoop-3.0.0-alpha2-src中；支持的maven命令如下：

Maven build goals:

 * Clean                     : mvn clean [-Preleasedocs]

 * Compile                   : mvn compile [-Pnative]

 * Run tests                 : mvn test [-Pnative] [-Pshelltest]

 * Create JAR                : mvn package

 * Run findbugs              : mvn compile findbugs:findbugs

 * Run checkstyle            : mvn compile checkstyle:checkstyle

 * Install JAR in M2 cache   : mvn install

 * Deploy JAR to Maven repo  : mvn deploy

 * Run clover                : mvn test -Pclover [-DcloverLicenseLocation=${user.name}/.clover.license]

 * Run Rat                   : mvn apache-rat:check

 * Build javadocs            : mvn javadoc:javadoc

 * Build distribution        : mvn package [-Pdist][-Pdocs][-Psrc][-Pnative][-Dtar][-Preleasedocs][-Pyarn-ui]

 * Change Hadoop version     : mvn versions:set -DnewVersion=NEWVERSION

Maven相关参数如下：

 Build options:

  * Use -Pnative to compile/bundle native code ## 进行本地库代码编译

  * Use -Pdocs to generate & bundle the documentation in the distribution (using -Pdist) ## 进行帮助文档编译

  * Use -Psrc to create a project source TAR.GZ ## 将源码打包到最后编译好的文件夹中

  * Use -Dtar to create a TAR with the distribution (using -Pdist) ## 对编译好的文件进行打包操作

  * Use -Preleasedocs to include the changelog and release docs (requires Internet connectivity) ## 升级文档编译

  * Use -Pyarn-ui to build YARN UI v2. (Requires Internet connectivity) ## 支持yarn v2的ui

几个常用的编译命令：

1. mvn package -Pdist -DskipTests -Dtar -Dmaven.javadoc.skip=true ## 仅编译正常源码部分，对于native部分不进行编译，最终结果打包

2. mvn package -Pdist,native,docs -DskipTests -Dtar ## 编译正常部分源码、native依赖库以及帮助文档，最终结果打包

执行mvn package -Pdist,native,docs -DskipTests -Dtar命令后，等等一段时间(根据网络情况而定，一般30分钟左右能够完成编译)，完成编译后，命令行输出为：

编译好的文件位于路径/opt/workspaces/hadoop-3.0.0-alpha2-src/hadoop-dist/target中，即当前目录的hadoop-dist子目录的target文件夹中，文件截图为：

==================================

至此，hadoop3.0编译完成

编译环境：

centos6.5 64位 1核2G

JDK 1.8.0_121

Maven 3.3.3

Maven源：aliyun maven源 ==> http://maven.aliyun.com/nexus/content/groups/public/

ProtocolBuffer 2.5.0

Cmake 2.8.12.2

[Hadoop] - Hadoop3.0.x编译的更多相关文章

Hadoop 3.0 安装
1. 下载Hadoop 3.0 http://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-3.0.0/hadoop-3. ...
Hadoop之Linux源代码编译
Hadoop开篇,按惯例.先编译源代码.导入到Eclipse.这样以后要了解那块,或者那块出问题了.直接找源代码. 编译hadoop2.4.1源代码之前.必须安装Maven和Ant环境,而且Hadoo ...
CentOS 7安装Hadoop 3.0.0
最近在学习大数据,需要安装Hadoop,自己弄了好久,最后终于弄好了.网上也有很多文章关于安装Hadoop的,但总会遇到一些问题,所以把在CentOS 7安装Hadoop 3.0.0的整个过程记录下来 ...
CentOS 装hadoop3.0.3 版本踩坑
1.but there is no HDFS_NAMENODE_USER defined. Aborting operation. [root@xcff sbin]# ./start-dfs.sh S ...
hadoop-3.0.0 配置中的 yarn.nodemanager.aux-services 项
在hadoop-3.0.0-alpha4 的配置中,yarn.nodemanager.aux-services项的默认值是“mapreduce.shuffle”,但如果在hadoop-2.2 中继续使 ...
hadoop-3.0.0-alpha4启动
全部启动或者全部停止(注意:第一次启动需要先格式,以后就不需要格式了,不能多次格式化) 1.启动 [root@master sbin]# pwd /usr/hadoop/hadoop-3.0.0-al ...
【Linux下Hadoop-eclipse-plus-3.2.0】编译Hadoop连接eclipse的插件遇见的一系列错误，崩溃的操作
2019-09-02 23:35:22 前言:首先,我想吐槽下自己,居然花费了4到5个夜晚和中午的时间来做这件事情,直到刚才才顺利解决,我也挺佩服自己的! 我在这个过程中参考其他人的博客,非常感谢他们 ...
在Ubuntu 64位OS上运行hadoop2.2.0[重新编译hadoop]
最近在学习搭建Hadoop, 我们从Apache官方网站直接下载最新版本Hadoop2.2.官方目前是提供了linux32位系统可执行文件,结果运行时发现提示 “libhadoop.so.1.0.0 ...
flink编译支持CDH6.2.0（hadoop3.0.0）
准备工作因为在编译时需要下载许多依赖包,在执行编译前最好先配置下代理仓库 <mirrors> <mirror> <id>nexus-aliyun</id&g ...

随机推荐

java域名解析
DNS原理:http://amon.org/dns-introduction.html 根域:就是所谓的“.” 根域服务器只是具有13个IP地址,但机器数量却不是13台,因为这些IP地址借助了任播的技 ...
UVa 311 - Packets
题目大意:有1X1,2X2 ... 5X5,6X6六种类型的物品,把他们装进6X6的盒子里,求使用的最少盒子数. 贪心吧,其实一看就知道思路了,算是常识吧,装物品时通常都是先装大的,再在其余空间放小的 ...
14.TCP的坚持定时器和保活定时器
一.坚持定时器 1.坚持定时器的由来 TCP通过让接收方指明希望从发送方接受的窗口大小来进行流量控制.设置窗口大小为0可以组织发送方传送数据,直至窗口变为非0为止. ...
nginx 重启
/etc/init.d/nginx -s reload /etc/init.d/nginx reload
Selenium2（java）selenium常用API 五
上传文件元素标签是input时上传方式上传是一个input,对于这种元素是input 的标签可以采用元素的sendKeys()方法来直接赋值,upload.html代码: <html&g ...
XML 字符串解析
微信红包发送完成后返回xml字符串,解析过程如下: 1.调用解析: public ActionResult GetEntityFromXml() { string str = @"<x ...
我用Cocos2d-x模拟《Love Live!学院偶像祭》的Live场景（四）
[前言和思路整理] 千呼万唤Shǐ出来!最近莫名被基友忽悠着进舰坑了,加上要肝LL活动,又碰上公司项目紧张经常加班,这一章发得比以往时候来得更晚一些,抱歉啊. 上一章我们实现了BeatObjectMa ...
Bootstrap相关的网站
http://www.bootcss.com/ http://expo.bootcss.com/ http://www.webresourcesdepot.com/20-beautiful-resou ...
mybatis springmvc调用oracle存储过程，返回记录集
参考: http://bbs.csdn.net/topics/390866155 辅助参考: http://www.2cto.com/kf/201307/226848.html http://blog ...
vue初探
vue初探很多同学一定都听过MVVM.组件.数据绑定之类的专业术语,而vue框架正是这样的一种框架.vue的作用是:通过尽可能简单的 API 实现响应的数据绑定和组合的视图组件. 第一部分:vue介 ...

[Hadoop] - Hadoop3.0.x编译

[Hadoop] - Hadoop3.0.x编译的更多相关文章

随机推荐

热门专题