Hadoop-CDH源码编译

王振龙 2024-10-01 14:57:04 原文

* Hadoop-CDH源码编译

这一节我们主要讲解一下根据CDH源码包手动编译的过程，至于为什么要使用CDH，前几节已经说明，那为什么又要自己手动编译，因为CDH的5.3.6对应的Hadoop2.5.0没有native动态库，很多压缩功能无法使用。

* 首先源码包下载：

http://archive.cloudera.com/cdh5/cdh/5/

找到对应的：hadoop-2.5.0-cdh5.3.6-src.tar.gz开始下载即可。

* 下载完成后解压该软件包，注意目录权限问题

解压后，我的目录结构如图：

* 查看BUILDING.txt文件，重要内容如下：

注意：该部分描述的内容是编译这个版本的CDH所需的环境

编译环境所需软件打包下载传送门：

链接：http://pan.baidu.com/s/1jI1bHPG 密码：i8z8

* Findebugs安装：

$ unzip -o -d /opt/modules/ /opt/softwares/findbugs-1.3.9.zip

* ProtocolBuffer 2.5.0安装

$ ./configure --prefix=/opt/modules/protobuf-2.5.0

$ make && make install

如果，在执行以上命令时，如果出现编译错误，可能编译工具补全导致的，请安装：

# yum install gcc

# yum install gcc-c++

# yum install cmake

* 安装snappy

先下载：

https://github.com/electrum/hadoop-snappy

指定的一个安装目录，默认是根目录：

./configure --prefix=/opt/modules/snappy

make && make install

mvn package -Dsnappy.prefix=/opt/modules/snappy

* 最后两个依赖：

# yum -y install zlib-devel

# yum -y install openssl

最后我的环境变量配置如图：

注意，JDK我临时用了1.7的，因为1.8的编译会出现错误

* 编译

Maven的setttings.xml中的mirror配置：

使用命令进行编译：

$ mvn package -Pdist,native,docs -DskipTests -Dtar

在编译过程中可能出现种种错误，比如tomcat依赖包下载不下来，或者各种依赖包下载不下来，可以自行下载报错的依赖然后放置到指定目录，以及删除报错对应目录下的x.lastUpdated文件。祝你好运：）（我从没遇见过1次就编译成功的）

最后，想省劲，或者在使用本教程的过程中想直接解决找不到native错误问题的，直接下载编译好的即可，注意最后要放在Hadoop的对应目录下：

链接：http://pan.baidu.com/s/1dEDgZBj 密码：x27z

个人微博：http://weibo.com/seal13

QQ大数据技术交流群（广告勿入）：476966007


作者：Z尽际
链接：https://www.jianshu.com/p/a300bceb1caf
來源：简书
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

Hadoop-CDH源码编译的更多相关文章

Hadoop的源码编译
目录正文 1.准备阶段使用root登录Centos,并且要求能够正常连接网络.配置清单如下: (1)hadoop-2.7.2-src.tar.gz (2)jdk-8u144-linux-x64.t ...
1、Spark 2.1 源码编译支持CDH
目前CDH支持的spark版本都是1.x, 如果想要使用spark 2x的版本, 只能编译spark源码生成支持CDH的版本. 一.准备工作找一台Linux主机, 由于spark源码编译会下载很多的 ...
Hadoop源码编译过程
一. 为什么要编译Hadoop源码 Hadoop是使用Java语言开发的,但是有一些需求和操作并不适合使用java,所以就引入了本地库(Native Libraries)的概念,通 ...
Hadoop,HBase,Zookeeper源码编译并导入eclipse
基本理念:尽可能的参考官方英文文档 Hadoop: http://wiki.apache.org/hadoop/FrontPage HBase: http://hbase.apache.org/b ...
apache kafka & CDH kafka源码编译
Apache kafka编译前言 github网站kafka项目的README.md有关于kafka源码编译的说明 github地址:https://github.com/apache/kafka ...
基于cdh5.10.x hadoop版本的apache源码编译安装spark
参考文档:http://spark.apache.org/docs/1.6.0/building-spark.html spark安装需要选择源码编译方式进行安装部署,cdh5.10.0提供默认的二进 ...
hadoop 源码编译
hadoop 源码编译 1.准备jar 1) hadoop-2.7.2-src.tar.gz 2) jdk-8u144-linux-x64.tar.gz 3) apach-ant-1.9.9-bin. ...
hadoop-2.0.0-mr1-cdh4.2.0源码编译总结
准备编译hadoop-2.0.0-mr1-cdh4.2.0的同学们要谨慎了.首先看一下这篇文章: Hadoop作业提交多种方案 http://www.blogjava.net/dragonHadoop ...
Spark环境搭建（六）-----------sprk源码编译
想要搭建自己的Hadoop和spark集群,尤其是在生产环境中,下载官网提供的安装包远远不够的,必须要自己源码编译spark才行. 环境准备: 1,Maven环境搭建,版本Apache Maven 3 ...

随机推荐

终结者:负载均衡之Nginx(一)
相信非常多人都听过Nginx.这个小巧的东西能够和Apache及IIS相媲美.那么它有什么作用呢?一句话.它是一个减轻Web应用server(如Tomcat)压力和实现Web应用ser ...
libLAS1.8.0 编译和配置（VS2013+Win7 64）（一）
libLAS 是一个用来读写三维激光雷达数据(LiDAR) 的 C++ 库.在学习.科研和研发中都会广泛运用.怎样编译和配置自己所须要版本号的libLAS库确是一件麻烦耗时的事情. 笔者在Win7 6 ...
1.RunLoop是什么？
1.Run loops是线程相关的的基础框架的一部分. 一个run loop就是一个事件处理的循环.用来不停的调度工作以及处理输入事件.使用run loop的目的是让你的线程在有工作的时候忙于工作.而 ...
node12---mongodb
一.传统数据库技术回顾数据库就是存储数据的,那么存储数据就用txt就行了啊,为什么要有数据库? 理由之1: 数据库有行.列的概念,数据有关系,数据不是散的. 老牌数据库,比如MySQL.SQL Se ...
5分钟学会 CSS Grid 布局
欢迎加入前端交流群交流知识&&获取视频资料:749539640 这是一篇快速介绍网站未来布局的文章. Grid 布局是网站设计的基础,CSS Grid 是创建网格布局最强大和最简单的工 ...
Python一行代码获得IP地址
比较靠谱的方法, 通过构造UDP包获得本机IP地址 python -c "import socket;print([(s.connect(('8.8.8.8', 53)), s.gets ...
11.使用boostregex遭遇无法打开libboost_regex-vc120-mt-sgd-1_62.lib的问题
通过Boost库可以在C++项目中使用正则表达式,配置好环境后链接过程出现”无法打开libboost_regex-vc120-mt-sgd-1_62.lib”的错误. 原因是按照官方生成lib的方法 ...
Excel中将字符串中从右起第n个指定字符替换的方法
比如你想把www.baidu.com.cn中的倒数第二个”.”替换成@,则可以用: =SUBSTITUTE(A1,".","@",LEN(A1)-LEN(SUB ...
Codeforces 986A. Fair（对物品bfs暴力求解）
解题思路: 1.对物品i bfs,更新每个小镇j获得每个物品i的最短距离. 2.时间复杂度o(n*k),满足2s的要求. 代码: #include <iostream> #include ...
用Maven创建第一个web项目Struts2项目
一.创建一个web项目参考前面文章,项目名:maven-struts-demo. 二.配置pom.xml文件添加struts2依赖 <project xmlns="http://ma ...