hadoop2.x安装配置

1.首先准备hadoop2.2.0的安装包，从官网获取，略。

2.加压安装包，进行配置。假设hadoop安装到/usr/hadoop-2.2.0目录，则进行如下配置：

（1）/etc/profile配置

export HADOOP_PREFIX=/usr/hadoop-2.2.0

export PATH=$PATH:$HADOOP_PREFIX/bin:$HADOOP_PREFIX/sbin

（2）/usr/hadoop-2.2.0/etc/hadoop下配置文件的配置

core-site.xml配置

<configuration>

        <property>

                <name>fs.defaultFS</name>

                <value>hdfs://hadoop.datanode3.com:9000</value>

        </property>

        <property>

                <name>io.file.buffer.size</name>

                <value>4096</value>

        </property>

        <property>

                 <name>hadoop.tmp.dir</name>

                 <value>file:/data/hadoop/temp</value>

        </property>

</configuration>

hdfs-site.xml

<configuration>

        <property>

                <name>dfs.namenode.name.dir</name>

                <value>file:/data/hadoop/dfs/name</value>

        </property>

        <property>

                <name>dfs.datanode.data.dir</name>

                <value>file:/data/hadoop/dfs/data</value>

        </property>

        <property>

                <name>dfs.replication</name>

                <value>2</value>

        </property>

        <property>

                <name>dfs.webhdfs.enabled</name>

                <value>true</value>

        </property>

</configuration>

yarn-site.xml

<configuration>

        <property>

                <name>yarn.nodemanager.aux-services</name>

                <value>mapreduce_shuffle</value>

        </property>

        <property>

                <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>

                <value>org.apache.hadoop.mapred.ShuffleHandler</value>

        </property>

        <property>

                <name>yarn.resourcemanager.address</name>

                <value>hadoop.datanode3.com:8032</value>

        </property>

        <property>

                <name>yarn.resourcemanager.scheduler.address</name>

                <value>hadoop.datanode3.com:8030</value>

        </property>

        <property>

                <name>yarn.resourcemanager.resource-tracker.address</name>

                <value>hadoop.datanode3.com:8031</value>

         </property>

         <property>

                <name>yarn.resourcemanager.admin.address</name>

                <value>hadoop.datanode3.com:8033</value>

        </property>

        <property>

                <name>yarn.resourcemanager.webapp.address</name>

                <value>hadoop.datanode3.com:8088</value>

        </property>

</configuration>

salves文件

hadoop.datanode2.com

hadoop.datanode3.com

master文件

hadoop.datanode3.com

（3）bin/hadoop-env.sh

修改以下两项：

export JAVA_HOME=/usr/java/jdk1.6.0_43

export HADOOP_PID_DIR=/data/hadoop/temp

（4）sbin/yarn-daemon.sh

添加以下一项：

export YARN_PID_DIR=/data/hadoop/temp

3. 至此，配置完成，启动集群。

(1)格式化namenode，执行hdfs namenode -fomat

(2)启动hdfs，执行start-dfs.sh

(3)启动yarn，执行start-yarn.sh

ok，到此集群启动完毕！注意：在（1）中你仔细查看执行过程的输出的话，可能会看到如下的提示

WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable

接着你去验证集群的功能，无论执行什么语句都是报这个警告，而且什么语句不能执行。why?

网上一搜发现是因为官方提供的lib目录中.so文件是在32位系统下编译的，如果是64位系统，需要自己下载源码在64位上重新编译，没办法只能自己编译了。

参考：http://tech.ddvip.com/2013-10/1381302137203719.html

http://www.linuxidc.com/Linux/2012-04/59200.htm

4. 编译hadoop源码，生成64bit本地lib

参考：http://www.cnblogs.com/lucius/p/3435296.html

注意：hadoop2.2.0官网提供的源码包中有一个pom.xml的bug，需要修改一下，见jira:https://issues.apache.org/jira/browse/HADOOP-10110

编译完成后，将新生成的lib/hadoop/native下的文件全部覆盖原来的即可，然后注意在/etc/profile中添加：

export JAVA_LIBRARY_PATH=${HADOOP_PREFIX}/lib/native

5.重新启动集群，进行验证。

（1）hdfs功能验证：执行文件的相关操作，没有任何问题

（2）mapreduce功能验证：执行hadoop-2.2.0自带的wordcount程序进行验证，没有任何问题

参考：http://hi.baidu.com/kongxianghe123/item/731aa74762111ae81381da9b

至此，简单hadoop2.x集群已搭建成功！接下来进行HA（高可用）集群配置

6. 配置HA集群

hadoop2.x安装配置的更多相关文章

hadoop2.x 安装配置
hadoop2.x在系统架构上与hadoop1.x有很大的变化原文地址: http://www.ibm.com/developerworks/cn/opensource/os-cn-hadoop-y ...
CentOS下Hadoop-2.2.0集群安装配置
对于一个刚开始学习Spark的人来说,当然首先需要把环境搭建好,再跑几个例子,目前比较流行的部署是Spark On Yarn,作为新手,我觉得有必要走一遍Hadoop的集群安装配置,而不仅仅停留在本地 ...
HADOOP2.2.0安装配置指南
一. 集群环境搭建这里我们搭建一个由三台机器组成的集群: Ip地址用户名/密码主机名集群中角色操作系统版本 192.168.0.1 hadoop/hadoop Hadoop-mast ...
Ubuntu14.04 安装配置Hadoop2.6.0
目前关于Hadoop的安装配置教程书上.官方教程.博客都有很多,但由于对Linux环境的不熟悉以及各种教程或多或少有这样那样的坑,很容易导致折腾许久都安装不成功(本人就是受害人之一).经过几天不断尝试 ...
【hadoop之翊】——基于CentOS的hadoop2.4.0伪分布安装配置
今天总算是把hadoop2.4的整个开发环境弄好了,包括 windows7上eclipse连接hadoop,eclipse的配置和測试弄得烦躁的一逗比了~ 先上一张成功的图片,hadoop的伪分布式安 ...
linux上hadoop2.4.0安装配置
1 环境准备安装java-1.6(jdk) 安装ssh 1.1 安装jdk (1)下载安装jdk 在/usr/lib下创建java文件夹,输入命令: cd /usr/lib mkdir java 输 ...
Hadoop2.2集群安装配置-Spark集群安装部署
配置安装Hadoop2.2.0 部署spark 1.0的流程一.环境描写叙述本实验在一台Windows7-64下安装Vmware.在Vmware里安装两虚拟机分别例如以下主机名spark1(19 ...
Hive on Spark安装配置详解（都是坑啊）
个人主页:http://www.linbingdong.com 简书地址:http://www.jianshu.com/p/a7f75b868568 简介本文主要记录如何安装配置Hive on Sp ...
Hadoop的学习--安装配置与使用
安装配置系统:Ubuntu14.04 java:1.7.0_75 相关资料官网下载地址官网文档安装我们需要关闭掉防火墙,命令如下: sudo ufw disable 下载2.6.5的版本, ...

随机推荐

Java 并发编程中的 Executor 框架与线程池
Java 5 开始引入 Conccurent 软件包,提供完备的并发能力,对线程池有了更好的支持.其中,Executor 框架是最值得称道的. Executor框架是指java 5中引入的一系列并发库 ...
nginx配置 location root alias
语法规则: location [=|~|~*|^~] /uri/ { … } = 开头表示精确匹配 ^~ 开头表示uri以某个常规字符串开头,理解为匹配 url路径即可.nginx不对url做编码,因 ...
PAT (Advanced Level) 1087. All Roads Lead to Rome (30)
暴力DFS. #include<cstdio> #include<cstring> #include<cmath> #include<vector> # ...
java基础之IO流（二）之字符流
java基础之IO流(二)之字符流字符流,顾名思义,它是以字符为数据处理单元的流对象,那么字符流和字节流之间的关系又是如何呢? 字符流可以理解为是字节流+字符编码集额一种封装与抽象,专门设计用来读写 ...
10分钟学会前端工程化（webpack4.0）
一.概要 1.1.前端工程化随着前端的不断发展与壮大,前端变得越来越复杂,组件化.模块化.工程化.自动化成了前端发展中不可或缺的一部分,具体到前端工程化,面临的问题是如何提高编码->测试-&g ...
java cocurrent并发包
1. java.util.concurrent - Java 并发工具包Java 5 添加了一个新的包到 Java 平台,java.util.concurrent 包.这个包包含有一系列能够让 Jav ...
centos的python2.6.x升级到python2.7.x方法;python2.6.x的版本就不要用了
python2.6.x的版本,现在使用的很多插件都不支持了.所以如果你的centos还是使用的2.6.x版本,不要犹豫,赶紧升级到2.7.x版本 1.所谓升级,就是再安装一个python2.7.x版本 ...
iOS之中国银联移动支付控件升级的问题
自从11月以来,如果用户安装了集成了中国银联手机支付SDK的app,那么在使用银联支付的时候,会发现,不能调用银联支付方式,并且弹出一个提示”银联手机支付已升级请更新客户端8100010”.如下图: ...
使用squid架设自己的代理server
主要參考了 http://blog.chinaunix.net/uid-20778906-id-540115.html Ubuntu下Squid代理server的安装与配置 1 安装 $ sudo a ...
浅谈MySQL压缩协议细节--从源码层面
压缩协议属于mysql通讯协议的一部分,要启用压缩协议传输功能,前提条件客户端和服务端都必须要支持zlib算法,那么,现在有个问题,假如服务端已经默认开启压缩功能,那原生客户端在连接的时候要如何才可启 ...

hadoop2.x安装配置

hadoop2.x安装配置的更多相关文章

随机推荐

热门专题