Hadoop 2.2 YARN分布式集群搭建配置流程

搭建环境准备：JDK1.6，SSH免密码通信

系统：CentOS 6.3

集群配置：NameNode和ResourceManager在一台服务器上，三个数据节点

搭建用户：YARN

Hadoop2.2下载地址：http://www.apache.org/dyn/closer.cgi/hadoop/common/

步骤一：上传Hadoop 2.2 并解压到/export/yarn/hadoop-2.2.0

外层的启动脚本在sbin目录
内层的被调用脚本在bin目录
Native的so文件都在lib/native目录
配置程序文件都放置在libexec
配置文件都在etc目录，对应以前版本的conf目录
所有的jar包都在share/hadoop目录下面

步骤二：配置环境变量

　　在~/.bashrc文件中添加以下配置：

export JAVA_HOME=/export/servers/jdk1..0_25/

export HADOOP_DEV_HOME=/export/yarn/hadoop-2.2.

export HADOOP_MAPARED_HOME=${HADOOP_DEV_HOME}

export HADOOP_COMMON_HOME=${HADOOP_DEV_HOME}

export HADOOP_HDFS_HOME=${HADOOP_DEV_HOME}

export YARN_HOME=${HADOOP_DEV_HOME}

export HADOOP_CONF_DIR=${HADOOP_DEV_HOME}/etc/hadoop

export HDFS_CONF_DIR=${HADOOP_DEV_HOME}/etc/hadoop

export YARN_CONF_DIR=${HADOOP_DEV_HOME}/etc/hadoop

export PATH=$PATH:$HADOOP_DEV_HOME/bin:$JAVA_HOME/bin:$HADOOP_DEV_HOME/sbin

　　配置完成后，执行source ~/.bashrc命令

步骤三：core-site.xml hdfs-site.xml mapred-site.xml yarn-site.xml配置

　　Core-site.xml配置

<configuration >

<property>

  <name>fs.defaultFS</name>

  <value>hdfs://master1:9101</value>

<description></description>

</property>

<property>

  <name>hadoop.tmp.dir</name>

  <value>/export/yarn/hadoop-log/</value>

<description>tmp临时目录</description>

</property>

<property>

  <name>io.compression.codecs</name>

 <value>com.hadoop.compression.lzo.LzoCodec,com.hadoop.compression.lzo.LzopCodec</value>

<description>压缩编码,这里配置了LZO</description>

</property>

<property>

  <name>io.compression.codec.lzo.class</name>

  <value>com.hadoop.compression.lzo.LzoCodec</value>

<description>LZO对应类</description>

</property>

<property>

  <name>io.native.lib.available</name>

  <value>true</value>

  <description>是否启用本地native库</description>

</property>

</configuration>

Hdfs-site.xml

<configuration>

<property>

  <name>dfs.namenode.name.dir</name>

  <value>/export/yarn/hadoop-log/nd</value>

</property>

<property>

  <name>dfs.datanode.data.dir</name>

  <value>/export/yarn/hadoop-log/dd</value>

</property>

<property>

  <name>dfs.namenode.http-address</name>

  <value>0.0.0.0:60176</value>

  <description>namenode http 地址</description>

</property>

<property>

  <name>dfs.datanode.address</name>

  <value>0.0.0.0:60116</value>

</property>

<property>

  <name>dfs.datanode.ipc.address</name>

  <value>0.0.0.0:60126</value>

</property>

<property>

  <name>dfs.datanode.http.address</name>

  <value>0.0.0.0:60176</value>

</property>

<property>

  <name>dfs.secondary.http.address</name>

  <value>0.0.0.0:60196</value>

</property>

</configuration>

Mapred-site.xml

<configuration>

    <property>

        <name>mapreduce.framework.name</name>

        <value>yarn</value>

    </property>

</configuration>

yarn-site.xml

<configuration>

<!-- Site specific YARN configuration properties -->

<property>

<name>yarn.resourcemanager.address</name>

<value>master1:8032</value>

</property>

<property>

<name>yarn.resourcemanager.scheduler.address</name>

<value>master1:8030</value>

</property>

<property>

<name>yarn.resourcemanager.webapp.address</name>

<value>master1:8088</value>

</property>

<property>

<name>yarn.resourcemanager.resource-tracker.address</name>

<value>master1:8031</value>

</property>

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<property>

 <name>yarn.resourcemanager.scheduler.class</name>

 <value>org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.FairScheduler</value>

</property>

<property>

 <name>yarn.scheduler.fair.allocation.file</name>

 <value>fair-scheduler.xml</value>

</property>

</configuration>

　　注：这里配置了Hadoop 2.2 FairScheduler调度器

步骤四：slaves配置

将三个数据节点配置到slaves中

步骤五：将配置好的Hadoop 2.2 分发同步到各个数据节点

步骤六：格式化NameNode

执行命令：hdfs namenode –format

或者 hadoop namenode –format

步骤七：启动hdfs和yarn

启动Hdfs: start-dfs.sh

启动yarn: start-yarn.sh

或者可以执行start-all.sh一起启动hdfs和yarn

步骤八：测试

Hdfs测试：

向hdfs中上传文件：hdfs dfs –put abc /input

查看hdfs文件目录：hdfs dfs –ls /

Yarn测试：

运行WordCount测试程序：

　　　　　hadoop jar /export/yarn/hadoop-2.2.0/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.2.0.jar wordcount /input /out

欢迎加入Hadoop技术群进行交流:147681830

Hadoop 2.2 YARN分布式集群搭建配置流程的更多相关文章

Hadoop 3.0完全分布式集群搭建方法（CentOS 7+Hadoop 3.2.0）
本文详细介绍搭建4个节点的完全分布式Hadoop集群的方法,Linux系统版本是CentOS 7,Hadoop版本是3.2.0,JDK版本是1.8. 一.准备环境 1. 在VMware worksta ...
Hadoop 2.0完全分布式集群搭建方法（CentOS7+Hadoop 2.7.7）
本文详细介绍搭建4个节点的完全分布式Hadoop集群的方法,Linux系统版本是CentOS 7,Hadoop版本是2.7.7,JDK版本是1.8. 一.准备环境 1. 在VMware worksta ...
hadoop 3.x 完全分布式集群搭建/异常处理/测试
共计三台虚拟机分别为hadoop002(master,存放namenode),hadoop003(workers,datanode以及resourcemanage),hadoop004(workers ...
Hadoop上路-01_Hadoop2.3.0的分布式集群搭建
一.配置虚拟机软件下载地址:https://www.virtualbox.org/wiki/downloads 1.虚拟机软件设定 1)进入全集设定 2)常规设定 2.Linux安装配置 1)名称类 ...
hadoop伪分布式集群搭建与安装（ubuntu系统）
1:Vmware虚拟软件里面安装好Ubuntu操作系统之后使用ifconfig命令查看一下ip; 2:使用Xsheel软件远程链接自己的虚拟机,方便操作.输入自己ubuntu操作系统的账号密码之后就链 ...
Hadoop分布式集群搭建
layout: "post" title: "Hadoop分布式集群搭建" date: "2017-08-17 10:23" catalog ...
Hadoop完全分布式集群搭建
Hadoop的运行模式 Hadoop一般有三种运行模式,分别是: 单机模式(Standalone Mode),默认情况下,Hadoop即处于该模式,使用本地文件系统,而不是分布式文件系统.,用于开发和 ...
大数据之Hadoop完全分布式集群搭建
1.准备阶段 1.1.新建三台虚拟机 Hadoop完全分市式集群是典型的主从架构(master-slave),一般需要使用多台服务器来组建.我们准备3台服务器(关闭防火墙.静态IP.主机名称).如果没 ...
阿里云ECS服务器部署HADOOP集群（二）：HBase完全分布式集群搭建（使用外置ZooKeeper）
本篇将在阿里云ECS服务器部署HADOOP集群(一):Hadoop完全分布式集群环境搭建的基础上搭建,多添加了一个 datanode 节点 . 1 节点环境介绍: 1.1 环境介绍: 服务器:三台阿里 ...

随机推荐

C++：运算符重载函数之成员运算符重载函数
5.2.3 成员运算符重载函数在C++中可以把运算符重载函数定义为某个类的成员函数,称之为成员运算符重载函数. 1. 定义成员运算符重载函数的语法形式 (1)在类的内部,定义成员运算符重载函数的格式 ...
在CentOS 6.X 上面安装 Python 2.7.X
在CentOS 6.X 上面安装 Python 2.7.X CentOS 6.X 自带的python版本是 2.6 , 由于工作需要,很多时候需要2.7版本.所以需要进行版本升级.由于一些系统工具和服 ...
css实现缩进无限嵌套
使用css实现缩进带背景无限嵌套,支持Ie6,代码如下: <!DOCTYPE html> <html lang="en"> <head> < ...
UVa 536 Tree Recovery
题意:给出一颗二叉树的前序遍历和中序遍历,输出其后序遍历用杭电1710的代码改一点,就可以了. #include<iostream> #include<cstdio> #in ...
Deferred的那些知识
在移动开发中的各种中,我们一定会遇到异步回调的问题,比如: 1:Css3执行动画完毕, 回调 2:Jquery Animate动画的执行完毕, 回调 3:Ajax的执行(并行.串行),回调等等 ...
HDU 2444 The Accomodation of Students (偶图判定，匈牙利算法)
题意: 有一堆的学生关系,要将他们先分成两个组,同组的人都不互不认识,如果不能分2组,输出No.若能,则继续.在两组中挑两个认识的人(每组各1人)到一个双人房.输出需要多少个双人房? 思路: 先判定是 ...
给你一个承诺 - 玩转 AngularJS 的 Promise（转）
在谈论Promise之前我们要了解一下一些额外的知识:我们知道JavaScript语言的执行环境是“单线程”,所谓单线程,就是一次只能够执行一个任务,如果有多个任务的话就要排队,前面一个任务完成后才可 ...
MySQL基础之第9章触发器
触发器(TRIGGER)是由事件来触发某个操作.这些事件包括INSERT语句.UPDATE语句和DELETE语句.当数据库系统执行这些事件时,就会激活触发器执行相应的操作.MySQL从5.0.2版本开 ...
iOS - GIF图的完美拆解、合成、显示
转:http://blog.csdn.net/marujunyy/article/details/14455699 最近由于项目需要,需要先把gif图拆解开,然后在每一张图片上添加一些图片和文字,最后 ...
ECSHOP seo修改建议
ECSHOP是一个非常优秀的商城程序,以丰富的模板.稳定开源.非常快的执行速度赢得广大网店主的青眯.可是新建站30多天,目前百度只收录了首页,而google收录正常.我检查了他的网站一切正常,没有任何 ...

Hadoop 2.2 YARN分布式集群搭建配置流程

Hadoop 2.2 YARN分布式集群搭建配置流程的更多相关文章

随机推荐

热门专题