Hadoop 2.2 YARN分布式集群搭建配置流程

搭建环境准备：JDK1.6，SSH免密码通信

系统：CentOS 6.3

集群配置：NameNode和ResourceManager在一台服务器上，三个数据节点

搭建用户：YARN

Hadoop2.2下载地址：http://www.apache.org/dyn/closer.cgi/hadoop/common/

步骤一：上传Hadoop 2.2 并解压到/export/yarn/hadoop-2.2.0

外层的启动脚本在sbin目录
内层的被调用脚本在bin目录
Native的so文件都在lib/native目录
配置程序文件都放置在libexec
配置文件都在etc目录，对应以前版本的conf目录
所有的jar包都在share/hadoop目录下面

步骤二：配置环境变量

　　在~/.bashrc文件中添加以下配置：

export JAVA_HOME=/export/servers/jdk1..0_25/

export HADOOP_DEV_HOME=/export/yarn/hadoop-2.2.

export HADOOP_MAPARED_HOME=${HADOOP_DEV_HOME}

export HADOOP_COMMON_HOME=${HADOOP_DEV_HOME}

export HADOOP_HDFS_HOME=${HADOOP_DEV_HOME}

export YARN_HOME=${HADOOP_DEV_HOME}

export HADOOP_CONF_DIR=${HADOOP_DEV_HOME}/etc/hadoop

export HDFS_CONF_DIR=${HADOOP_DEV_HOME}/etc/hadoop

export YARN_CONF_DIR=${HADOOP_DEV_HOME}/etc/hadoop

export PATH=$PATH:$HADOOP_DEV_HOME/bin:$JAVA_HOME/bin:$HADOOP_DEV_HOME/sbin

　　配置完成后，执行source ~/.bashrc命令

步骤三：core-site.xml hdfs-site.xml mapred-site.xml yarn-site.xml配置

　　Core-site.xml配置

<configuration >

<property>

  <name>fs.defaultFS</name>

  <value>hdfs://master1:9101</value>

<description></description>

</property>

<property>

  <name>hadoop.tmp.dir</name>

  <value>/export/yarn/hadoop-log/</value>

<description>tmp临时目录</description>

</property>

<property>

  <name>io.compression.codecs</name>

 <value>com.hadoop.compression.lzo.LzoCodec,com.hadoop.compression.lzo.LzopCodec</value>

<description>压缩编码,这里配置了LZO</description>

</property>

<property>

  <name>io.compression.codec.lzo.class</name>

  <value>com.hadoop.compression.lzo.LzoCodec</value>

<description>LZO对应类</description>

</property>

<property>

  <name>io.native.lib.available</name>

  <value>true</value>

  <description>是否启用本地native库</description>

</property>

</configuration>

Hdfs-site.xml

<configuration>

<property>

  <name>dfs.namenode.name.dir</name>

  <value>/export/yarn/hadoop-log/nd</value>

</property>

<property>

  <name>dfs.datanode.data.dir</name>

  <value>/export/yarn/hadoop-log/dd</value>

</property>

<property>

  <name>dfs.namenode.http-address</name>

  <value>0.0.0.0:60176</value>

  <description>namenode http 地址</description>

</property>

<property>

  <name>dfs.datanode.address</name>

  <value>0.0.0.0:60116</value>

</property>

<property>

  <name>dfs.datanode.ipc.address</name>

  <value>0.0.0.0:60126</value>

</property>

<property>

  <name>dfs.datanode.http.address</name>

  <value>0.0.0.0:60176</value>

</property>

<property>

  <name>dfs.secondary.http.address</name>

  <value>0.0.0.0:60196</value>

</property>

</configuration>

Mapred-site.xml

<configuration>

    <property>

        <name>mapreduce.framework.name</name>

        <value>yarn</value>

    </property>

</configuration>

yarn-site.xml

<configuration>

<!-- Site specific YARN configuration properties -->

<property>

<name>yarn.resourcemanager.address</name>

<value>master1:8032</value>

</property>

<property>

<name>yarn.resourcemanager.scheduler.address</name>

<value>master1:8030</value>

</property>

<property>

<name>yarn.resourcemanager.webapp.address</name>

<value>master1:8088</value>

</property>

<property>

<name>yarn.resourcemanager.resource-tracker.address</name>

<value>master1:8031</value>

</property>

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<property>

 <name>yarn.resourcemanager.scheduler.class</name>

 <value>org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.FairScheduler</value>

</property>

<property>

 <name>yarn.scheduler.fair.allocation.file</name>

 <value>fair-scheduler.xml</value>

</property>

</configuration>

　　注：这里配置了Hadoop 2.2 FairScheduler调度器

步骤四：slaves配置

将三个数据节点配置到slaves中

步骤五：将配置好的Hadoop 2.2 分发同步到各个数据节点

步骤六：格式化NameNode

执行命令：hdfs namenode –format

或者 hadoop namenode –format

步骤七：启动hdfs和yarn

启动Hdfs: start-dfs.sh

启动yarn: start-yarn.sh

或者可以执行start-all.sh一起启动hdfs和yarn

步骤八：测试

Hdfs测试：

向hdfs中上传文件：hdfs dfs –put abc /input

查看hdfs文件目录：hdfs dfs –ls /

Yarn测试：

运行WordCount测试程序：

　　　　　hadoop jar /export/yarn/hadoop-2.2.0/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.2.0.jar wordcount /input /out

欢迎加入Hadoop技术群进行交流:147681830

Hadoop 2.2 YARN分布式集群搭建配置流程的更多相关文章

Hadoop 3.0完全分布式集群搭建方法（CentOS 7+Hadoop 3.2.0）
本文详细介绍搭建4个节点的完全分布式Hadoop集群的方法,Linux系统版本是CentOS 7,Hadoop版本是3.2.0,JDK版本是1.8. 一.准备环境 1. 在VMware worksta ...
Hadoop 2.0完全分布式集群搭建方法（CentOS7+Hadoop 2.7.7）
本文详细介绍搭建4个节点的完全分布式Hadoop集群的方法,Linux系统版本是CentOS 7,Hadoop版本是2.7.7,JDK版本是1.8. 一.准备环境 1. 在VMware worksta ...
hadoop 3.x 完全分布式集群搭建/异常处理/测试
共计三台虚拟机分别为hadoop002(master,存放namenode),hadoop003(workers,datanode以及resourcemanage),hadoop004(workers ...
Hadoop上路-01_Hadoop2.3.0的分布式集群搭建
一.配置虚拟机软件下载地址:https://www.virtualbox.org/wiki/downloads 1.虚拟机软件设定 1)进入全集设定 2)常规设定 2.Linux安装配置 1)名称类 ...
hadoop伪分布式集群搭建与安装（ubuntu系统）
1:Vmware虚拟软件里面安装好Ubuntu操作系统之后使用ifconfig命令查看一下ip; 2:使用Xsheel软件远程链接自己的虚拟机,方便操作.输入自己ubuntu操作系统的账号密码之后就链 ...
Hadoop分布式集群搭建
layout: "post" title: "Hadoop分布式集群搭建" date: "2017-08-17 10:23" catalog ...
Hadoop完全分布式集群搭建
Hadoop的运行模式 Hadoop一般有三种运行模式,分别是: 单机模式(Standalone Mode),默认情况下,Hadoop即处于该模式,使用本地文件系统,而不是分布式文件系统.,用于开发和 ...
大数据之Hadoop完全分布式集群搭建
1.准备阶段 1.1.新建三台虚拟机 Hadoop完全分市式集群是典型的主从架构(master-slave),一般需要使用多台服务器来组建.我们准备3台服务器(关闭防火墙.静态IP.主机名称).如果没 ...
阿里云ECS服务器部署HADOOP集群（二）：HBase完全分布式集群搭建（使用外置ZooKeeper）
本篇将在阿里云ECS服务器部署HADOOP集群(一):Hadoop完全分布式集群环境搭建的基础上搭建,多添加了一个 datanode 节点 . 1 节点环境介绍: 1.1 环境介绍: 服务器:三台阿里 ...

随机推荐

Quartz 并发/单线程
Quartz 并发/单线程 Quartz定时任务默认都是并发执行的,不会等待上一次任务执行完毕,只要间隔时间到就会执行, 如果定时任执行太长,会长时间占用资源,导致其它任务堵塞.1.在Spring中这 ...
Android Handler传值方式
前面介绍handler的时候,也用到过几种传值方式,今天来总结一下,并且重点说一下bundle方式,代码如下: package com.handlerThread; import android.ap ...
Android Handler之Message传递参数
最近发现Message,发送消息可以传递参数,这个思路很好,所以写了一个例子,点击屏幕,给Activity发送一个消息,传递两个参数,并把这个activity销毁掉! 程序打开界面: 点击屏幕,销毁a ...
【原创】Kmeans算法优缺点分析
优点: 原理简单(靠近中心点),实现容易(1.2 天),聚类效果中上(依赖K的选择) 缺点: 1. 无法确定K的个数 (根据什么指标确定K) 2. 对离群点敏感 (容易导致中心点偏移) 3. 算法复杂 ...
加密解密(9)Diffie-Hellman密钥交换协议
过程如下 : 1,小李把KeyX经过加密变化,生成MsgA传给老王. 2,老王得到MsgA,保存在本地. 3,老王把KeyY经过加密变化,生成MsgB传给小李, 4,小李得到MsgB保存在本地, 5, ...
Android测试框架-uiautomator
官方示例:https://github.com/googlesamples/android-testing 官方文档请 google 要求: Android SDK v23 Android Build ...
ZOJ 1610 Count the Colors （线段树成段更新）
题目链接题意:成段染色,初始为0,每次改变一个区间的颜色,求最后每种颜色分别有多少段.颜色按照从小到大输出. 分析:改变了代码的风格,因为看了学长的博客.直接用数组,可以只是记录节点的编号,因为节 ...
ACM - ICPC World Finals 2013 D Factors
原题下载:http://icpc.baylor.edu/download/worldfinals/problems/icpc2013.pdf 题目翻译: 问题描述一个最基本的算数法则就是大于1的整数 ...
MVVM设计模式《网摘》
MVVM模式能够帮你把你程序的业务与展现逻辑从用户界面干净地分离开.保持程序逻辑与界面分离能够帮助解决很多开发以及设计问题,能够使你的程序能更容易的测试,维护与升级.它也能很大程度的增加代码重用性,并 ...
对象不支持“attachEvent”属性或方法的解决办法
有些脚本在IE11下执行会报错误: 对象不支持“attachEvent”属性或方法解决办法解决办法:把attachEvent改为addEventListener即可

Hadoop 2.2 YARN分布式集群搭建配置流程

Hadoop 2.2 YARN分布式集群搭建配置流程的更多相关文章

随机推荐

热门专题