Yarn 集群环境 HA 搭建

环境准备

确保主机搭建 HDFS HA 运行环境

步骤一：修改 mapred-site.xml 配置文件

 [root@node-01 ~]# cd /root/apps/hadoop-3.2.1/etc/hadoop/

 [root@node-01 hadoop]# vim mapred-site.xml

 <configuration>

     	<!-- 配置MapReduce程序运行模式 为 yarn（不配置默认为 local 模式) -->

        <property>

                  <name>mapreduce.framework.name</name>

                  <value>yarn</value>

         </property>

		<!-- 设置 hadoop 路径 -->

		<property>

        	<name>mapreduce.application.classpath</name>

        	<value>/root/apps/hadoop-3.2.1/etc/hadoop:/root/apps/hadoop-3.2.1/share/hadoop/common/lib/*:/root/apps/hadoop-3.2.1/share/hadoop/common/*:/root/apps/hadoop-3.2.1/share/hadoop/hdfs:/root/apps/hadoop-3.2.1/share/hadoop/hdfs/lib/*:/root/apps/hadoop-3.2.1/share/hadoop/hdfs/*:/root/apps/hadoop-3.2.1/share/hadoop/mapreduce/lib/*:/root/apps/hadoop-3.2.1/share/hadoop/mapreduce/*:/root/apps/hadoop-3.2.1/share/hadoop/yarn:/root/apps/hadoop-3.2.1/share/hadoop/yarn/lib/*:/root/apps/hadoop-3.2.1/share/hadoop/yarn/*</value>

		</property>

</configuration>

步骤二：修改yarn-env.sh 配置文件

[root@node-01 ~]# cd /root/apps/hadoop-3.2.1/etc/hadoop

[root@node-01 hadoop]# echo 'export JAVA_HOME=${JAVA_HOME}' >> yarn-env.sh

步骤三：修改 yarn-site.xml 配置文件

[root@node-01 ~]# cd /root/apps/hadoop-3.2.1/etc/hadoop/

[root@node-01 hadoop]# vim yarn-site.xml

<configuration>

<!-- 配置 NodeManager上运行的附属服务（指定 MapReduce 中 reduce 读取数据方式） -->

<property>

	<name>yarn.nodemanager.aux-services</name>

	<value>mapreduce_shuffle</value>

</property>

	<!-- 配置 yarn 集群标识 id -->

    <property>

        <name>yarn.resourcemanager.cluster-id</name>

        <value>yarncluster</value>

    </property>

    <!-- 启用 yarn HA(高可用) -->

    <property>

        <name>yarn.resourcemanager.ha.enabled</name>

        <value>true</value>

    </property>

    <!-- 配置 resourcemanager 逻辑 ids 名称-->

    <property>

        <name>yarn.resourcemanager.ha.rm-ids</name>

        <value>rm1,rm2</value>

    </property>

    <!-- 配置 resourcemanager1 启动主机名-->

    <property>

        <name>yarn.resourcemanager.hostname.rm1</name>

        <value>node-01</value>

    </property>

    <!-- 配置 resourcemanager2 启动主机名 -->

    <property>

        <name>yarn.resourcemanager.hostname.rm2</name>

        <value>node-02</value>

    </property>

    <!--  配置 resourcemanager1 web 浏览器地址 -->

    <property>

        <name>yarn.resourcemanager.webapp.address.rm1</name>

        <value>node-01:8088</value>

    </property>

    <!--  配置 resourcemanager2 web 浏览器地址 -->

    <property>

        <name>yarn.resourcemanager.webapp.address.rm2</name>

        <value>node-02:8088</value>

    </property>

    <!--配置 zk 集群地址-->

    <property>

        <name>hadoop.zk.address</name>

        <value>node-01:2181,node-02:2181,node-03:2181</value>

    </property>

    <!-- 启用 resourcemanager 重启自动恢复 -->

    <property>

        <name>yarn.resourcemanager.recovery.enabled</name>

        <value>true</value>

    </property>

    <!-- 有三种StateStore，分别是基于 zookeeper, HDFS, leveldb, HA 高可用集群必须用 ZKRMStateStore -->

    <property>

        <name>yarn.resourcemanager.store.class</name>

        <value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore</value>

    </property>

    <!-- 配置自动检测硬件（默认关闭) -->

    <property>

        <name>yarn.nodemanager.resource.detect-hardware-capabilities</name>

        <value>true</value>

    </property>

    <!-- 配置 nodemanager 启动要求的最低配置-->

     <property>

        <name>yarn.nodemanager.resource.memory-mb</name>

        <value>1024</value>

    </property>

    <property>

        <name>yarn.nodemanager.resource.cpu-vcores</name>

        <value>1</value>

    </property>

</configuration>

步骤四：scp 这个 yarn-site.xml 到其他节点

[root@node-01 ~]# cd /root/apps/hadoop-3.2.1/etc/hadoop/

[root@node-01 ~]# scp mapred-site.xml node-02:$PWD

[root@node-01 ~]# scp mapred-site.xml node-03:$PWD

[root@node-01 ~]# scp yarn-env.sh node-02:$PWD

[root@node-01 ~]# scp yarn-env.sh node-03:$PWD

[root@node-01 ~]# scp yarn-site.xml node-02:$PWD

[root@node-01 ~]# scp yarn-site.xml node-03:$PWD

步骤五：启动 yarn 集群

[root@node-01 ~]# start-yarn.sh

stop-yarn.sh ：停止 yarn 集群

步骤六：用 jps 检查 yarn 的进程

[root@node-01 ~]# jps

16800 ResourceManager

12050 NameNode

11878 JournalNode

12362 DFSZKFailoverController

11739 QuorumPeerMain

16941 NodeManager

12174 DataNode

[root@node-02 ~]# jps

11616 JournalNode

13492 ResourceManager

11926 DataNode

11803 NameNode

11452 QuorumPeerMain

12046 DFSZKFailoverController

# 手动启动 node-02 和 node-03 nodemanger 进程

[root@node-02 ~]# yarn --daemon start nodemanager

[root@node-03 ~]# yarn --daemon start nodemanager

yarn --daemon stop nodemanager 停止nodemanger进程

步骤七：用 web 浏览器查看 yarn 的网页

node-01：http://192.168.229.21:8088/cluster/cluster

node-02：http://192.168.229.22:8088/cluster/cluster

步骤八：测试 ResourceManager 故障转移

# node-02 上关闭 resourcemanager 进程

[root@node-02 logs]# yarn --daemon stop resourcemanager

查看 node-01：http://192.168.229.21:8088/cluster/cluster，发现状态由 standby 变为 active，说明已经进行故障转移

将 node-02 上 resourcemanager 进程再次启动

[root@node-02 logs]# yarn --daemon start resourcemanager

这时，node-02 上的 resourcemanager 则变为 standby 状态，故障转移测试完成：）

步骤九：测试 Yarn 集群运行 wordcount 程序

将 wordcount 程序进行 Jar 打包并上传，执行 wordcount 程序

执行 MapReduce 程序命令格式：hadoop jar xxxx.jar 类全名(main 方法的类名和包名）

[root@node-01 ~]# ll

总用量 138368

drwxr-xr-x. 5 root root        69 4月   4 23:36 apps

-rw-r--r--. 1 root root   6870038 4月   8 13:12 MapReduceDemo-1.0-SNAPSHOT.jar

[root@node-01 hadoop]# hadoop jar MapReduceDemo-1.0-SNAPSHOT.jar wordcount.JobSubmitterLinuxToYarn

2021-04-08 20:00:17,739 INFO mapreduce.Job: Job job_1617883180833_0001 completed successfully #表示 Job 执行成功

Yarn 集群环境 HA 搭建的更多相关文章

Linux下Hadoop2.7.3集群环境的搭建
Linux下Hadoop2.7.3集群环境的搭建本文旨在提供最基本的,可以用于在生产环境进行Hadoop.HDFS分布式环境的搭建,对自己是个总结和整理,也能方便新人学习使用. 基础环境 JDK的安 ...
hadoop集群环境的搭建
hadoop集群环境的搭建今天终于把hadoop集群环境给搭建起来了,能够运行单词统计的示例程序了. 集群信息如下: 主机名 Hadoop角色 Hadoop jps命令结果 Hadoop用户 Had ...
Nacos集群环境的搭建与配置
Nacos集群环境的搭建与配置集群搭建一．环境: 服务器环境:CENTOS-7.4-64位三台服务器IP:192.168.102.57:8848,192.168.102.59:8848,192. ...
redis集群环境的搭建和错误分析
redis集群环境的搭建和错误分析 redis集群时,出现的几个异常问题 09 redis集群的搭建以及遇到的问题
ElasticSearch 5.2.2 集群环境的搭建
在之前 ElasticSearch 搭建好之后,我们通过 elasticsearch-header 插件在查看 ES 服务的时候,发现 cluster-health 显示的是 YELLOW. Why? ...
zookeeper3台机器集群环境的搭建
三台机器zookeeper的集群环境搭建 Zookeeper 集群搭建指的是 ZooKeeper 分布式模式安装. 通常由 2n+1台 servers 组成. 这是因为为了保证 Leader 选举(基 ...
基于原生态Hadoop2.6 HA集群环境的搭建
hadoop2.6 HA平台搭建一.条件准备软件条件: Ubuntu14.04 64位操作系统, jdk1.7 64位,Hadoop 2.6.0, zookeeper 3.4.6 硬件条件 ...
Linux下Hadoop2.6.0集群环境的搭建
本文旨在提供最基本的,可以用于在生产环境进行Hadoop.HDFS分布式环境的搭建,对自己是个总结和整理,也能方便新人学习使用. 基础环境 JDK的安装与配置现在直接到Oracle官网(http:/ ...
Linux下Hadoop2.7.1集群环境的搭建（超详细版）
本文旨在提供最基本的,可以用于在生产环境进行Hadoop.HDFS分布式环境的搭建,对自己是个总结和整理,也能方便新人学习使用. 一.基础环境 ...

随机推荐

TCP的client和server的简单连接
server: import socket as s import threading as t bind_ip = "0.0.0.0" bind_port = 80#配置服务器监 ...
gitee 学习笔记
这个流程只能是在自己的测试仓库中联系哟首先创建一个自己的仓库接下来安装git客户端,通过gitee官网给了一个例子创建ssh密钥然后输入命令 get clone 你仓库的https 或者ssh地 ...
Spring Boot XSS 攻击过滤插件使用
XSS 是什么 XSS(Cross Site Scripting)攻击全称跨站脚本攻击,为了不与 CSS(Cascading Style Sheets)名词混淆,故将跨站脚本攻击简称为 XSS,XSS ...
聊聊 OAuth 2.0 的 Token 续期处理
Token 校验逻辑 // CheckTokenEndpoint.checkToken @RequestMapping(value = "/oauth/check_token") ...
死磕Spring之AOP篇 - Spring AOP自动代理（一）入口
该系列文章是本人在学习 Spring 的过程中总结下来的,里面涉及到相关源码,可能对读者不太友好,请结合我的源码注释 Spring 源码分析 GitHub 地址进行阅读. Spring 版本:5.1 ...
Go 类型转换与类型判断
目录 Go 类型转换与类型判断 1.类型转化 2.类型判断 Go 类型转换与类型判断 1.类型转化 T(a) : T 是目标类型 a 是源变量 package main import "fm ...
IDEA 全局搜索，搜索Jar包中内容
配置find in path Ctrl+Shift+F Step 1:点击Scope Step 2:点击"..."更多 Step 3:点击加号"+" Step ...
pod详解
什么是pod? 官方说明: Pod是Kubernetes应用程序的最基本执行单元-是你创建或部署Kubernetes对象模型中的最小和最简单的单元. Pod表示在集群上运行的进程.Pod封装了应用程序 ...
tidb初体验
安装 docker-compose: https://github.com/pingcap/tidb-docker-compose pd tikv tidb各单个节点,单个副本,限制内存,cpu等,防 ...
win10 添加全局快捷键
前言好久没写博客了,今天水一下如何在win10 下添加一个全局唤醒的快捷键(打开截图软件) 步骤 win + Q 输入管理工具添加快捷方式这里没有管理员权限,可以直接把创建好的快捷方式粘 ...