yarn 与 resource manager ha

YARN
最初的思想是把hadoop1中的job tracker的功能拆分出来,
把它的资源管理与任务调度功能分成两个单独的进程.
yarn体系结构中有两个进程,resource manager和nodemanger
.
前者主要负责资源分配,后者nodemanager在每一个机器中都有一个进程,
负责container的创建,监控分配的资源(CPU,内存和磁盘与网络资源),同时
通过心跳汇报这些情况给RM.
applicationmaster是框架特定的作业进程,主要负责与RM申请资源与监控任务
执行的情况.运行在nodemanager上面.
包含两大组件,Scheduler和ApplicationManager.
Scheduler负责创建资源,这些资源基于队列与容量限制.
现在资源以容器的形式包装起来,如多少内存,多少个cpu core被定义成一个容器.
一个作业请求的时候分配多少个容器?
调度器具有可插拔的功能,来负责把集群的资源进行划分.现在主流的调度策略是
基于YARN的容量调度策略与基于FB的公平调度策略.

应用管理器主要负责作业的提交,并且负责协调第一个容器,第一个窗口是作业的
applicationmaster进程需要的,它还负责这个容器启动失败后的重启.appicationmaster
后期会向sheduler来协调作业运行需要的资源.

YARN支持资源保留机制,有时候需要运行特别重要的作业,或者某作业需要的容量比较大,
可会自动启用保留机制,预留一些cpu,内存资源供作业使用.
如何主动在代码中使用这个功能?

RM的重启,
早期的RM HA实现中,只做到了不保留工作的重启,即它只保留了作业的状态与
运行时所需安全证书等信息,然后重启之后,nm会杀死正在运行的container并重新注册到rm上,
相当于重新启动了整个yarn,只是不需要重新提交作业而已.
近两年已经实现了保留工作的RM重启,通过结合从NM,application master来重建容器状态,原来
运行的作业不需要在rm重启后被杀死重新运行,在重启或切换期间它们只是轮询尝试,对用户是透明的.
这些作业运行的元数据信息可能保存在HDFS上,也可以保存在数据库与ZOOKEEPER上,
主流的配置是ZOOKEERP,因为它可以支持RM的HA,主要是支持fencing来保证不脑裂,不让多个rm进程来
改写存储的内容,这是ZK的特定,它的节点可以用于分布式锁类似的功能.
基于文件或leveldb的存储都不支持fencing的功能.

<property>

   <description>Enable RM to recover state after starting. If true, then

   yarn.resourcemanager.store.class must be specified</description>

   <name>yarn.resourcemanager.recovery.enabled</name>

   <value>true</value>

 </property>

<property>

   <description>The class to use as the persistent store.</description>

   <name>yarn.resourcemanager.store.class</name>

   <value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore</value>

 </property>

<property>

   <description>Comma separated list of Host:Port pairs. Each corresponds to a ZooKeeper server

   (e.g. "127.0.0.1:3000,127.0.0.1:3001,127.0.0.1:3002") to be used by the RM for storing RM state.

   This must be supplied when using org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore

   as the value for yarn.resourcemanager.store.class</description>

   <name>yarn.resourcemanager.zk-address</name>

   <value>127.0.0.1:2181</value>

 </property>

主要翻译自apache hadoop yarn官网

yarn 与 resource manager ha的更多相关文章

Spark运行模式_基于YARN的Resource Manager的Custer模式（集群）
使用如下命令执行应用程序: 和"基于YARN的Resource Manager的Client模式(集群)"运行模式,区别如下: 在Resource Manager端提交应用程序,会 ...
Hadoop 管理工具HUE配置-Yarn Resource Manager HA配置
安装HUE之后,需要配置很多东西才能将这个系统的功能发挥出来,因为Yarn是配置的HA模式,所以在配置HUE的时候,会有些不用,下面一段文字是官网拿来的 # Configuration for YAR ...
Spark运行模式_基于YARN的Resource Manager的Client模式（集群）
现在越来越多的场景,都是Spark跑在Hadoop集群中,所以为了做到资源能够均衡调度,会使用YARN来做为Spark的Cluster Manager,来为Spark的应用程序分配资源. 在执行Spa ...
Hadoop Yarn配置项 yarn.nodemanager.resource.local-dirs探讨
1. What is the recommended value for "yarn.nodemanager.resource.local-dirs"? We only have ...
Yarn 集群环境 HA 搭建
环境准备确保主机搭建 HDFS HA 运行环境步骤一:修改 mapred-site.xml 配置文件 [root@node-01 ~]# cd /root/apps/hadoop-3.2.1/et ...
Azure 新的管理模式 —— Resource Manager
var appInsights=window.appInsights||function(config){ function r(config){t[config]=function(){var i= ...
Resource Manager
Azure Resource Manager overview https://azure.microsoft.com/en-us/documentation/articles/resource-gr ...
在 Azure Resource Manager 模板中使用托管磁盘
本文介绍使用 Azure Resource Manager 模板预配虚拟机时托管与非托管磁盘之间的差异. 这有助于将现有模板从使用非托管磁盘更新为使用托管磁盘. 我们将使用 101-vm-simple ...
在 Azure Resource Manager 中为虚拟机设置密钥保管库
Note Azure 具有两种不同的部署模型,用于创建和处理资源:Resource Manager 模型和经典模型.本文介绍使用 Resource Manager 部署模型.Azure 建议对大多数新 ...

随机推荐

PHP正则表达式 /i, /s, /x,/u, /U, /A, /D, /S等模式修饰符
i (PCRE_CASELESS) 如果设置了这个修饰符, 模式中的字母会进行大小写不敏感匹配. m (PCRE_MULTILINE) 默认情况下, PCRE认为目标字符串是由单行字符组成的(然而实际 ...
Hibernate_day01--课程安排_Hibernate概述_Hibernate入门
Hibernate_day01 Hibernate课程安排今天内容介绍 WEB内容回顾 JavaEE三层结构 MVC思想 Hibernate概述什么是框架什么是hibernate框架(重点) 什 ...
UE4插件
源代码中包含一些插件例子 C:\Program Files\Epic Games\UE_4.15\Engine\Plugins\Developer 一下截图来自官网https://docs.unrea ...
【已解决】Android ADT中增大AVD内存后无法启动：emulator failed to allocate memory
[已解决]Android ADT中增大AVD内存后无法启动:emulator failed to allocate memory 结论是: 当前有个bug: 默认是通过 hw.ramSize=1024 ...
java如何发起一次http的post请求？
@RequestMapping(value = "loginInSSO", method = RequestMethod.GET) public String loginInSSO ...
领悟 JavaScript 中的面向对象
JavaScript是基于对象的语言,我们可以使用面向对象的思想去开发js代码. JavaScript是基于对象的语言. 可以使用面向对象的思想,但是不少人对这一点理解得并不全面. 在 JavaScr ...
Sublime Text 3如何编译运行c++程序
扯去了一趟清北学堂感觉自己玩的特别嗨,算法没学到什么,前端和爬虫的知识到是会了不少. 然后知道了有一个叫做sublime text 3的编辑器,好用不好用不知道,就冲着它好看,就决定以后就用它了. ...
git 学习(2)--恢复版本
查看修改历史记录 $ git log commit fba77877d316436c1b774b8933380ebcac668040 Author: keith <ustbfxx@163.com ...
multi-paradigm
w范式 https://developer.mozilla.org/en-US/docs/Web/JavaScript https://developer.mozilla.org/zh-CN/docs ...
oracle 归档空间满的解决办法
问题现象: 通过命令提示符登陆数据库,一般提示“ora-03113:通信通道的文件结尾”错误,查看trace日志,可以看到详细信息.部分摘录如下(橙色部分给出了建议方案): Errors in fil ...

yarn 与 resource manager ha

yarn 与 resource manager ha的更多相关文章

随机推荐

热门专题