YARN是资源管理调度的机制，之前一直以来和MapReduce机制合在一起，之后才分开。正是因为YARN机制单独独立出来，才使得Hadoop框架更加具有普适性。MapReduce可以处理海量离线数据，同样如果处理实时数据，换成Spark，Storm即可，不用重新部署集群，因为资源管理调度YARN是共用的。

当提交一个job，YARN的资源调度如下图所示：

YARN有两个比较重要的组成，Resource Manager和Node Manager，执行hadoop jar cn.darren.hadoop.mr.wordcount.WCRunner这条指令之后，会产生一个RunJar的进程，向RM申请资源，RM会返回job相关资源提交的路径和本Job产生的ID。进而RunJar提交资源到staging-dir路径下面，这在HDFS中，提交完向RM汇报提交结果。RM会将本job加入任务队列，其中RM和NM之间采用“心跳机制”，NM如果觉得自己有空闲，就可以去RM的任务队列领取任务。Node Manager接收到分配任务后，会分配运行的资源容器，有点类似于虚拟机，包括文件资源、CPU资源、内存资源等，业务是在里面跑的。但是YARN并不能启动MapReduce内部的逻辑，所以这时候会启动MRAppMaster，这是用来操作MapReduce的，然后它就会向RM进行注册，比如在哪个节点运行，什么标识等等，同样也会请求一些信息，比如分配的资源都在哪些节点上。然后MRAppMaster就会启动map任务进程，启动起来的进程叫做yarnChild，map执行完之后，会启动Reduce任务进程。MRAppMaster当job执行完后，会向RM注销自己。（map task和yarn task都叫做yarnChild）

总结一下：

在YARN框架中，起监控作用的是Resource Manager，用来监控Node Manager，它们都是节点，也就是进程。

在MapReduce框架中，起监控作用的是MRAppMaster，用来监控yarnChild，它们都是动态产生的进程。

YARN提交job的源码流程如图所示：

最后，将YARN机制的整个运行过程用一张图作为总结，可以看清其总的流程：

在yarn中有如下几个概念：

ResourceManager
NodeManager
Secheduler
ApplicationManager
MRAppMaster
Container

ResourceManager和NodeManager对应实体的物理节点，分别映射到yarn的主节点和计算节点。

1、ResourceManager

ResourceManager节点的功能由Secheduler和ApplicationManager协调完成。

其中ApplicationManager职责如下

负责接收客户端提交的job
判断启动该job的MRAppMaster所需的资源
监控MRAppMaster的状态，在其失败的时候重启MRAppMaster

Secheduler负责仅仅提供一个调度算法调度ApplicationManager提交的任务，他不提供失败重启和任何监控功能。调度算法可以自定义。yarn针对不同的场景提供了三种Secheduler实现：FIFO Scheduler ，Capacity scheduler，Fair Scheduler（请参照调度器详解）。

2、NodeManager

NodeManager对应集群中的计算节点，但是他的功能仅仅只是抽象本节点的资源(如cpu，内存，磁盘，网络)并且定时向ResourceManager的Secheduler汇报。

Container是一组资源的集合，一个container一般用来执行一个task。

MRAppMaster是job的生命周期的管理者，负责整个job执行过程的监控。

前面提到ApplicationManager会判断启动MRAppMaster所需的资源，之后提交给Secheduler，Secheduler将这些资源封装成一个Container，然后根据调度算法在某一个NodeManager上启动MRAppMaster(当然它会消耗掉该NodeManager的资源)。

MRAppMaster启动之后会计算job所需要的资源，并且向Secheduler申请这些资源，NodeManager分配完成这些任务的container之后，会由MRAppMaster来监控这些container的状态，如果失败就回收资源重新申请，如果成功就释放资源，当任务执行完成之后汇报Secheduler，Secheduler回收资源并且向ResourceManager返回执行结果，整个任务处理完毕。

YARN机制的更多相关文章

Hadoop yarn工作流程详解
yarn是什么?1.它是一个资源调度及提供作业运行的系统环境平台资源:cpu.mem等作业:map task.reduce Task yarn产生背景?它是从hadoop2.x版本才引入1.had ...
Hadoop2.0之YARN组件
官方文档:https://hadoop.apache.org/docs/stable/,目前官方已经是3.x,但yarn机制没有太大变化一.简介在Hadoop1.0中,没有yarn,所有的任务调度 ...
面试杂谈之我的实习求职之路（7个offer）
现在是5月11号,刚从北京到家,总算也可以歇歇了,最近一段时间真是忙于奔命的感觉,也确实体会到了找工作的艰辛,总而言之,求职之路,如人饮水,冷暖自知. 我想把这段时间找工作的体验和经历分享出来告诉大家 ...
Flink HA
standalone 模式的高可用部署 flink 使用zookeeper协调多个运行的jobmanager,所以要启用flink HA 你需要把高可用模式设置成zookeeper,配置zookee ...
春招实习汇总（7个offer）
转载出处刚从北京到家,总算也可以歇歇了,最近一段时间真是忙于奔命的感觉,也确实体会到了找工作的艰辛,总而言之,求职之路,如人饮水,冷暖自知. 我想把这段时间找工作的体验和经历分享出来告诉大家,让大避 ...
hadoop2.5.0 HA高可用配置
hadoop2.5.0 HA配置 1.修改hadoop中的配置文件进入/usr/local/src/hadoop-2.5.0-cdh5.3.6/etc/hadoop目录,修改hadoop-env.s ...
hadoop MapReduce Yarn运行机制
原 Hadoop MapReduce 框架的问题原hadoop的MapReduce框架图从上图中可以清楚的看出原 MapReduce 程序的流程及设计思路: 首先用户程序 (JobClient) ...
3 weekend110的job提交的逻辑及YARN框架的技术机制 + MR程序的几种提交运行模式
途径1: 途径2: 途径3: 成功! 由此,可以好好比较下,途径1和途径2 和途径3 的区别. 现在,来玩玩weekend110的joba提交的逻辑之源码跟踪原来如此,weekend110的job提 ...
Hadoop Yarn 框架原理及运作机制及与MapReduce比较
Hadoop 和 MRv1 简单介绍 Hadoop 集群可从单一节点(其中所有 Hadoop 实体都在同一个节点上运行)扩展到数千个节点(其中的功能分散在各个节点之间,以增加并行处理活动).图 1 演 ...

随机推荐

Hadoop 添加删除Slave
Hadoop 添加删除Slave @(Hadoop) 在hdfs-site.xml文件中添加如下配置: <property> <name>dfs.hosts</name& ...
os.waitpid()无法获取sys.exit()退出时的status code
[目的] 父进程使用os.waitpid()等待子进程退出,并检测子进程的exit code,以决定是否重启子进程. (常见的应用场景是:子进程接收外部命令,收到"stop"时退出 ...
OC中数组的使用方法
#import <Foundation/Foundation.h> int main(int argc, const char * argv[]) { // 创建数组 NS ...
atitit.提升开发效率---使用server控件生命周期 asp.net 11个阶段 java jsf 的6个阶段比較
atitit.提升开发效率---使用server控件生命周期 asp.net 11个阶段 java jsf 的6个阶段比較例如以下列举了server控件生命周期所要经历的11个阶段. (1)初始 ...
java中接口与抽象类的区别
接口和抽象类的共同特征如下: 接口和抽象类都不能被实例化,位于继承树的顶端,用于被其他类实现和继承. 接口和抽象类都可以包含抽象的方法,实现接口的类或者继承抽象类的类都必须实现这些抽象的方法. 区别: ...
iOS UITapGestureRecognizer手势和UIButton 以及UITabelView点击事件冲突
一:在同一个view上加载,UITapGestureRecognizer手势,UIButton 行为,UITabelView点击事件冲突: 二:解决方式: 在UITapGesttureRecogniz ...
使用python在WEB页面上生成EXCEL文件
来自:http://blog.sina.com.cn/s/blog_5d18f85f0101bxo7.html 近日写的一个程序需要在WEB服务器上生成EXCEL文件供用户下载,研究了一下找到了以下比 ...
name_search方法的使用
转自:http://blog.csdn.net/littlebo01/article/details/22075573 在many2one类型中,页面下拉时会首先触发name_search方法,参数这 ...
【Linux】通过传入变量进行数学运算
一个简单的sum求和 #! /bin/bash ## For get the sum of tow numbers ## Writen by Qinys ## Date:2018-06-26 a=1 ...
windowsclient开发--怎样測量一个字符串显示的物理长度
首先须要说明的是,我所说的字符串的长度,不是string的length,也不是string的size.我指的是显示的长度.即物理长度. 缘由: 之所以要提到这个.是由于遇到了一些问题. 再使用duil ...

YARN机制

最后，将YARN机制的整个运行过程用一张图作为总结，可以看清其总的流程：

1、ResourceManager

2、NodeManager

YARN机制的更多相关文章

随机推荐

热门专题