MapRdeuce&Yarn的工作机制(YarnChild是什么)

MapRdeuce&Yarn的工作机制

一幅图解决你所有的困惑

那天在集群中跑一个MapReduce的程序时，在机器上jps了一下发现了每台机器中有好多个YarnChild。困惑什么时YarnChild，当程序跑完后就没有了，神奇。后来百度了下，又问问了别的大佬。原来是这样

什么是YarnChild:

答：MrAppmaster运行程序时向resouce manager 请求的maptask/reduceTask。也是运行程序的容器。其实它就是一个运行程序的进程。

图解说下：

hadoop1版本的MapRdeuce&Yarn的工作机制

1.客户端发来request。JobTracker接受request。

2.JobTracker将客户端发来的request任务分配给TaskTracker

3.然后TaskTracker生成maptask运行程序

4.JobTracker不仅要负责资源调度，还要负责监控应运运算流程。

缺点：耦合的高，当JobTracker死掉时，所有的客户端的请求任务都会死掉，而hadoop2则避免了这个问题，它中的对象多，但都各司其职，耦合的低，运行效率快。

hadoop2版本的MapRdeuce&Yarn的工作机制

1.客户端发出请求，YARNRUNNER接受，生成一个代理对象，向resource manager请求一个application

2.resource manager返回application的提交路径和application_id(这里使用id是应为可能有多个任务用id来区别)

3.YARNRUNNER向hdfs提交job运行所需要的文件(application，job.split,job,.xml,job.jar)

4.向resource manager 报告提交完成，申请一个mrAppMaster

5.将用户的请求初始化成一个task，将task放到队列中，等待node manager来领取task任务。(这其中使用了调度策略，节约资源，如：Fair Capacity等等)

6.node manager领取到任务,

7.生成一个Container，然后在hdfs中下载运行资源。

8.向resource manager申请运行maptask的容器（带着任务，split,运行资源.的元数据..）

9.其他的node manager领取到resouce manager的任务，创建容器，此时的Container则是YarnChild,也是maptask，然后maptask在hdfs下载所要运行的资源。

10.MrAppMaster发送程序脚本运行jar，当maptask中的程序运行完成后，maptask的资源被resource manager回收了，但跑完的资源在node manager中。

11.当maptask运行完成后MRAppmaster又向resorce manager申请 reduce task（至于它申请多少个是由它有多少个map task决定的），然后根据忙于不忙node manager领取任务.创建container，

12.redcuetask 向map获取相应分区的数据资源，运行文件。

13.application运行完毕后MrAppmaster会向resource manager注销自己

总结：Yarn:资源调度系统（jar/xml/cpu/IO）

负责程序运行所需资源的分配回收等任务调度，于程序运行内部即使完全无关，所以yarn只是一个寺院调度平台，mapreudce 则是一个运行技术框架，那别的运算框架也可以使用yarn，如：spark/storm/flink....

MapRdeuce&Yarn的工作机制(YarnChild是什么)的更多相关文章

yarn/mapreduce工作机制及mapreduce客户端代码编写
首先需要知道的就是在老版本的hadoop中是没有yarn的,mapreduce既负责资源分配又负责业务逻辑处理.为了解耦,把资源分配这块抽了出来,形成了yarn,这样不仅mapreudce可以用yar ...
Yarn 工作机制
1.工作机制详述 (1)MR程序提交到客户端所在的节点. (2)YarnRunner向ResourceManager申请一个Application. (3)RM将该应用程序的资源路径返回给YarnRu ...
MapReduce的工作机制
<Hadoop权威指南>中的MapReduce工作机制和Shuffle: 框架 Hadoop2.x引入了一种新的执行机制MapRedcue 2.这种新的机制建议在Yarn的系统上,目前用于 ...
Hadoop MapReduce 一文详解MapReduce及工作机制
@ 目录前言-MR概述 1.Hadoop MapReduce设计思想及优缺点设计思想优点: 缺点: 2. Hadoop MapReduce核心思想 3.MapReduce工作机制剖析MapRe ...
Spark工作机制简述
Spark工作机制主要模块调度与任务分配 I/O模块通信控制模块容错模块 Shuffle模块调度层次应用作业 Stage Task 调度算法 FIFO FAIR(公平调度) Spark应 ...
MapReduce工作机制——Word Count实例（一）
MapReduce工作机制--Word Count实例(一) MapReduce的思想是分布式计算,也就是分而治之,并行计算提高速度. 编程思想首先,要将数据抽象为键值对的形式,map函数输入键值对 ...
Hadoop的namenode的管理机制，工作机制和datanode的工作原理
HDFS前言: 1) 设计思想分而治之:将大文件.大批量文件,分布式存放在大量服务器上,以便于采取分而治之的方式对海量数据进行运算分析: 2)在大数据系统中作用: 为各类分布式运算框架(如:mapr ...
Hadoop记录-MRv2（Yarn）运行机制
1.MRv2结构—Yarn模式运行机制 Client---客户端提交任务 ResourceManager---资源管理 ---Scheduler调度器-资源分配Containers ----在Yarn ...
MapReduce1 工作机制
本文转自:Hadoop MapReduce 工作机制工作流程作业配置作业提交作业初始化作业分配作业执行进度和状态更新作业完成错误处理作业调度 shule(mapreduce核心)和 ...

随机推荐

安装Linux系统，学习Linux操作基础
20189230杨静怡 2018-2019-2 <移动平台开发实践>第1周学习总结安装Linux系统内容总结一．学习"基于VirtualBox虚拟机安装Ubuntu图文教程& ...
附8 zipkin
一.zipkin作用全链路追踪工具(查看依赖关系) 查看每个接口.每个service的执行速度(定位问题发生点或者寻找性能瓶颈) 二.zipkin工作原理创造一些追踪标识符(tracingId,s ...
Docker：Dockerfile命令详解
1.FROM 功能为指定基础镜像,并且必须是第一条指令. 如果不以任何镜像为基础,那么写法为:FROM scratch. 同时意味着接下来所写的指令将作为镜像的第一层开始语法: FROM <i ...
cocos2dx 实现文字的一键复制功能（IOS、Android）
1.IOS篇(用OC和C++混编) 头文件声明: public static void copy(std::string str); 实现如下: void copy(std::string str) ...
POJ 1986 Distance Queries(LCA Tarjan法)
Distance Queries [题目链接]Distance Queries [题目类型]LCA Tarjan法 &题意: 输入n和m,表示n个点m条边,下面m行是边的信息,两端点和权,后面 ...
bootloader研究最后一关（中）
2011-03-12 17:04:13 今天的目的是要把bin文件烧录到nandflash中. 其实我有一个问题一直没弄明白.S3C2440自带的RAM和ROM是多大?看了规格书说它能控制1G的8个b ...
GoldenGate for Java adapter介绍二（代码篇）
本示例主要介绍通过实现OGG的接口函数,实现自定义处理增量数据,将数据实时写入到mariadb (OGG官方不支持此数据库,所以只能采用自定义方式实现).以下是本次示例的4个类: Connection ...
LNMP 如何安装mongodb
wget -c http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.6.4.tgztar -zxvf mongodb-linux-x86_64 ...
Shiro权限管理框架
一.Shiro介绍 Apache Shiro 是Java 的一个安全框架.Shiro 可以非常容易的开发出足够好的应用,其不仅可以用在JavaSE 环境,也可以用在JavaEE 环境.Shiro 可以 ...
haproxy 初识
官方网站:http://www.haproxy.org 描述 HAProxy的是一个免费的,非常快速和可靠的解决方案,提供高可用性, 负载均衡和代理对TCP和基于HTTP的应用程序.它特别适用于流量 ...

MapRdeuce&Yarn的工作机制(YarnChild是什么)

MapRdeuce&Yarn的工作机制

MapRdeuce&Yarn的工作机制(YarnChild是什么)的更多相关文章

随机推荐

热门专题