Hadoop_19_MapReduce&&Yarn运行机制

1.YARN的运行机制

1.1.概述：

Yarn集群：负责海量数据运算时的资源调度，集群中的角色主要有：ResourceManager、NodeManager

　　Yarn是一个资源调度(作业调度和集群资源管理)平台，负责为运算程序提供服务器运算资源(包括运行

程序的jar包，配置文件，CPU，内存，IO等)，相当于一个分布式的操作系统平台，而Mapreduce等运算程

序则相当于运行于操作系统之上的应用程序

　　Linux的资源隔离机制cgroup实现了CPU和内存的隔离(一个程序分配单独的CPU和内存),从而给不同的进

程分开运算资源，其中虚拟化技术就是做这种资源隔离的，例如Docker、OpenStack等，在NodeManager中的

运行容器Container就包含了一定的CPU+内存

1.2.YARN的重要概念：

　　1.Yarn只负责程序运行所需资源的分配回收等调度任务，与用户提交的应用程序的内部运行机制完全

无关，所以Yarn已经成为一个通用的资源调度平台，许多运算框架都可以借助它来实现资源调度，如spark

storm，从而提高资源利用率，方便数据共享

　　2.yarn只提供运算资源的调度（用户程序向yarn申请资源，yarn就负责分配资源）

　　3.yarn中的主管角色叫ResourceManager

　　4.yarn中具体提供运算资源的角色叫NodeManager

　　5.这样一来，yarn其实就与运行的用户程序完全解耦，就意味着yarn上可以运行各种类型的分布式运算程

序（mapreduce只是其中的一种），比如mapreduce、storm程序，spark程序，tez ……只要他们各自的框架中

有符合yarn规范的资源请求机制即可

1.3.MR运行在YARN集群的流程分析：

详细步骤说明：

提交过程

当客户端(jobclient)提交一个MapReduce程序(作业/job submission)后，将获取到一个跟Yarn通信的客户端程序YarnRunner，它本质上是一个动态代理对象。它负责将任务提交到Yarn集群中
接着，YarnRunner根据配置文件yarn-site.xml(yarn.resoucemanager.hostname)中的配置信息向ResourceManager申请提交一个Application，此时ResourceManager会返回一个Application资源提交路径hdfs://xxx/.staging以及job_id
提交程序运行所需资源到ResourceManager指定的HDFS目录中，包含job.split(任务的切片规划)，job.xml，job.jar等，然后通知ResourceManager，job的资源文件提交完成，申请运行MRAppMaster

运行过程

由于ResourceManager会接收很多程序，而运算资源是有限的。因此不能保证每个任务一提交就能运行，所以需要有一个调度机制(调度策略包括FIFO：First Input First Output，先入先出队列；Fair；Capacity等)
然后由ResourceManager把Job封装成一个Task对象放入任务调度队列
NodeManager与ResourceManager通信，领取需要运行的Task任务，并根据Task的任务描述，由NodeManager生成任务运行的容器container，并从HDFS上把任务需要的文件下载下来，放到container的工作目录中，启动MRAppmaster在该容器中运行
MRAppmaster请求ResourceManager分配若干个Container来启动MapTask，此时ResourceManager同样会将Task放入队列中，NodeManager与ResourceManager通信时，会领取这个Task。然后由NodeManager创建一个容器，有了容器后，MRAppmaster会发送启动程序的脚本给NodeManager。MapTask就运行起来。并由MRAppmaster进行监管，如果某个MapTask失败了，MRAppmaster会申请一个新的容器去再运行这个MapTask
等到MapTask运行完毕之后，输出结果保存在container的工作目录下面
MRAppmaster再申请容器运行ReduceTask
ReduceTask运行起来以后，会去下载MapTask的输出结果，每个ReduceTask获取自己相应的分区数据，
ReduceTask执行完毕后，MRAppmaster会向ResourceManager注销自己，YARN会回收所有的计算资源

总结：1. Yarn只负责程序运行所需要资源的分配回收等调度任务，和MapReduce程序只需要请求资源和Yarn并没有什么耦合。所以许许多多的其他的程序也可以在YARN上运行，比如说Spark，Storm等

2. Hadoop1中没有Yarn，它使用JobTracker和TaskTracker。客户端提交任务给JobTracker，JobTracker负责启动MapTask和ReduceTask。JobTracker知道我们的程序是怎么运行的，即JobTracker和MR程序是紧紧耦合在一起的，JobTracker只有一个节点，要负责资源调度和应用的运算流程管理监控，如果JobTracker挂了，所有的程序都不能运行了，而Hadoop2中MRAppmaster一旦挂了，只会影响到当前这一个程序

Hadoop_19_MapReduce&&Yarn运行机制的更多相关文章

hadoop MapReduce Yarn运行机制
原 Hadoop MapReduce 框架的问题原hadoop的MapReduce框架图从上图中可以清楚的看出原 MapReduce 程序的流程及设计思路: 首先用户程序 (JobClient) ...
Flink on Yarn运行机制
从图中可以看出,Yarn的客户端需要获取hadoop的配置信息,连接Yarn的ResourceManager.所以要有设置有 YARN_CONF_DIR或者HADOOP_CONF_DIR或者HADOO ...
hadoop Yarn运行机制
Hadoop记录-MRv2（Yarn）运行机制
1.MRv2结构—Yarn模式运行机制 Client---客户端提交任务 ResourceManager---资源管理 ---Scheduler调度器-资源分配Containers ----在Yarn ...
经典MapReduce作业和Yarn上MapReduce作业运行机制
一.经典MapReduce的作业运行机制如下图是经典MapReduce作业的工作原理: 1.1 经典MapReduce作业的实体经典MapReduce作业运行过程包含的实体: 客户端,提交MapR ...
一文了解 Hadoop 运行机制
大数据技术栈在当下已经是比较成熟的了,Hadoop 作为大数据存储的基石,其重要程度不言而喻,作为一个想从 java 后端转向大数据开发的程序员来说,打好 Hadoop 基础,就相当于夯实建造房屋的地 ...
Flink 集群运行原理兼部署及Yarn运行模式深入剖析
1 Flink的前世今生(生态很重要) 原文:https://blog.csdn.net/shenshouniu/article/details/84439459 很多人可能都是在 2015 年才听到 ...
大数据技术 - MapReduce 作业的运行机制
前几章我们介绍了 Hadoop 的 MapReduce 和 HDFS 两大组件,内容比较基础,看完后可以写简单的 MR 应用程序,也能够用命令行或 Java API 操作 HDFS.但要对 Hadoo ...
day1--大数据概念，hadoop介绍，hdfs整体运行机制
1.什么是大数据基本概念在互联网技术发展到现今阶段,大量日常.工作等事务产生的数据都已经信息化,人类产生的数据量相比以前有了爆炸式的增长,以前的传统的数据处理技术已经无法胜任,需求催生技术,一套用 ...

随机推荐

SSD总结
SSD: Single Shot MultiBox Detector 1. Introduction 改进点: 以前的方法都是先搞bounding box,再对box里面做分类.特点:精度高,速度慢. ...
QML使用Python的函数
有2种方法: 一. QML中定义一个信号,连接Python里的函数: 这里的函数不用特意指明为槽函数,普通函数即可. QML的信号连接Python的函数 QML:首先在QML中定义一个信号,这里的信号 ...
82. 删除排序链表中的重复元素 II
# 给定一个排序链表,删除所有含有重复数字的节点,只保留原始链表中没有重复出现的数字,比如: # 输入: 1->2->3->3->4->4->5 # 输出: 1 ...
EuRoc V203数据集的坑
EuRoc数据集时间戳问题以前听别人说过V203序列有问题,今儿仔细看了才发现EuRoc的V203数据集中的左右相机照片数量不相等,很僵硬,cam0存在大量丢帧,之前一直用单目数据,没什么感觉.. ...
django 之(五) --- RESTApi总结
RESTful django-rest-framework serializers 序列化工具.序列化与反序列化级联模型添加级联字段 nested 级联字段的key原来必须就是存在的隐性属性.自 ...
shell脚本执行出现“期待整数表达式”
在执行shell时一直出现“integer expression expected”,找了很久也没发现那个地方出错.翻了笔记发现-le并不错啊,甚至还怀疑零是不是整数还特意上网搜了下 -_- . 最后 ...
同一个ip，不同端口号，cookie会被覆盖
参考资料:https://blog.csdn.net/czh500/article/details/80420459
jdbc配置及使用测试
源码:https://github.com/xiaostudy/jdbc_test1 这是没有使用连接池的目录创建的sql语句create.sql DROP TABLE IF EXISTS t_u ...
luogu P3031 [USACO11NOV]高于中位数Above the Median (树状数组优化dp)
链接:https://www.luogu.org/problemnew/show/P3031 题面: 题目描述 Farmer John has lined up his N (1 <= N &l ...
js中遍历对象的属性和值的方法
鉴于循环目标是个对象,length是为undefined,用map等对数组的循环方法不行,对象就用此下方法 for(var key in _this.lists.medicines){ medicin ...

Hadoop_19_MapReduce&&Yarn运行机制

Hadoop_19_MapReduce&&Yarn运行机制的更多相关文章

随机推荐

热门专题