什么是YARN

YARN的核心组件：

1）ResourceManager，扮演Master角色（和HDFS的nameNode很像）主要用于资源分配；RM有两个子组件，分别是Scheduler（Capacity Scheduler以及Fair Scheduler）以及ApplicationManager，主要用于管理应用列表。

2）ApplicationMaster，主要用于资源的请求和已分配资源的管理；ApplicationMaster是由应用提供的，应用将会以jar的形式提交applicationMaster以及其他依赖的jar包；

3）NodeManager，扮演slave的角色（和HDFS的DataNode很像），NodeManager主要负责根据请求创建资源的封装器--contianer，业务的执行都是基于container进行的。

提交应用流程：

1. Client提交应用请求到YARN，请求包括CLC（Container Lanuch Context）；YARN将会反馈一个applicationID，这里包括ApplicationMaster实现以及业务逻辑需要的依赖jar包，打包一起扔给了YARN，其实对于那个是applicationManager将会有字段进行说明；

2. YARN首先会尝试为应用分配资源队列（Capacity或者Fair），然后轮到了该应用处理的时候（如果是fair资源池直接就可以进行工作了），RM将会首先尝试为applicationMaster进行分配资源，拉起一个container（成为container 0），专门用于跑ApplicationMaster（AM）；一旦container 0被拉起来了，应用的状态就是Accecpted，接受了applicationMaster之意；

3. 然后是在container 0里面初始AM，初始化完事后AM将会向RM注册自己，RM反馈一下当前资源情况，AM将会基于当前资源情况向YARN申请资源，通过ResourceRequest；；然后YARN将会反馈一个包含了token认证信息的一个资源清单；AM拿着这个清单，注意是AM，RM分配完资源，告诉container之后就啥也不管了；AM拿着这份资源清单以及CLC下放给NodeManager；当container都执行完了，AM会告诉RM完成；RM将会回收这些容器。在这个过程，两者还会有一些交互，比如AM会想RM通告进度；这些交互都是通过AM向RM发送心跳。

4. NodeManager将会对token进行验证，确认无假后，边从自身的资源中拉起一个container，然后把请求资源进行本地化（包括代码运行的jar包，一些公共的资源等）；如果是spark，container里面运行的即使executor进程（是的，是进程）；

5. container任务执行完成后，container将会被kill掉；

什么是YARN的更多相关文章

大数据之Yarn——Capacity调度器概念以及配置
试想一下,你现在所在的公司有一个hadoop的集群.但是A项目组经常做一些定时的BI报表,B项目组则经常使用一些软件做一些临时需求.那么他们肯定会遇到同时提交任务的场景,这个时候到底如何分配资源满足这 ...
[大数据之Yarn]——资源调度浅学
在hadoop生态越来越完善的背景下,集群多用户租用的场景变得越来越普遍,多用户任务下的资源调度就显得十分关键了.比如,一个公司拥有一个几十个节点的hadoop集群,a项目组要进行一个计算任务,b项目 ...
Node.js包管理器Yarn的入门介绍与安装
FAST, RELIABLE, AND SECURE DEPENDENCY MANAGEMENT. 就在昨天, Facebook 发布了新的 node.js 包管理器 Yarn 用以替代 npm .咱 ...
03 Yarn 原理介绍
Yarn 原理介绍大纲: Hadoop 架构介绍 YARN 产生的背景 YARN 基础架构及原理 Hadoop的1.X架构的介绍在1.x中的NameNodes只可能有一个,虽然可以通过Se ...
Spark on YARN的部署
Spark on YARN的原理就是依靠yarn来调度Spark,比默认的Spark运行模式性能要好的多,前提是首先部署好hadoop HDFS并且运行在yarn上,然后就可以开始部署spark on ...
yarn关于app max attempt深度解析，针对长服务appmaster平滑重启
在YARN上开发长服务,需要注意fault-tolerance,本篇文章对appmaster的平滑重启的一个参数做了解析,如何设置可以有助于达到appmaster平滑重启. 在yarn-site.xm ...
Spark源码编译并在YARN上运行WordCount实例
在学习一门新语言时,想必我们都是"Hello World"程序开始,类似地,分布式计算框架的一个典型实例就是WordCount程序,接触过Hadoop的人肯定都知道用MapRedu ...
配置Spark on YARN集群内存
参考原文:http://blog.javachen.com/2015/06/09/memory-in-spark-on-yarn.html?utm_source=tuicool 运行文件有几个G大,默 ...
【hadoop2.2(yarn)】基于yarn成功执行分布式map-reduce，记录问题解决过程。
hadoop2.x改进了hadoop1.x的架构, 具体yarn如何工作以及改进了什么可以在网上学, 这里仅记录我个人搭建的问题和理解,希望能帮助遇到困难的朋友. 在开始前,必须了解yarn版本的ma ...
Spark on Yarn 学习(一)
最近看到明风的关于数据挖掘平台下实用Spark和Yarn来做推荐的PPT,感觉很赞,现在基于大数据和快速计算方面技术的发展很快,随着Apache基金会上发布的一个个项目,感觉真的新技术将会不断出现在大 ...

随机推荐

Redis原理与实践总结
Redis原理与实践总结本文主要对Redis的设计和实现原理做了一个介绍很总结,有些东西我也介绍的不是很详细准确,尽量在自己的理解范围内把一些知识点和关键性技术做一个描述.如有错误,还望见谅,欢迎指 ...
Effective C++学习笔记（1）
最近刚看完Effective C++,记录一下当前几个比较常用的方法. 1.以独立语句将newed对象置入智能指针智能指针是以对象管理资源,在构造函数中获得资源并在析构函数中释放资源以下调用: ...
javascript curry 柯里化函数仿lodash的curry
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
三重Des对称加密在Android、Ios 和Java 平台的实现
引言如今手机app五彩缤纷,确保手机用户的数据安全是开发人员必须掌握的技巧,下面通过实例介绍DES在android.ios.java平台的使用方法: DES加密是目前最常用的对称加密方式, ...
73条日常Linux shell命令汇总
1.检查远程端口是否对bash开放: echo >/dev/tcp/8.8.8.8/53 && echo "open" 2.让进程转入后台: Ctrl + z ...
laravel中上传图片之后图片的处理
$file=Input::file('file'); if ($file->isValid()){ $entension=$file->getClientOriginalExtension ...
C++进阶2. typedef用法
C++ 中的typedef用法 20131011 Typedef在C++中是一个关键字,他的用法有多重,但是自己又说不全面,所以整理一下: 1.用类型的别名 typedef char* PChar; ...
Prism 4 文档 ---第4章模块化应用程序开发
模块化应用程序是指将一个应用程序拆分成一系列的可以组合的功能单元.一个客户端模块封装了应用程序的一部分,并且通常是一系列相关的关注点.它可以包含一个相关的组件的集合,就像用户界面,应用程序功能,和一些 ...
sql 日志统计-日、周、月活跃数
近日网站需求:统计日志表的日.周.月活跃数.最终研究了出来了,分享给大家看下. 如果有更好的sql语句也可以评论下方. --日活跃量 ), cr.AddTime, )as addtimt,COUN ...
C++设计模式之-外观模式
意图: 为子系统中的一组接口提供一个一致的界面,此模式定义了一个高层接口,这个接口使得这一系统更加容易使用. 适用性: 1.在设计初期阶段,应该要有意识的将不同的两个层分离,比如经典的三层架构,就需要 ...

什么是YARN

什么是YARN的更多相关文章

随机推荐

热门专题