0 YARN中实体

资源管理者(resource manager, RM)
长时间运行的守护进程，负责管理集群上资源的使用
节点管理者(node manager, NM)
长时间运行的守护进程，在集群的所有节点上运行，负责监视容器
容器(container)
在受限的资源集合(内存、CPU等)下执行应用相关的进程

1 YARN应用

1.1 运行

(1) 客户端联系RM，请求运行应用master(application master, AM)进程。

(2) RM定位可用NM，并在NM上启动容器并在容器中加载AM。

AM启动后执行的事项依赖于应用，可以是在容器中执行计算并直接将结果返回给客户端，或者

(3) 向RM请求更多的容器。

(4) 组织、安排、启动容器，执行分布式计算。

1.2 资源请求

申请一些容器的资源请求可以制定每个容器上所需的计算资源，包括内存、CPU等，同时也可以指定容器所需满足的局部性约束。

局部性是保证在执行分布式数据处理算法时带宽高效利用的关键。

YARN应用任意时刻均可以执行资源请求。Spark采用预先申请固定数量的资源方式，而MapReduce在map阶段预先申请固定数量的资源，在reduce阶段即时申请资源。

1.3 应用生命周期

YARN应用可以是短时的(几秒钟)，也可以是长时间运行的(几天甚至几个月)。

将用户运行的作业(job)映射为应用的方式：

(1) 为每个用户作业运行一个应用，MapReduce采用的方式；

(2) 为每个工作流或用户会话作业运行一个应用，Spark采用这种方式；

(3) 运行单个长时间运行的应用，被不同的用户作业共享，Apache Slider、Impala采用这种方式。

1.4 构建YARN应用

YARN项目中distributed shell应用可以作为如何编写YARN应用的示例。

一些项目可用于简化YARN应用的开发，如Apache Slider、Apache Twill等。

2 YARN中的调度

2.1 可用调度选项

YARN中有三类调度器可用：FIFO、Capacity和Fair。

运行一个长时间作业和一个段时间作业时各调度器的集群利用率比较图：

FIFO

FIFO调度器将应用存放在队列中，按应用提交的顺序执行应用。

队列头的应用申请的资源被首先分配，待其执行完毕后，下一个应用申请的资源被分配。

Capacity

Capacity调度器开辟出为小作业使用的专用队列。

Fair

Fair调度器在所有运行作业之间动态平衡资源分配。

2.2 Capacity调度器

Capacity调度器调度器允许在组织结构内共享Hadoop集群资源，每个组织部门占用整个集群资源的固定一部分。

Capacity调度器支持队列弹性(queue elasticity)，运行作业申请的资源查过预先指定的队列容量、且其他队列中有闲置的容量，可以申请成功；Capacity调度器不支持抢占(preempt)，在占有当前队列容量的容器结束后返回资源后这部分容量才可用。

Capacity调度器使用的配置文件为capacity-scheduler.xml。Capacity调度器完整的说明和配置项见Hadoop: Capacity Scheduler.

为应用选择队列依赖与应用。在MapReduce中，可以设置属性mapreduce.job.queuename指定为期望使用的队列名称，该属性未配置时，使用默认队列default。

一个配置示例

队列层次：

root
    ├── dev
    │   ├── eng
    │   └── science
    └── prod

capacity-scheduler.xml：

<configuration>

    <!-- 指定子队列 -->
    <property>
        <name>yarn.scheduler.capacity.root.queues</name>
        <value>prod,dev</value>
    </property>

    <!-- 指定子队列dev的子队列 -->
    <property>
        <name>yarn.scheduler.capacity.root.dev.queues</name>
        <value>eng,science</value>
    </property>

    <!-- 指定子队列prod的容量 -->
    <property>
        <name>yarn.scheduler.capacity.root.prod.capacity</name>
        <value>40</value>
    </property>

    <!-- 指定子队列dev的容量 -->
    <property>
        <name>yarn.scheduler.capacity.root.dev.capacity</name>
        <value>10000</value>
    </property>

    <!-- 指定子队列dev的最大容量 -->
    <property>
        <name>yarn.scheduler.capacity.root.dev.maximum-capacity</name>
        <value>75</value>
    </property>

    <!-- 指定子队列dev.eng的容量 -->
    <property>
        <name>yarn.scheduler.capacity.root.dev.eng.capacity</name>
        <value>50</value>
    </property>

    <!-- 指定子队列dev.science的容量 -->
    <property>
        <name>yarn.scheduler.capacity.root.dev.science.capacity</name>
        <value>50</value>
    </property>

</configuration>

2.3 Fair调度器

Fair调度器在所有运行应用之间动态平衡资源分配。

激活Fair调度器的方式是在yarn-site.xml中定义：

<property>
    <name>yarn.resourcemanager.scheduler.class</name>
    <value>org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.FairScheduler</value>
</property>

Fair调度器的配置文件为分配文件fair-scheduler.xml，该文件的名称可以使用yarn.scheduler.fair.allocation.file属性配置修改。

一个配置示例

Fair调度器完整的说明和配置项见Hadoop: Fair Scheduler。

队列层次与上一节中队列层次相同，

fair-scheduler.xml：

<allocations>

    <!-- 指定默认的队列调度策略 -->
    <defaultQueueSchedulingPolicy>fair</defaultQueueSchedulingPolicy>

    <!-- 子队列prod -->
    <queue name="prod">
        <weight>40</weight><!-- 队列权重 -->
        <schedulingPolicy>fifo</schedulingPolicy><!-- 队列中调度策略 -->
    </queue>

    <!-- 子队列dev -->
    <queue name="dev">
        <weight>60</weight>

        <!-- 指定子队列eng和science -->
        <queue name="eng" />
        <queue name="science" />
    </queue>

    <!-- 应用放置到各队列的策略 -->
    <queuePlacementPolicy>
        <rule name="specified" create="false"/><!-- 应用中指定了队列 -->
        <rule name="primaryGroup" create="false" /><!-- 与用户所属UNIX组名称相同的队列 -->
        <rule name="default" queue="dev.eng"/><!-- 默认行为 -->
    </queuePlacementPolicy>

</allocations>

Fair调度器也可以指定队列层次，每个队列可以采用不同的调度策略。

Fair调度器使用一个基于规则的系统，以确定如何将应用放置在队列中。

Fair调度器支持抢占(preemption)。抢占允许调度器直接杀死使用了超出其公平共享资源的队列中的容器，以保证其他队列能够获取公平共享的资源。

Hadoop YARN 100-1知识点的更多相关文章

Hadoop Yarn内存资源隔离实现原理——基于线程监控的内存隔离方案
注:本文以hadoop-2.5.0-cdh5.3.2为例进行说明. Hadoop Yarn的资源隔离是指为运行着不同任务的“Container”提供可独立使用的计算资源,以避免它们之间相互干扰.目 ...
二十六、Hadoop学习笔记————Hadoop Yarn的简介复习
1. 介绍 YARN(Yet Another Resource Negotiator)是一个通用的资源管理平台,可为各类计算框架提供资源的管理和调度. 之前有提到过,Yarn主要是为了减轻Hadoop ...
hadoop+yarn+hbase+storm+kafka+spark+zookeeper)高可用集群详细配置
配置 hadoop+yarn+hbase+storm+kafka+spark+zookeeper 高可用集群,同时安装相关组建:JDK,MySQL,Hive,Flume 文章目录环境介绍节点介绍 ...
Hadoop YARN：调度性能优化实践(转)
https://tech.meituan.com/2019/08/01/hadoop-yarn-scheduling-performance-optimization-practice.html 文章 ...
Hadoop Yarn REST API未授权漏洞利用
Hadoop Yarn REST API未授权漏洞利用 Hadoop是一个由Apache基金会所开发的分布式系统基础架构,YARN是hadoop系统上的资源统一管理平台,其主要作用是实现集群资源的统一 ...
hadoop yarn running beyond physical memory used
老是报物理内存越界,kill container,然后把yarn.scheduler.minimum-allocation-mb设成2048就好了跟这个yarn.nodemanager.pmem-c ...
Hadoop YARN配置参数剖析—RM与NM相关参数
注意,配置这些参数前,应充分理解这几个参数的含义,以防止误配给集群带来的隐患.另外,这些参数均需要在yarn-site.xml中配置. 1. ResourceManager相关配置参数 (1) ...
hadoop错误org.apache.hadoop.yarn.exceptions.YarnException Unauthorized request to start container
错误: 14/04/29 02:45:07 INFO mapreduce.Job: Job job_1398704073313_0021 failed with state FAILED due to ...
hadoop Yarn 编程API
客户端编程库: 所在jar包: org.apache.hadoop.yarn.client.YarnClient 使用方法: 1 定义一个YarnClient实例: private YarnClien ...

随机推荐

typeof(self) 的作用
block对于其变量都会形成strong reference,对于self也会形成strong reference ,而如果self本身对block也是 strong reference 的话,就会形 ...
HDU2459 后缀数组+RMQ
题目大意: 在原串中找到一个拥有连续相同子串最多的那个子串比如dababababc中的abababab有4个连续的ab,是最多的如果有同样多的输出字典序最小的那个这里用后缀数组解决问题: 枚举连 ...
alert弹层无法取消问题解决办法
最近做H5移动端开发的时候,js代码写了个alert,在Android手机上能正常运行,但是在IOS上运行弹出之后却无法取消掉, 而且页面卡死,点不了任何东西,这种情况是非常不好的,用户体验非常糟糕. ...
使用Volley执行网络数据传输
首先需要实例化一个RequestQueue RequestQueue queue = Volley.newRequestQueue(this); 然后是根据提供的URL请求字符串响应 String u ...
VMware下利用ubuntu13.04建立嵌入式开发环境之三
系统环境建立完成后就要安装和配置嵌入式开始需要的工具和服务. 一般我们在交叉编译是需要的服务有:smb.tftp.telnet.nfs.ssh和x11等.下面一步步,介绍如何安装这些服务. 一.smb ...
内核input子系统分析
打开/driver/input/input.c 这就是input代码的核心找到 static int __init input_init(void) { err = class_register(& ...
2D几何变换
2D点:非齐次坐标x(x,y) (x表示向量矢量) 齐次坐标:x~=(x~,y~,w~)=w~(x,y,1)=w~x~ 增广矢量:x—=(x,y,1) w~=0时,齐次点称作理想点或无 ...
css渐变色DIV
<!DOCTYPE html> <html lang="en" xmlns="http://www.w3.org/1999/xhtml"> ...
Win7 下IIS（7.5）发布 ASP.NET MVC
操作系统 Win 7 旗舰版开发工具 VS2015 使用技术 IIS7.5 + MVC4.0 一 . 在IIS上部署程序后出现错误-当前标识(NT AUTHORITY/NETWORK SERVICE ...
Python开发入门与实战16-APACHE部署
16. Windows平台apache部署本章节我们简要的描述一下如何在windows平台部署apache的django站点. Python Django 项目部署发布到windows apache ...

Hadoop YARN 100-1知识点

0 YARN中实体

1 YARN应用

1.1 运行

1.2 资源请求

1.3 应用生命周期

1.4 构建YARN应用

2 YARN中的调度

2.1 可用调度选项

FIFO

Capacity

Fair

2.2 Capacity调度器

一个配置示例

2.3 Fair调度器

一个配置示例

Hadoop YARN 100-1知识点的更多相关文章

随机推荐

热门专题