Capacity 调度器配置

<property>
<name>yarn.resourcemanager.scheduler.class<name>
<value>org.apache.hadoop.yarn.server.resourcemanager.scheduler.capacity.CapacityScheduler</value>
</property>

加载配置文件

$yarn rmadmin -refreshQueues

Root --- QueueA --- A1,  A2
          |-- QueueB --- B1,  B2
          |-- QueueC --- C1,  C2

队列

<property>
<name>yarn.scheduler.capacity.root.queues<name>
<value>QueueA, QueueB, QueueC</value>
</property> <property>
<name>yarn.scheduler.capacity.QueueA.queues<name>
<value>A1, A2</value>
</property>

队列访问权限控制

<property>
<name>yarn.scheduler.capacity.root.QueueA.acl_submit_applications<name>
<value>u1, u2 g1</value>
<description>限定哪些Linux用户/用户组可向给定队列中提交应用程序</description>
</property> <property>
<name>yarn.scheduler.capacity.root.QueueA.acl_administer_queue<name>
<value>g1</value>
<description>为队列指定一个管理员,该管理员可控制该队列的所有应用程序,比如杀死任意一个应用程序等</description>
</property>

层级队列Capacity管理

<property>
<name>yarn.scheduler.capacity.root.QueueA.capacity<name>
<value>60</value>
</property> <property>
<name>yarn.scheduler.capacity.root.QueueB.capacity<name>
<value>10</value>
</property> <property>
<name>yarn.scheduler.capacity.root.QueueC.capacity<name>
<value>30</value>
</property> <property>
<name>yarn.scheduler.capacity.root.QueueA.A1.capacity<name>
<value>20</value>
</property> <property>
<name>yarn.scheduler.capacity.root.QueueA.A2.capacity<name>
<value>80</value>
</property>

队列A1不能超过父队列queueA的40%的资源。

<property>
<name>yarn.scheduler.capacity.root.QueueA.A1.maximum-capacity<name>
<value>40</value>
</property>

队列的状态

<property>
<name>yarn.scheduler.capacity.root.QueueB.state<name>
<value>RUNNING</value>
</property>

应用程序限制

<property>
<name>yarn.scheduler.capacity.maximum-applications<name>
<value>10000</value>
<description>集群同时运行的最大作业数</description>
</property> <property>
<name>yarn.scheduler.capacity.root.QueueA.maximum-applications<name>
<value>10000</value>
<description>队列root.QueueA同时运行的最大作业数</description>
</property>
<property>
<name>yarn.scheduler.capacity.maximum-am-resource-percent<name>
<value>0.1</value>
<description>AM所占资源最大比例,用来控制同时运行的作业数</description>
</property> <property>
<name>yarn.scheduler.capacity.root.QueueA.maximum-am-resource-percent<name>
<value>0.1</value>
<description>AM所占资源最大比例,用来控制队列root.QueueA同时运行的作业数</description>
</property>

Hadoop Yarn Capacity Scheduler的更多相关文章

  1. <Yarn> <Capacity Scheduler> <Source Code>

    Yarn capacity scheduler 首先要知道, [Attention: RM有两个组件,其中Scheduler完全就只是负责资源的分配:ApplicationsManager则负责接受a ...

  2. 利用yarn capacity scheduler在EMR集群上实现大集群的多租户的集群资源隔离和quota限制

    转自:https://m.aliyun.com/yunqi/articles/79700 背景 使用过hadoop的人基本都会考虑集群里面资源的调度和优先级的问题,假设你现在所在的公司有一个大hado ...

  3. YARN资源调度策略之Capacity Scheduler

    背景 yarn默认使用的是最简单的FIFO调度器,即一个default队列,所有用户共享,分配资源也是先到先得,没有优先级之分.有时一两个任务就把资源全占了,其他任务吃不到资源造成饥饿,显然这样的资源 ...

  4. Hadoop YARN 调度器(scheduler) —— 资源调度策略

    本文通过MetaWeblog自动发布,原文及更新链接:https://extendswind.top/posts/technical/hadoop_yarn_resource_scheduler 搜了 ...

  5. Hadoop Capacity Scheduler源码实现剖析

    作者: 大圆那些事 | 文章可以转载,请以超链接形式标明文章原始出处和作者信息 网址: http://www.cnblogs.com/panfeng412/archive/2013/09/13/had ...

  6. YARN的Fair Scheduler和Capacity Scheduler

    关于Scheduler YARN有四种调度机制:Fair Schedule,Capacity Schedule,FIFO以及Priority: 其中Fair Scheduler是资源池机制,进入到里面 ...

  7. Hadoop的三种调度器FIFO、Capacity Scheduler、Fair Scheduler(转载)

    目前Hadoop有三种比较流行的资源调度器:FIFO .Capacity Scheduler.Fair Scheduler.目前Hadoop2.7默认使用的是Capacity Scheduler容量调 ...

  8. 大数据之Yarn——Capacity调度器概念以及配置

    试想一下,你现在所在的公司有一个hadoop的集群.但是A项目组经常做一些定时的BI报表,B项目组则经常使用一些软件做一些临时需求.那么他们肯定会遇到同时提交任务的场景,这个时候到底如何分配资源满足这 ...

  9. Hadoop YARN 100-1知识点

    0 YARN中实体 资源管理者(resource manager, RM) 长时间运行的守护进程,负责管理集群上资源的使用 节点管理者(node manager, NM) 长时间运行的守护进程,在集群 ...

随机推荐

  1. [转]50个很棒的Python模块

    转自:http://www.cnblogs.com/foxhengxing/archive/2011/07/29/2120897.html Python具有强大的扩展能力,以下列出了50个很棒的Pyt ...

  2. C++ static 用法

    一般情况下,如果有N个同类的对象,那么每一个对象都分别有自己的成员变量,不同对象的成员变量各自有值,互不相干.但是有时我们希望有某一个或几个成员变量为所有对象共有,这样可以实现数据共享. 可以使用全局 ...

  3. Kubernetes Helm

    Helm is a tool for managing Kubernetes charts. Charts are packages of pre-configured Kubernetes reso ...

  4. "Could not find the main class: org.apache.catalina.startup.Boostrap. Program will exit."

    尝试将 myeclipse中的编译版本修改(如,将1.5修改为1.6)

  5. FPGA中的平方根

    作为纯数字电路的FPGA,实现平方根是比较麻烦的.毕竟硬件不支持这种算法. 好在厂家的IP核中有相关的平方根IP库,所以用起来也很方便. 上图是在QUARTUS下调用库中的IP核,综合适配后的资源使用 ...

  6. FPGA设计中的float

    在通常的设计中,不建议使用浮点数计算,因为浮点数计算会消耗FPGA大量的逻辑单元.但很多情况下,又需要使用浮点数进行计算提高精度. 所以需要有合适的方法计算浮点运算. 正常情况下FPGA只能以整形数据 ...

  7. (转)用javamail发送带附件的邮件

    本文转载自:http://redleaf.iteye.com/blog/78217 mail.java 代码 package mail; import java.util.* ; import jav ...

  8. VoIP常见编码的带宽计算

    voip带宽计算VOIP计算方法与所选用的编码方法有关,而与哪个厂家的没有什么关系,公式如下: 带宽=包长度×每秒包数=包长度×(1/打包周期)=(Ethernet头+IP头+UDP头+RTP头+有效 ...

  9. 杂项:HTML5-2/3-新元素

    ylbtech-杂项:HTML5-2/3-新元素 自1999年以后HTML 4.01 已经改变了很多,今天,在HTML 4.01中的几个已经被废弃,这些元素在HTML5中已经被删除或重新定义. 为了更 ...

  10. 《Hadoop技术内幕》读书笔记——Task运行过程分析

    本文是董西成的Hadoop技术内幕一书的读书章节总结. 第八章 Task运行过程分析 所有Task需要周期性地向TaskTracker汇报最新进度和计数器值,而这正是由Reporter组件实现的,其中 ...