Hadoop Yarn Capacity Scheduler
Capacity 调度器配置
<property>
<name>yarn.resourcemanager.scheduler.class<name>
<value>org.apache.hadoop.yarn.server.resourcemanager.scheduler.capacity.CapacityScheduler</value>
</property>
加载配置文件
$yarn rmadmin -refreshQueues
Root --- QueueA --- A1, A2
|-- QueueB --- B1, B2
|-- QueueC --- C1, C2
队列
<property>
<name>yarn.scheduler.capacity.root.queues<name>
<value>QueueA, QueueB, QueueC</value>
</property> <property>
<name>yarn.scheduler.capacity.QueueA.queues<name>
<value>A1, A2</value>
</property>
队列访问权限控制
<property>
<name>yarn.scheduler.capacity.root.QueueA.acl_submit_applications<name>
<value>u1, u2 g1</value>
<description>限定哪些Linux用户/用户组可向给定队列中提交应用程序</description>
</property> <property>
<name>yarn.scheduler.capacity.root.QueueA.acl_administer_queue<name>
<value>g1</value>
<description>为队列指定一个管理员,该管理员可控制该队列的所有应用程序,比如杀死任意一个应用程序等</description>
</property>
层级队列Capacity管理
<property>
<name>yarn.scheduler.capacity.root.QueueA.capacity<name>
<value>60</value>
</property> <property>
<name>yarn.scheduler.capacity.root.QueueB.capacity<name>
<value>10</value>
</property> <property>
<name>yarn.scheduler.capacity.root.QueueC.capacity<name>
<value>30</value>
</property> <property>
<name>yarn.scheduler.capacity.root.QueueA.A1.capacity<name>
<value>20</value>
</property> <property>
<name>yarn.scheduler.capacity.root.QueueA.A2.capacity<name>
<value>80</value>
</property>
队列A1不能超过父队列queueA的40%的资源。
<property>
<name>yarn.scheduler.capacity.root.QueueA.A1.maximum-capacity<name>
<value>40</value>
</property>
队列的状态
<property>
<name>yarn.scheduler.capacity.root.QueueB.state<name>
<value>RUNNING</value>
</property>
应用程序限制
<property>
<name>yarn.scheduler.capacity.maximum-applications<name>
<value>10000</value>
<description>集群同时运行的最大作业数</description>
</property> <property>
<name>yarn.scheduler.capacity.root.QueueA.maximum-applications<name>
<value>10000</value>
<description>队列root.QueueA同时运行的最大作业数</description>
</property>
<property>
<name>yarn.scheduler.capacity.maximum-am-resource-percent<name>
<value>0.1</value>
<description>AM所占资源最大比例,用来控制同时运行的作业数</description>
</property> <property>
<name>yarn.scheduler.capacity.root.QueueA.maximum-am-resource-percent<name>
<value>0.1</value>
<description>AM所占资源最大比例,用来控制队列root.QueueA同时运行的作业数</description>
</property>
Hadoop Yarn Capacity Scheduler的更多相关文章
- <Yarn> <Capacity Scheduler> <Source Code>
Yarn capacity scheduler 首先要知道, [Attention: RM有两个组件,其中Scheduler完全就只是负责资源的分配:ApplicationsManager则负责接受a ...
- 利用yarn capacity scheduler在EMR集群上实现大集群的多租户的集群资源隔离和quota限制
转自:https://m.aliyun.com/yunqi/articles/79700 背景 使用过hadoop的人基本都会考虑集群里面资源的调度和优先级的问题,假设你现在所在的公司有一个大hado ...
- YARN资源调度策略之Capacity Scheduler
背景 yarn默认使用的是最简单的FIFO调度器,即一个default队列,所有用户共享,分配资源也是先到先得,没有优先级之分.有时一两个任务就把资源全占了,其他任务吃不到资源造成饥饿,显然这样的资源 ...
- Hadoop YARN 调度器(scheduler) —— 资源调度策略
本文通过MetaWeblog自动发布,原文及更新链接:https://extendswind.top/posts/technical/hadoop_yarn_resource_scheduler 搜了 ...
- Hadoop Capacity Scheduler源码实现剖析
作者: 大圆那些事 | 文章可以转载,请以超链接形式标明文章原始出处和作者信息 网址: http://www.cnblogs.com/panfeng412/archive/2013/09/13/had ...
- YARN的Fair Scheduler和Capacity Scheduler
关于Scheduler YARN有四种调度机制:Fair Schedule,Capacity Schedule,FIFO以及Priority: 其中Fair Scheduler是资源池机制,进入到里面 ...
- Hadoop的三种调度器FIFO、Capacity Scheduler、Fair Scheduler(转载)
目前Hadoop有三种比较流行的资源调度器:FIFO .Capacity Scheduler.Fair Scheduler.目前Hadoop2.7默认使用的是Capacity Scheduler容量调 ...
- 大数据之Yarn——Capacity调度器概念以及配置
试想一下,你现在所在的公司有一个hadoop的集群.但是A项目组经常做一些定时的BI报表,B项目组则经常使用一些软件做一些临时需求.那么他们肯定会遇到同时提交任务的场景,这个时候到底如何分配资源满足这 ...
- Hadoop YARN 100-1知识点
0 YARN中实体 资源管理者(resource manager, RM) 长时间运行的守护进程,负责管理集群上资源的使用 节点管理者(node manager, NM) 长时间运行的守护进程,在集群 ...
随机推荐
- idea 创建Java WEB 项目
第一步 FILE - New Project 写上名字,然后 点 Finish 这里特别注意,不懂路径 那么 就点上 inherit 再点下面 让他默认 加载你的 web 路径 选择 Jar包 , ...
- php array_push 与 $arr[]=$value 性能比较
1.array_push方法 array_push 方法,将一个或多个元素压入数组的末尾. int array_push ( array &$array , mixed $var [, mix ...
- js核心知识
枚举属性: var o = {x:1} console.log("x" in o);//true console.log("toString" in o);// ...
- Linux 解压 压缩 tar
tar 格式:tar [选项] 目录或文件 // 将 test 文件夹打包成 test.tar $ tar cvf test.tar test // 将 home 目录下的 test 文件夹打 ...
- linux命令ls -l的total是怎么计算出来的?
自己手写实现ls -l命令纠结了很久的地方,刚才总算搞明白了.直接上代码重要部分 long nTotalBlocks = 0; DIR* dp = opendir(dirPathName); stru ...
- 算法训练 安慰奶牛(节点有权值的MST)
问题描述 Farmer John变得非常懒,他不想再继续维护供奶牛之间供通行的道路.道路被用来连接N个牧场,牧场被连续地编号为1到N.每一个牧场都是一个奶牛的家.FJ计划除去P条道路中尽可能多的道路, ...
- Git出现提交错误--Push to origin/master was rejected(转)
Step1:出现的问题? 在使用Git Push代码的时候,会出现Push to origin/master was rejected 的错误提示.在第一次提交到代码仓库的时候非常容易出现,因为初始化 ...
- 【转】Jmeter使用之常用函数介绍
"_csvRead"函数 csvRead函数是从外部读取参数,csvRead函数可以从一个文件中读取多个参数. 下面具体讲一下如何使用csvread函数: 1.新建一个csv或者t ...
- java代码-------Runnable的用法
总结:主要是实现Runnable接口就必须重写run()方法,然后需要创建Thread类的对象,再调用start()方法 package com.s.x; public class testRunna ...
- 第五章 MyEclipse配置hadoop开发环境
1.首先要下载相应的hadoop版本的插件,我这里就给2个例子: hadoop-1.2.1插件:http://download.csdn.net/download/hanyongan300/62381 ...