Resource Allocation of Yarn

关键词：yarn 资源分配 mapreduce spark

简要指南

适合不想看太多原理细节直接上手用的人。

基本原则：

container分配的内存不等于机器实际用掉的内存。NM给container分配的内存是预留这么多内存，但实际用多少取决于你的-Xmx加上你的堆外内存。大部分堆外内存使用不多的情况下，实际主要就是JVM堆内存。
container内存是按yarn.scheduler.minimum-allocation-mb的整数倍分配的，用户设置的内存不足整数倍会向上取整，并且不会超过 yarn.scheduler.maximum-allocation-mb 。
还有一个增量概念 yarn.scheduler.increment-allocation-mb （默认1024m），即如果yarn.scheduler.minimum-allocation-mb设置较大，假设4g，那客户端申请了4.5G内存，按道理最终container内存是要变成 4+4=8g 的，但有增量内存1024m配置的话，分配内存时会尝试 4+1=5g 是否能满足，从而避免内存资源浪费。
所有上线的任务都要手动设置资源配置，尤其是内存。

MapReduce：

mapreduce.map.memory.mb表示给map的container申请的最大内存，即container内存；mapreduce.map.java.opts则是设置jvm启动的实际参数，其中堆内存-Xmx也是在这里设置，不能超过mapreduce.map.memory.mb，一般设置为0.75倍的mapreduce.map.memory.mb（只是建议，不一定），留给堆外内存一点空间。reduce同理。

Spark 1.x：

关于Spark On YARN相关的配置参数，请参考Spark配置参数。一般主要关注以下几个参数：

spark.driver.memory：默认值512m
spark.executor.memory：默认值512m
spark.yarn.am.memory：默认值512m
spark.yarn.executor.memoryOverhead：值为executorMemory * 0.07, with minimum of 384
spark.yarn.driver.memoryOverhead：值为driverMemory * 0.07, with minimum of 384
spark.yarn.am.memoryOverhead：值为AM memory * 0.07, with minimum of 384

--executor-memory/spark.executor.memory 控制 executor 的堆的大小，但是 JVM 本身也会占用一定的堆空间，比如内部的 String 或者直接 byte buffer，spark.yarn.XXX.memoryOverhead 属性决定向 YARN 请求的每个 executor 或dirver或am 的额外堆内存大小，默认值为 max(384, 0.07 * spark.executor.memory)。所以实际计算container内存的时候是 memory + memoryOverhead。
在 executor 执行的时候配置过大的 memory 经常会导致过长的GC延时，内存并不是越大越好。

spark core分配：

默认的yarn.scheduler.capacity.resource-calculator=org.apache.hadoop.yarn.util.resource.DefaultResourseCalculator , 这种时候的vcore会按container个数分配，而不是实际的spark core数。即设置了5个executor，每个executor2个core，实际除去ApplicationMaster和spark driver，最后只有5个vcore。
改成org.apache.hadoop.yarn.util.resource.DominantResourceCalculator，上述案例则会变成10个vcore。暂未测试和看代码确定是否能客户端配置生效，一般服务端配置，在ambari里或部分语境下，有时也叫CPU-schedule的ResourceCalculator，相比default版的只考虑memory，dominant的同时考虑了memory和cpu。

Reference（值得一读）：

Resource Allocation of Yarn的更多相关文章

Spark动态资源分配-Dynamic Resource Allocation
微信搜索lxw1234bigdata | 邀请体验:数阅–数据管理.OLAP分析与可视化平台 | 赞助作者:赞助作者 Spark动态资源分配-Dynamic Resource Allocation S ...
Hadoop Aggregate Resource Allocation解释
1.在hadoop里面运行程序的时候,查看某个任务的具体信息如下: [hadoop@master monitor]$ yarn application -list 如上图,这里面的Aggregate ...
hdu 3288 Resource Allocation
题目连接 http://acm.hdu.edu.cn/showproblem.php?pid=3288 Resource Allocation Description HDU-Sailormoon i ...
【转】Resource Localization in YARN
一个Applciation运行在YARN上的流程为,从YARN Client向ResourceManager提交任务,将Applciation所需资源提交到HDFS中,然后ResourceManage ...
Service Function Chaining Resource Allocation: A Survey
摘要: 服务功能链(SFC)是未来Internet的一项关键技术. 它旨在克服当前部署模型的僵化和静态限制. 该技术的应用依赖于可以将SFC最佳映射到衬底网络的算法. 这类算法称为"服务功能 ...
Solving Large-Scale Granular Resource Allocation Problems Efficiently with POP（2021-POP-SOSP-文献阅读笔记）
读者这篇文章来自2021的SOSP,单位是斯坦福大学和微软.选该文章的理由有二,一是资源分配的主题较为相关:二是文章结构.语言很清晰,读起来很舒服. 本文的中心思想可以概括为:分化瓦解,各个击破.即 ...
YARN - Yet Another Resource Negotiator
http://www.socc2013.org/home/program http://www.ibm.com/developerworks/cn/opensource/os-cn-hadoop-ya ...
PatentTips - Systems, methods, and devices for dynamic resource monitoring and allocation in a cluster system
BACKGROUND 1. Field The embodiments of the disclosure generally relate to computer clusters, and m ...
Docker on YARN在Hulu的实现
这篇文章是我来Hulu这一年做的主要工作,结合当下流行的两个开源方案Docker和YARN,提供了一套灵活的编程模型,目前支持DAG编程模型,将会支持长服务编程模型. 基于Voidbox,开发者可以很 ...

随机推荐

Kubenetes 资源清单定义入门
Kubernetes 常用资源资源对象工作负载型资源对象(workload): Pod Replicaset ReplicationController Deployments Stat ...
Hbase G1 gc 调优最终参数
export HBASE_HEAPSIZE=16384export HBASE_OFFHEAPSIZE=25gexport HBASE_MASTER_OPTS="$HBASE_MASTER_ ...
javax.websocket.DeploymentException: Multiple Endpoints may not be deployed to the same path [/websocket/{sid}] : existing endpoint was class com.sanyi.qibaobusiness.framework.webSocket.WebSocketServe
报错: javax.websocket.DeploymentException: Multiple Endpoints may not be deployed to the same path [/w ...
第十节: EF的三种追踪实体状态变化方式(DBEntityEntry、ChangeTracker、Local)
一. 简介我们在前面章节介绍EF基本增删改的时候,曾说过EF的SaveChanges()方法,会一次性的将所有的实体的状态变化统一提交到数据库,那么你是否想过EF的实体会有哪些状态变化呢?什么原因会 ...
Regularity criteria for NSE 6: $u_3,\p_3u_1,\p_3u_2$
In [Zujin Zhang, Jinlu Li, Zheng-an Yao, A remark on the global regularity criterion for the 3D Navi ...
Dijkstra算法的C++实现
Dijkstra算法是在图中寻找两顶点最短路径的算法. 下面以下图有向图为例,说明其基本思想. 上图为转化为邻接矩阵存储: 现在我要寻找1点到其他点的最短距离以及路径: a)1点到各点的距 ...
sqlserver 获取所有表的字段类型等信息
USE [MultipleAnalysisDataFY] GO /****** Object: View [dbo].[selectfieldtype] Script Date: 2018/11/7 ...
MySql流程控制结构
序号结构名称说明 1 顺序结构程序从上往下依次执行 2 分支结构程序从两条或多条路径中选择一条去执行 3 循环结构程序在满足一定条件的基础上,重复执行一段代码 ⒈顺序结构你啥都不干默认就是 ...
mac上安装webpack报错解决方法Hit error EACCES: permission denied, mkdir '/usr/local/lib/node_modules/webpack
node-pre-gyp WARN Using needle for node-pre-gyp https download node-pre-gyp WARN Pre-built binaries ...
Redis 如何实现持久化
1.RDB 持久化,将 Redis 在内存中的的状态保存到硬盘中,相当于备份数据库状态. 2.AOF 持久化(Append-Only-File),AOF 持久化是通过保存 Redis 服务器锁执行的写 ...

Resource Allocation of Yarn

Resource Allocation of Yarn的更多相关文章

随机推荐

热门专题