以下说明均以集群中 slave 结点的配置为 48G内存,12块硬盘,12核(core) CPU 为例. 在 Yarn 中,一个 Container 是一个基础的包含内存和CPU 的单元.为了较好的平衡利用集群的资源,通常建议每块磁盘和每个core 分配1~2 个 container.所以在上面的配置下,每个结点允许最大配置 20 个 container. 我们给 yarn 分配 40G内存,另外 8G留给操作系统.40G分配给 20 个 container,所以每个 container 分配到…