写在前面

一、大数据全栈

头两节讲完HDFS & MapReduce，这一部分聊一聊它们之间的“人物关系”。

其中也讨论下k8s的学习必要性。

Ref: [Distributed ML] Yi WANG's talk

二、知识点

容器技术与Kubernetes

Goto: 3 万容器，知乎基于Kubernetes容器平台实践

Goto: 如何学习、了解kubernetes？

Goto: 选K8S是对的，但是用不好就是你的不对了

Yarn资源管理

一、重要概念

ResouceManager
ApplicationMaster
NodeManager
Container
JobHistoryServer
Timeline Server

JobHistoryServer

所有node启动如下命令，能记录mapreduce应用程序的记录。（对作业信息进行记录）

mr-jobhistory-daemon.sh start historyserver

Timeline Server

写与第三方结合的日志服务数据（比如spark等），是更细粒度的信息记录。。

任务在哪个队列中运行；

运行任务时设置的用户是哪个用户；

二、启动流程

Ref: 实战案例玩转Hadoop系列11--运行Map Reduce程序

在真实的生产环境中，MAP REDUCE程序应该提交到Yarn集群上分布式运行，这样才能发挥出MAP REDUCE分布式并行计算的效果。

MAP REDUCE程序提交给Yarn执行的过程如下：

1、客户端代码中设置好MAP REDUCE程序运行时所要使用的Mapper类、Reducer类、程序Jar包所在路径、Job名称、Job输入数据的切片信息、Configuration所配置的参数等资源，统一提交给Yarn所指定的位于HDFS上的Job资源提交路径；

2、客户端向Yarn中的Resource Manager请求运行Jar包中MRAppMaster进程的资源容器Container；

分配application id、输出是否存在、输入 --> split（一个分片对应一个map task）

3、Yarn将提供Container的任务指派给某个拥有空闲资源的 Node Manager节点，Node Manager接受任务后创建资源容器（即所谓的Container）；

容器所需分配的“资源描述信息” ---> 某个空闲的Node Manager节点 ---> 启动一个contrainer

4、客户端向创建好容器的Node Manager发送启动MRAppMaster进程的shell脚本命令，启动MRAppMaster；

5、MRAppMaster启动后，读取 job相关配置及程序资源，向Resource Manager请求N个资源容器来启动若干个Map Task进程和若干个Reduce Task进程，并监控这些Map Task进程和Reduce Task进程的运行状态；

6、当整个Job的所有Map Task进程和Reduce Task进程任务处理完成后，整个Job的所有进程全部注销，Yarn则销毁Container，回收运算资源。

三、Yarn调度器

FIFO Scheduler

Capacity Scheduler

Fair Scheduler

新建一个capacity-scheduler.xml，也要同步拷贝到其他node中。

<configuration>

　　<property>

　　　　<name>yarn.scheduler.capacity.root.queues</name>

　　　　<value>prod,dev</value>

　　</property>

　　<property>

　　　　<name>yarn.scheduler.capacity.root.dev.queues</name>

　　　　<value>hdp,spark</value>

　　</property>

　　<property>

　　　　<name>yarn.scheduler.capacity.root.prod.capacity</name>

　　　　<value>40</value>

　　</property>

　   <property>

　　　　<name>yarn.scheduler.capacity.root.dev.capacity</name>

　　　　<value>60</value>

　　</property>

　   <property>

　　　　<name>yarn.scheduler.capacity.root.dev.maximum-capacity</name>

　　　　<value>75</value>

　　</property>

　　<property>

　　　　<name>yarn.scheduler.capacity.root.dev.hdp.capacity</name>

　　　　<value>50</value>

　　</property>

　   <property>

　　　　<name>yarn.scheduler.capacity.root.dev.spark.capacity</name>

　　　　<value>50</value>

　　</property>

</configuration>

MR程序中添加代码：

Configuration configuration = new Configuration();

configuration.set("mapreduce.job.queuename", "hdp")

Job job = Job.getInstance(configuration, WordCountMain.class.getSimpleName());

Cluster UI在运行的MR查看：

Kubernetes

Ref：Big Data: Google Replaces YARN with Kubernetes to Schedule Apache Spark

Ref: Running Spark on Kubernetes

Ref: Running Spark on YARN

The Kubernetes scheduler is currently experimental. In future versions, there may be behavioral changes around configuration, container images and entrypoints. - 2019/10/28

既然这样，暂时不提。

End.

[Hadoop] Yarn & k8s的更多相关文章

Hadoop YARN 100-1知识点
0 YARN中实体资源管理者(resource manager, RM) 长时间运行的守护进程,负责管理集群上资源的使用节点管理者(node manager, NM) 长时间运行的守护进程,在集群 ...
hadoop yarn running beyond physical memory used
老是报物理内存越界,kill container,然后把yarn.scheduler.minimum-allocation-mb设成2048就好了跟这个yarn.nodemanager.pmem-c ...
Hadoop YARN配置参数剖析—RM与NM相关参数
注意,配置这些参数前,应充分理解这几个参数的含义,以防止误配给集群带来的隐患.另外,这些参数均需要在yarn-site.xml中配置. 1. ResourceManager相关配置参数 (1) ...
Hadoop Yarn内存资源隔离实现原理——基于线程监控的内存隔离方案
注:本文以hadoop-2.5.0-cdh5.3.2为例进行说明. Hadoop Yarn的资源隔离是指为运行着不同任务的“Container”提供可独立使用的计算资源,以避免它们之间相互干扰.目 ...
hadoop错误org.apache.hadoop.yarn.exceptions.YarnException Unauthorized request to start container
错误: 14/04/29 02:45:07 INFO mapreduce.Job: Job job_1398704073313_0021 failed with state FAILED due to ...
hadoop Yarn 编程API
客户端编程库: 所在jar包: org.apache.hadoop.yarn.client.YarnClient 使用方法: 1 定义一个YarnClient实例: private YarnClien ...
MapReduce扩展：应用程序如何运行于Hadoop Yarn之上
1. 背景 “应用程序运行于Hadoop Yarn之上”的需求来源于微博运维数据平台中的调度系统,即调度系统中的任务需要运行于Hadoop Yarn之上.这里的应用程序可以简单理解为一个普通的进程 ...
Hadoop yarn配置参数
参照site:http://hadoop.apache.org/docs/r2.6.0/hadoop-yarn/hadoop-yarn-common/yarn-default.xml 我们在配置yar ...
Hadoop YARN ERROR 1/1 local-dirs are bad *， 1/1 log-dirs are bad *
转 http://blog.csdn.net/u012303571/article/details/46913471 查看 nodemanager 日志发下如下信息 2015-07-16 1 ...

随机推荐

Tensorflow目录
0.Tensorflow安装 1.创建会话,启动会话 2.变量 3.Fech_feed 4.线性回归 5.非线性回归 6.MNIST数据集简单分类 7.交叉熵 8.Dropout 9.正则化 10.优 ...
Java&Selenium自动化测试实现页面元素、页面对象及测试代码分离
一.摘要本篇博文将介绍自动化测试实现页面元素.页面对象及测试代码分离在自动化框架中的实现二.解析页面元素定位信息首先,将页面元素与实际的代码分离,首先我们将页面元素定位信息和定位表达式保存在属性 ...
go mod 解决 Go 语言的包依赖问题
转:https://testerhome.com/topics/16980 https://testerhome.com/ -------------------------------------- ...
windows OpenCV 2.4.9 Python 2.7配置
1 .下载 OpenCV 2.4.9 .下载OpenCV-2.4.9,使用方便下载地址 2. OpenCV-自解压文件,直接运行.即可解压.解压到想要的opencv文件夹里E:\Programme\ ...
eclipse调试断点
1.条件断点如果你不知道如何添加断点,只需点击左边面板(行号前面)断点即被创建.在调试界面中,“断点”视图会把所有被创建的断点列出来.我们可以给它加一个布尔条件,也就是说,该断点会被激活并且如果布尔 ...
python的内置函数（一）
1.数学计算函数 abs(x) 求绝对值1.参数可以是整型,也可以是复数2.若参数是复数,则返回复数的模 complex([real[, imag]]) 创建一个复数 divmod(a, b) 分别取 ...
Elasticsearch: Index template
Index template定义在创建新index时可以自动应用的settings和mappings. Elasticsearch根据与index名称匹配的index模式将模板应用于新索引.这个对于我 ...
MSMQ使用
Message Message是MSMQ的数据存储单元,我们的用户数据一般也被填充在Message的body当中,因此很重要,让我们来看一看其在.net中的体现,如图: 在图上我们可以看见,Messa ...
小米 oj 发奖励（思维）
发奖励序号:#75难度:有挑战时间限制:1000ms内存限制:10M 描述小明老师准备给一些得到小红花的小朋友发糖果做为奖励. 假设有n个小朋友,每个小朋友拥有的小红花为m(n)个,他让这n个小 ...
const 与指针的用法
请找出下面程序中有哪些错误: 1 2 3 4 5 6 7 8 9 10 11 12 13 int main() { int i=10; int j=1; const int *p1; ...

[Hadoop] Yarn & k8s