Hadoop 5、HDFS HA 和 YARN

Bodi 2024-10-01 03:15:58 原文

Hadoop 2.0 产生的背景
Hadoop 1.0 中HDFS和MapReduce存在高可用和扩展方面的问题
　　HDFS存在的问题
　　　　NameNode单点故障，难以用于在线场景
　　　　NameNode压力过大，内存受限，影响系统扩展
　　　　MapReduce存在问题
　　　　JobTracker 单点故障
　　　　JobTracker 压力过大，影响系统扩展
　　　　难以支持除MapReduce以外的计算框架如 Spark、Strom等；

Hadoop 2.x由 HDFS 、MapReduce、YARN三部分组成

　　HDFS：NN Federation 、HA
　　MapReduce：运行在Yarn上的MR
　　Yarn：资源管理系统

HDFS 2.x

解决HDFS 1.0 中单点故障和内在受限问题
　　解决单点在故障
　　　　HDFS HA ：通过主备NameNode解决，如果主NameNode发生在故障，则切换到备用的NameNode上
　　解决内存受限问题
　　　　HDFS Federation（联邦）
　　　　水平扩展，支持多个NameNode
　　　　每个NameNode分管一部分目录
　　　　所有NameNode共享所有的DataNode存储资源
　　HDFS 2.x 仅是架构眼生变化，使用方式不变
　　　　对HDFS使用者透明
　　　　HDFS 1.x 中的命令和API仍可以使用

HDFS 2.0 HA

主备NameNode
　　解决单点故障
　　　　主NameNode对外提供服务，备NameNode同步主NameNode的元数据，以待切换
　　　　所有DataNode同时向两个NameNode汇报block信息（如上图）

　　　　JournaNodes集群：三台或三台以上的 JournaNode节点（与Zookeeper节点相同），JournaNodes 接管了Secondary的工作和NameNode edits的工作，将edits 日志文件放在JournaNodes 所有节点上，所有的和NameNode相关的写入修改操作日志都存放在JournaNodes 每个节点上的edits上，在JournaNodes 节点上实现fsimage的合并工作，然后再由JournaNodes 将新的fsimage分发给主备NameNode；

　　两种切换选择
　　　　手动切换：通过命令实现主备之间的切换，可以用HDFS升级等场合
　　　　自动切换：基于Zookeeper的实现
　　基于Zookeeper自动切换方案
　　　　Zookeeper Failover Controller :监控NameNode健康状态，并向Zookeeper注册NameNode，NameNode挂掉之后，ZKFC为NameNode竞争锁，获取ZKFC锁的NameNode变为Active；

HDFS 2.x Federation

　　
　　通过多个NameNode/NameSpace 把元数据的存储和管理分散到多个节点中，使NameNode/NameSpace可以通过增加机器来进行水平扩展。
　　能把单个NameNode的负载分散到多个节点中，在HDFS数据规模较大的时候不会降低HDFS的性能。可能通过多个NameSpace来隔离不同类型的应用，把不同类型应用的HDFS元数据的存储和管理分派到不同的NameNode中。

　　为了水平扩展namenode，federation使用了多个独立的namenode/namespace。这些namenode之间是联合的，也就是说，他们之间相互独立且不需要互相协调，各自分工，管理自己的区域。分布式的datanode被用作通用的数据块存储存储设备。每个datanode要向集群中所有的namenode注册，且周期性地向所有namenode发送心跳和块报告，并执行来自所有namenode的命令。

　　一个block pool由属于同一个namespace的数据块组成，每个datanode可能会存储集群中所有block pool的数据块。

　　每个block pool内部自治，也就是说各自管理各自的block，不会与其他block pool交流。一个namenode挂掉了，不会影响其他namenode。

　　某个namenode上的namespace和它对应的block pool一起被称为namespace volume。它是管理的基本单位。当一个namenode/nodespace被删除后，其所有datanode上对应的block pool也会被删除。当集群升级时，每个namespace volume作为一个基本单元进行升级。

　　相关文章：http://dongxicheng.org/mapreduce/hdfs-federation-introduction/

YARN 资源管理系统

　　YARN : Yet Another Resource Negotiator；
　　Hadoop 2.0 新引入的资源管理系统，直接从MRv1演化而来的。
　　核心思想：将MRv1中的JobTracker的资源管理和任务调度两个功能分开，分加盟由ResourceManager和ApplicationMaster进程实现。
　　ResourceManager : 负责整个集群的资源管理和调度
　　ApplicationMaster ：负责应用程序相关的事务，比如任务调度、任务监控和容错等
　　YARN的引入，使得多个计算框架可运行在一个集群中
　　每个应用对应一个ApplicationMaster
　　目前多个计算框架可以运行在Yarn上，比如MapReduce、Spark、Storm等。

　　yarn相关文章：http://www.ibm.com/developerworks/cn/opensource/os-cn-hadoop-yarn/

MapReduce On YARN

　　MapReduce On YARN : MRv2
　　将MapReduce作业直接运行在YARN上，而不是由JobTracker和TaskTarcker构建的MRv系统中
　　基本功能模块
　　　　YARN ：负责资源管理和调度
　　　　MRAppMaster ：负责任务切分、任务调度、任务监控和容错等
　　　　MapTask/ReduceTask ：任务驱动引擎与MRv1一致
　　　　每个MapReduce作业对尖一个MRAppMaster
　　　　MRAppMaster任务调度
　　　　YARN将资源分配给MRAppMaster
　　　　MRAppMaster进一步将资源分配给内部的任务
　　MRAppMaster容错
　　　　失败后，由YARN重新启动
　　　　任务失败后，MRAppMaster重新申请资源

HDFS HA高可用集群搭建：http://www.cnblogs.com/raphael5200/p/5154325.html

Hadoop 5、HDFS HA 和 YARN的更多相关文章

Apache版本的Hadoop HA集群启动详细步骤【包括Zookeeper、HDFS HA、YARN HA、HBase HA】（图文详解）
不多说,直接上干货! 1.先每台机器的zookeeper启动(bigdata-pro01.kfk.com.bigdata-pro02.kfk.com.bigdata-pro03.kfk.com) 2. ...
hadoop(二):hdfs HA原理及安装
早期的hadoop版本,NN是HDFS集群的单点故障点,每一个集群只有一个NN,如果这个机器或进程不可用,整个集群就无法使用.为了解决这个问题,出现了一堆针对HDFS HA的解决方案(如:Linux ...
Hadoop2.2.0--Hadoop Federation、Automatic HA、Yarn完全分布式集群结构
Hadoop有很多的上场时间,与系统上线.手头的事情略少.So,抓紧时间去通过一遍Hadoop2在下面Hadoop联盟(Federation).Hadoop2可用性(HA)及Yarn的全然分布式配置. ...
大数据入门第十天——hadoop高可用HA
一.HA概述 1.引言正式引入HA机制是从hadoop2.0开始,之前的版本中没有HA机制 2.运行机制实现高可用最关键的是消除单点故障 hadoop-ha严格来说应该分成各个组件的HA机制——H ...
Apache hadoop namenode ha和yarn ha ---HDFS高可用性
HDFS高可用性Hadoop HDFS 的两大问题:NameNode单点:虽然有StandbyNameNode,但是冷备方案,达不到高可用--阶段性的合并edits和fsimage,以缩短集群启动的时 ...
Hadoop 学习笔记（十） hadoop2.2.0 生产环境部署 HDFS HA Federation 含Yarn部署
其他的配置跟HDFS-HA部署方式完全一样.但JournalNOde的配置不一样>hadoop-cluster1中的nn1和nn2和hadoop-cluster2中的nn3和nn4可以公用同样的 ...
Hadoop组件之-HDFS(HA实现细节)
NameNode 高可用整体架构概述在 Hadoop 1.0 时代,Hadoop 的两大核心组件 HDFS NameNode 和 JobTracker 都存在着单点问题,这其中以 NameNode ...
Hadoop 学习笔记（九） hadoop2.2.0 生产环境部署 HDFS HA部署方法
step1:将安装包hadoop-2.2.0.tar.gz存放到某一个目录下,并解压 step2:修改解压后的目录中的文件夹/etc/hadoop下的xml配置文件(如果文件不存在,则自己创建) 包括 ...
Hadoop 2、配置HDFS HA (高可用)
前提条件先搭建 http://www.cnblogs.com/raphael5200/p/5152004.html 的环境,然后在其基础上进行修改一.安装Zookeeper 由于环境有限,所以在仅 ...

随机推荐

WordPress 实用SEO插件总结
原文地址:http://www.chinaz.com/web/2013/1122/328044.shtml#changyan_area WordPress- seo扩展插件众多,因此对于初学者来说会看 ...
今日成长笔记2016-11-18 - 关于java开发
好久没有写今日成长笔记了,要记得上一次写笔记还是2016-09-05,今天心血来潮,写一写最近发生在自己身上的事情,以后我要坚持每天写日记.我承认自己身上的确或多或少的存在不足,现在把它们抛出来,并记 ...
“玲珑杯”郑州轻工业学院第八届ACM程序设计大赛暨河南高校邀请赛-正式赛(总结)
这次轻院校赛,我们去了五个队,怀着打酱油的心态早早爬起来坐上校车出发了,由于昨晚室友打游戏,以及看视频大笑...没睡好,快1点才睡着,感觉特别困,车上没地方,睡不着,就在车上闭目养神,由于在新校区,不 ...
STL中的set容器的一点总结（转）
STL中的set容器的一点总结 1.关于set C++ STL 之所以得到广泛的赞誉,也被很多人使用,不只是提供了像vector, string, list等方便的容器,更重要的是STL封装了许多复杂 ...
UE是什么意思？用户体验设计师与UE设计是什么关系？
本文来自:http://blog.sina.com.cn/s/blog_a6bebb3f01015h47.html 什么是UE(UE——UE就是用户体验度) 你会发觉他的使用很人性化:功能强大但操作简 ...
Android实战技巧之十九：android studio导出jar包（Module）并获得手机信息
AS中并没有独立的Module 工程,可是能够在普通的Project中增加Module.所谓的Module就是我们通常所指的模块化的一个单元.并经常以jar包的形式存在.以下以一个获取手机信息的样例演 ...
Java String类具体解释
Java String类具体解释 Java字符串类(java.lang.String)是Java中使用最多的类,也是最为特殊的一个类,非常多时候,我们对它既熟悉又陌生. 类结构: public fin ...
Ubuntu亮度无法调节或调节无法保存的问题
装了搜狗输入法之后,系统设置里面的很多软件都没有了.以前屏幕太亮在电源里面可以调节,现在不行了.没办法,只能找其他的办法了. 在网上查了很多资料,经自己的实验,找到了一个成功的方法. 首先进入 /sy ...
stagefright框架（四）-Video Buffer传输流程
這篇文章將介紹Stagefright中是如何和OMX video decoder传送buffer. (1) OMXCodec會在一開始的時候透過read函式來傳送未解碼的data給decoder,並且 ...
git使用经验
一直想写一点关于git的文章,但是平时太懒了,没有写,现在写些经验这里,方便以后自己忘记了.