HDFS Federation（HDFS联邦）

HDFS有两个主要层：

Namespace 由目录、文件和块组成；支持所有命名空间对文件和目录的操作。

Block Storage Service 由Block Management和Storage组成。

Block Management 提供dataNode集群成员关系，注册信息和周期性的心跳；处理块报告，维护块位置；支持块相关的操作，如创建、删除、修改等；管理副本数量、位置，删除多余副本；

Storag是dataNode提供的。

之前的HDFS架构只允许存在一个namespace。一个Namenode管理这个namespace。HDFS联邦通过增加多个namenode/namespace来解决这个先前架构的限制。

HDFS联邦使用多个独立的NameNode/Namespace。NameNode是联邦的，意味着他们是独立的，不会要求相互协作。DataNode是存储block的。每个DataNode都在集群中的所有NameNode注册。DataNode发送周期性的心跳和block报告，并且处理NameNode发回的命令。

一个block pool 是块的集合，这些块属于一个单一的namespace。Datanode存储着集群中所有block pool中的块。block pool的管理相互之间是独立的。这意味着一个namespace可以独立的生成块ID，不需要与其他namespace协调。一个Namenode失败不会导致Datanode的失败，这些Datanode还可以服务其他Namenode。

一个Namespace和他的block pool一起称作namespace volume。这是一个自包含单元。当一个namenode/namespace删除后，对应的block pool也会被删除。当集群升级时，每个namespace volume也会升级。

ClusterID是用来标示集群中所有节点的。当Namenode格式化时，这个id会自动产生。

多namenode/namespace的好处：

HDFS集群支持存储的水平扩展，但是namespace不能。对于大集群部署或者大量小文件存储时，使用多namespace会更好。

之前的设计中，文件系统操作效率受制于单个的namenode。现在，多个namenode提高了文件读写操作效率。

一个namenode在多用户环境中没有隔离性。使用多namespace，不同的应用或者用户可以隔离在不同的namespace中。

联邦配置是向后兼容的，之前架构下的应用不经修改的就可以工作。

联邦中有NameServiceID。匹配的namenode、secondary、backup、checkpointer节点，都有相同的NameServiceID.

YARN

新的架构在hadoop-0.23引入的，把JobTracker两个主要的功能分为Resource Management（RM,资源管理）和job life-cycle management（作业生命周期管理），每个都是独立的组件。

新的ResourceManager管理着所有计算机资源对应用的分配工作。每个应用都会对应一个ApplicationMaster(AM)。

一个应用或者是原来的一个普通job，或者是这些job的DAG。

ResourceManager和每个节点上的NodeManager构成了计算层。其中，NodeManager会管理所在节点上的用户进程。

每个应用对应的ApplicationManager负责执行和监控task。

M有两个组件：Schuduler和ApplicationManager。

Scheduler负责给各种应用分配资源，不会监控或者跟踪应用状态。它也不保证应用失败或者硬件失败后重启任务。当前版本的调度器，只根据内存分配资源给应用。调度器是可插拔的。

每个节点都有一个NodeManager，负责管理本节点资源的使用情况，如cpu、内存、磁盘、网络等，并把这些信息报告给ResourceManager/Scheduler.

ApplicationManager负责管理资源容器。

hadoop2.x的变化的更多相关文章

安装hadoop2.7.3
hadoop3与hadoop2.x的变化很大,hadoop3很多东西现在做起来太麻烦了,这里先安装hadoop2.7.3 此贴学习地址http://www.yiibai.com/t/mapreduce ...
[hadoop读书笔记]前言
hadoop2.0+主要变化: 全新的MapReduce 2,它建立在一个新的分布式资源管理系统之上,该系统称之为YARN. YARN:分布式资源管理系统
坐实大数据资源调度框架之王，Yarn为何这么牛
摘要:Yarn的出现伴随着Hadoop的发展,使Hadoop从一个单一的大数据计算引擎,成为大数据的代名词. 本文分享自华为云社区<Yarn为何能坐实资源调度框架之王?>,作者: Java ...
Hadoop2.2.0安装过程记录
1 安装环境1.1 客户端1.2 服务端1.3 安装准备 2 操作系统安装2.1.1 BIOS打开虚拟化支持2.1.2 关闭防火墙2.1.3 安装 ...
Hadoop学习笔记—21.Hadoop2的改进内容简介
Hadoop2相比较于Hadoop1.x来说,HDFS的架构与MapReduce的都有较大的变化,且速度上和可用性上都有了很大的提高,Hadoop2中有两个重要的变更: (1)HDFS的NameNod ...
最详细的hadoop2.2.0集群的HA高可靠的最简单配置
简介 [from http://www.open-open.com/lib/view/open1390717631132.html] hadoop中的NameNode好比是人的心脏,非常重要,绝对不可 ...
HADOOP安装指南-Ubuntu15.10和hadoop2.7.2
Ubuntu15.10中安装hadoop2.7.2安装手册太初目录 1. Hadoop单点模式... 2 1.1 安装步骤... 2 0.环境和版本... 2 1.在ubu ...
从零自学Hadoop(10)：Hadoop1.x与Hadoop2.x
阅读目录序里程碑 Hadoop1.x与Hadoop2.x 系列索引本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的 ...
[整理]Centos6.5 + hadoop2.6.4环境搭建
搭建Hadoop集群环境(3台机器) 1 准备环境 1.1 安装系统,并配置网络使3台机器互联互通,且SSH可直连(无需密码.保存私钥) 1.1.1 安装系统安装Centos 6.5系统安装过程略 ...

随机推荐

一句话搞定-phpStudy安装yaf扩展
首先下载phpStudyX64位的,然后傻瓜式安装,安装完下载yaf,由于yaf扩展的网站在国外很难下载,需要FQ,所以我这里下载了yaf5.6nts.zip,解压后把php_yaf.dll这个文件粘 ...
MySQL查询1
1.将下列语句复制到sqlyog的询问栏 /*!40101 SET NAMES utf8 */; create table `t_student` ( `id` double , `stuName` ...
python基础教程（四）
列表本节继续讨论列表不同元组和字符串的地方:列表是可变的(mutable)----可以改变列表的内容,并且列表有很多有用的.专门的方法. List函数可以将一个字符串拆分成列表. >>& ...
throws Exception方法异常处理机制
public class T4 { private String sex; public String getSex() { return sex; } public void setSex(Stri ...
java面向对象理解
面向对象:世间一切事物均可认为是对象,用户不必了解软件内部的实现机制,可根据需要直接调用接口,生成一个正常工作的应用程序. 面向对象的特点:抽象,封装,继承,多态性, 对象:对象就是一个具有明确行为的 ...
Java企业微信开发_09_素材管理之下载微信临时素材到本地服务器
一.本节要点 1.获取临时素材接口请求方式:GET(HTTPS) 请求地址:https://qyapi.weixin.qq.com/cgi-bin/media/get?access_token=AC ...
Ibatis XML 配置文件注释引起错误及解决方案
详见:http://blog.yemou.net/article/query/info/tytfjhfascvhzxcytp35 Ibatis XML 配置文件注释引起错误及解决方案最近在使用Iba ...
美国站群服务器有利于SEO优化
美国服务器对于站群来说就是指站长为提升每个网站对搜索引擎的权重,更好的有利于seo优化,单独为该服务器下的多个网站分别配置不同的独立ip. 实际上,站群服务器跟其他服务器并没有多大差异,唯一的区别就是 ...
PHP初入,基础知识点分享（a标签&表格的嵌套&文字的处理）
<!DOCTYPE html><html> <head> <meta charset="utf-8" /> <title> ...
pip install python 如何快速安装模块
之前python安装模块要在网络上下载,从python2.7.9之后,以及python3,python就自带pip 这个命令,能够快速的安装模块 1, 首先打开python的主文件夹 2.在主文件夹 ...

hadoop2.x的变化

HDFS Federation（HDFS联邦）

YARN

hadoop2.x的变化的更多相关文章

随机推荐

热门专题