本指南概述了HDFS Federation功能以及如何配置和管理联合集群。

当前HDFS背景

HDFS主要有两层：

　　1.Namespace

　　　　（1）包含目录，文件和块。

　　　　（2）它支持所有命名空间相关的文件系统操作，如创建，删除，修改和列出文件和目录。

2.Block Storage，分为两部分：

　　　（1）块管理（在Namenode中执行）通过处理注册和周期性心脏跳动来提供Datanode集群成员资格。处理块报告并维护块的位置。支持块相关操作，如创建，删除，修改和获取块位置。管理复制块下的副本放置，块复制，并删除过度复制的块。

　　　　（2）存储 - 由Datanodes通过在本地文件系统上存储块并允许读/写访问来提供。

当前HDFS架构只允许整个集群中存在一个namespace，而该namespace被仅有的一个namenode管理。这个架构使得HDFS非常容易实现，但是，它（见上图）在具体实现过程中会出现一些模糊点，进而导致了很多局限性（下面将要详细说明），当然这些局限性只有在拥有大集群的公司，像baidu，腾讯等出现。

Multiple Namenodes/Namespaces

为了水平扩展名称服务，联合使用多个独立的Namenodes /命名空间。纳米诺斯联盟;Namenodes是独立的，不需要相互协调。Datanodes用作所有Namenodes的块的通用存储。每个Datanode注册到集群中的所有Namenodes。Datanodes发送周期性的心跳和块报告。他们还处理Namenodes的命令。

用户可以使用ViewFs创建个性化的命名空间视图。ViewFs类似于某些Unix / Linux系统中的客户端安装表。

Block Pool

块池是属于单个命名空间的一组块。Datanodes存储集群中所有块池的块。每个块池都是独立管理的。这允许命名空间为新块生成块ID，而不需要与其他命名空间协调。Namenode故障不会阻止Datanode在集群中提供其他的Namenode。

命名空间及其块池一起称为命名空间卷。这是一个独立的管理单位。当Namenode /命名空间被删除时，Datanodes的相应块池被删除。在集群升级期间，每个命名空间卷都将作为一个单元升级。

ClusterID

ClusterID标识符用于标识集群中的所有节点。格式化Namenode时，该标识符将被提供或自动生成。该ID应该用于格式化其他的Namenodes到集群。

主要优点

命名空间可伸缩性 - Federation会添加命名空间水平缩放。通过允许将更多的Namenodes添加到集群中，使用大量小文件的大型部署或部署可以从命名空间缩放中获益。

性能 - 文件系统吞吐量不受单个Namenode的限制。将更多的Namenodes添加到集群可以缩放文件系统的读/写吞吐量。

隔离 - 单个Namenode在多用户环境中不提供隔离。例如，实验应用程序可能会超载Namenode并减缓生产关键应用程序。通过使用多个Namenodes，可以将不同类别的应用程序和用户隔离到不同的命名空间。

Federation 配置

联合配置向后兼容，并允许现有的单个Namenode配置工作，无任何变化。新配置的设计使得集群中的所有节点具有相同的配置，而不需要根据集群中节点的类型部署不同的配置。

联盟添加了一个新的NameServiceID抽象。Namenode及其对应的辅助/备份/检查指针节点都属于NameServiceId。为了支持单个配置文件，Namenode和secondary / backup / checkpointer配置参数后缀为NameServiceID。

配置步骤

步骤1：将dfs.nameservices参数添加到配置中，并使用逗号分隔的NameServiceID进行配置。Datanodes将使用这个来确定集群中的Namenodes。

步骤2：对于每个Namenode和Secondary Namenode / BackupNode / Checkpointer，将以下配置参数添加到相应的NameServiceID到公共配置文件中：

Daemon	Configuration Parameter
Namenode	`dfs.namenode.rpc-address` `dfs.namenode.servicerpc-address` `dfs.namenode.http-address` `dfs.namenode.https-address` `dfs.namenode.keytab.file` `dfs.namenode.name.dir` `dfs.namenode.edits.dir` `dfs.namenode.checkpoint.dirdfs.namenode.checkpoint.edits.dir`
Secondary Namenode	`dfs.namenode.secondary.http-address` `dfs.secondary.namenode.keytab.file`
BackupNode	`dfs.namenode.backup.address` `dfs.secondary.namenode.keytab.file`

以下是两个Namenodes的示例配置：

<configuration>

  <property>

    <name>dfs.nameservices</name>

    <value>ns1,ns2</value>

  </property>

  <property>

    <name>dfs.namenode.rpc-address.ns1</name>

    <value>nn-host1:rpc-port</value>

  </property>

  <property>

    <name>dfs.namenode.http-address.ns1</name>

    <value>nn-host1:http-port</value>

  </property>

  <property>

    <name>dfs.namenode.secondaryhttp-address.ns1</name>

    <value>snn-host1:http-port</value>

  </property>

  <property>

    <name>dfs.namenode.rpc-address.ns2</name>

    <value>nn-host2:rpc-port</value>

  </property>

  <property>

    <name>dfs.namenode.http-address.ns2</name>

    <value>nn-host2:http-port</value>

  </property>

  <property>

    <name>dfs.namenode.secondaryhttp-address.ns2</name>

    <value>snn-host2:http-port</value>

  </property>

  .... Other common configuration ...

</configuration>

格式化Namenodes

步骤1：使用以下命令格式化Namenode：

[hdfs]$ $HADOOP_HOME/bin/hdfs namenode -format [-clusterId <cluster_id>]

选择一个唯一的cluster_id，它不会与您的环境中的其他集群冲突。如果未提供cluster_id，则会自动生成唯一的。

步骤2：使用以下命令格式化附加的Namenodes：

[hdfs]$ $HADOOP_HOME/bin/hdfs namenode -format -clusterId <cluster_id>

请注意，步骤2中的cluster_id必须与步骤1中的cluster_id相同。如果它们不同，则附加的Namenodes不会是联合集群的一部分。

从旧版本升级并配置Federation

较旧的版本只支持一个Namenode。将集群升级到较新版本以启用联合在升级期间，您可以提供如下的ClusterID：

[hdfs]$ $HADOOP_HOME/bin/hdfs --daemon start namenode -upgrade -clusterId <cluster_ID>

如果未提供cluster_id，则会自动生成。

将新的Namenode添加到现有的HDFS集群

执行以下步骤：

将dfs.nameservices添加到配置中。

使用NameServiceID后缀更新配置。配置键名称已更改后版本0.20。您必须使用新的配置参数名才能使用联合。

将新的Namenode相关配置添加到配置文件。将配置文件传播到集群中的所有节点。启动新的Namenode和Secondary / Backup。通过对集群中的所有Datanode运行以下命令，刷新Datanodes以获取新添加的Namenode：

[hdfs]$ $HADOOP_HOME/bin/hdfs dfsadmin -refreshNamenodes <datanode_host_name>:<datanode_rpc_port>

管理集群

启动和停止集群

要启动集群，请运行以下命令：

[hdfs]$ $HADOOP_HOME/sbin/start-dfs.sh

要停止集群，请运行以下命令：

[hdfs]$ $HADOOP_HOME/sbin/stop-dfs.sh

这些命令可以从HDFS配置可用的任何节点运行。该命令使用配置来确定集群中的Namenode，然后在这些节点上启动Namenode进程。Datanodes在工作文件中指定的节点上启动。该脚本可以用作构建自己的脚本来启动和停止集群的参考。

平衡器

平衡器已被更改为使用多个Namenodes。可以使用以下命令运行Balancer：

[hdfs]$ $HADOOP_HOME/bin/hdfs --daemon start balancer [-policy <policy>]

policy参数可以是以下任一项：datanode - 这是默认策略。这样可以平衡Datanode级别的存储空间。这与以前版本的平衡策略相似。块池 - 这将平衡块池池级别的存储空间，并在Datanode级别进行平衡。请注意，Balancer仅平衡数据，不平衡命名空间。有关完整的命令用法，请参阅平衡器。

退役

退役类似于以前的版本。需要分解的节点将添加到所有Namenodes的排除文件中。每个Namenode取消其Block Pool。当所有Namenodes完成退役Datanode时，Datanode被视为已退役。

步骤1：要将排除文件分发到所有的Namenodes，请使用以下命令：

[hdfs]$ $HADOOP_HOME/sbin/distribute-exclude.sh <exclude_file>

步骤2：刷新所有的Namenodes以接收新的排除文件：

[hdfs]$ $HADOOP_HOME/sbin/refresh-namenodes.sh

上述命令使用HDFS配置来确定集群中配置的Namenodes，并刷新它们以接收新的排除文件。

群集Web控制台

与Namenode状态网页类似，当使用联合时，可以使用群集Web控制台来监视http：// <any_nn_host：port> /dfsclusterhealth.jsp中的联合群集。群集中的任何Namenode都可用于访问此网页。

群集Web控制台提供以下信息：一个集群摘要，显示了整个集群的文件数，块数，总配置存储容量以及可用和已用存储。包含Namenode列表和一个摘要，其中包含每个Namenode的文件数，块数，缺失块数，实时数和死区数据节点数。它还提供访问每个Namenode的Web UI的链接。Datanodes的退役状态。

http://dongxicheng.org/mapreduce/hdfs-federation-introduction/

HDFS概述（3）————HDFS Federation的更多相关文章

HDFS概述（5）————HDFS HA
HA With QJM 目标本指南概述了HDFS高可用性(HA)功能以及如何使用Quorum Journal Manager(QJM)功能配置和管理HA HDFS集群. 本文档假设读者对HDFS集群 ...
HDFS概述
HDFS概述作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.HDFS产出背景及定义 1>.HDFS产生背景随着数据量越来越大,在一个操作系统存不下所有的数据,那么就分配 ...
[HDFS Manual] CH6 HDFS Federation
HDFS Federation HDFS Federation 1 Background 2.多个namenode/namespace 2.1 关键好处 3 联合配置 3.1 配置 3.2 格式化na ...
HDFS概述（一）
HDFS概述(一) 1. HDFS产出的背景及定义 1.1 HDFS产生的背景随着数据量越来越大,在一个操作系统存不下所有的数据,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,迫切需 ...
HDFS概述和Shell操作
大数据技术之Hadoop(HDFS) 第一章 HDFS概述 HDFS组成架构 HDFS文件块大小第二章 HDFS的Shell操作(开发重点) 1．基本语法 bin/hadoop fs 具体命令 ...
Hadoop(5)-HDFS概述
HDFS产生背景 HDFS优缺点 HDFS组成架构 HDFS文件块大小
[HDFS Manual] CH3 HDFS Commands Guide
HDFS Commands Guide HDFS Commands Guide 3.1概述 3.2 用户命令 3.2.1 classpath 3.2.2 dfs 3.2.3 envvars 3.2.4 ...
[HDFS Manual] CH2 HDFS Users Guide
2 HDFS Users Guide 2 HDFS Users Guide 2.1目的 2.2.概述 2.3.先决条件 2.4. Web Interface 2.5. Shell Command 2. ...
大数据之路week07--day01（HDFS学习，Java代码操作HDFS，将HDFS文件内容存入到Mysql）
一.HDFS概述数据量越来越多,在一个操作系统管辖的范围存不下了,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,因此迫切需要一种系统来管理多台机器上的文件,这就是分布式文件管理系统 ...

随机推荐

Sentry的安装搭建与使用
业务监控工具 Sentry 的搭建与使用官方网址 Django Sentry 官网链接 Sentry 简介 Sentry 是一个开源的实时错误报告工具,支持 web 前后端.移动应用以及游戏,支持 ...
CSS3笔记之第一天
通过展示实例来初步学习CSS3 1.背景设置背景色:background-color:#b0c4de; 设置背景图片:background-image:url('paper.gif'); 设置背景图 ...
网上搜索到的比较好的mysql查询语句练习题
Sutdent表的定义字段名字段描述数据类型主键外键非空唯一自增 Id 学号 INT(10) 是否是是是 Name 姓名 VARCHAR(20) 否否是否否 Sex 性 ...
ThinkPhp5源码剖析之Cache
为什么需要Cache(缓存)? 假设现在有一个小说网,有非常多的读者,有一篇新的章节更新了,那么可能一分钟内有几万几十万的访问量. 如果没有缓存,同样的内容就要去数据库重复查询,那可能网站一下就挂掉了 ...
C# 异步编程1 APM模式异步程序开发
C#已有10多年历史,单从微软2年一版的更新进度来看活力异常旺盛,C#中的异步编程也经历了多个版本的演化,从今天起着手写一个系列博文,记录一下C#中的异步编程的发展历程.广告一下:喜欢我文章的朋友,请 ...
ios 初体验<UILabel控件>
创建控件: UILabel *label = [[UILabel alloc]init]; //设置控件大小 label.frame = CGRectMake(50,100,300,40);//分别为 ...
javaScript数组去重方法
在JAvascript平时项目开发中经常会用到数组去重的操作.这时候就要用到JS数组去重的方法了. demo1: 第一种:JS数组去重操作方法是利用遍历原数组,利用数组的indexOf()方法来来判断 ...
idea 给maven项目添加依赖（二）
这里接着上一篇来我们观察目录发现有两个pom.xml(project object module) 项目是里面的,所以外面的先不管它. 点击里面的pom.xml 1.在<url>节点下面 ...
【2017集美大学1412软工实践_助教博客】团队作业7——Alpha冲刺之事后诸葛亮
题目团队作业7: http://www.cnblogs.com/happyzm/p/6827853.html 团队成绩评分项目变更管理设计/实现测试/发布团队的角色,管理,合作总结全组 ...
201521123019 《Java程序设计》第8周学习总结
1. 本章学习总结 2. 书面作业一.List中指定元素的删除(题目4-1) for (int i = list.size()-1; i >=0; i--) {//从最后一个元素开始删除 if ...

HDFS概述（3）————HDFS Federation