HDFS High Availability Using the Quorum Journal Manager

不要乱摸 2024-11-09 20:29:38 原文

http://hadoop.apache.org/docs/r2.9.0/hadoop-project-dist/hadoop-hdfs/HDFSHighAvailabilityWithQJM.html

背景

在Hadoop 2.0.0以前，在一个HDFS集群中NameNode存在单点故障。每个集群中只有一个NameNode，如果这个机器不可用的话，那么整个集群将不可用，直到这个机器被重启或者其它的机器来替代它。这就意味着：

万一NameNode机器宕机了，那么整个集群不可用
NameNode机器上的软件或者硬件升级的时候，集群不得不停止运行

HDFS HA在每个集群中运行两个NameNode，一个是Active的，一个Passive的，作为热备。

架构

在典型的HA集群中，两个分开的机器均被配置为NameNode。在任意时刻，只有一个NameNode处于活动状态，另一个处于备用状态。处于活动状态的NameNode负责处理集群中所有客户端操作，此时处于备用状态的NameNode只是扮演者slave的角色。这个备用的NameNode维护足够的状态，以防快速容灾。

备用NameNode为了保持和活动NameNode的状态同步，这两个节点用一组单独的后台进程进行通信，这个守护进程被叫做“JournalNodes”（简称JNs）。当处于活动状态的NameNode做了任何修改以后，它将修改的日志传给大部分JNs。备用的NameNode从JNs中读取这种修改，并且会把这种改变写到EditLog中。因为备用NameNode看到这些编辑，所有它将这种改变应用到自己的namespace中。

要想保住HA集群正确的操作，至关重要的一点是，同一时间集群中只能有一个NameNode处于活动状态。为了保证这一点，JournalNodes只允许同一时间只有一个NameNode可以写。

硬件资源

为了部署一个HA集群，你需要准备下列资源：

NameNode machines：运行活动的和备用的NameNode的机器的硬件配置应该是相等的
JournalNode machines：必须至少3个JournalNode，因为Edit Log必须被写到大多数JNs上。也就是说，可以容忍单个机器失败。你也可以运行3个以上的JournalNode，但是为了能够增加系统承受失败的数量，你应该运行奇数个JNs（比如：3，5，7等等）。当运行的JournalNode数量是N的时候，系统最多可以容忍（N - 1）/ 2个失败，并且正常服务。

其它参考

http://blog.csdn.net/strongerbit/article/details/7013221/

HDFS High Availability Using the Quorum Journal Manager的更多相关文章

[HDFS Manual] CH4 HDFS High Availability Using the Quorum Journal Manager
HDFS High Availability Using the Quorum Journal Manager HDFS High Availability Using the Quorum Jour ...
Dream------Hadoop--Hadoop HA QJM （Quorum Journal Manager）
In a typical HA cluster, two separate machines are configured as NameNodes. At any point in time, ex ...
Configuring HDFS High Availability
Configuring HDFS High Availability 原文请訪问 http://blog.csdn.net/ashic/article/details/47024617,突袭新闻小灵儿 ...
HDFS High Availability（HA）高可用配置
高可用性(英语:high availability,缩写为 HA) IT术语,指系统无中断地执行其功能的能力,代表系统的可用性程度.是进行系统设计时的准则之一. 高可用性系统意味着系统服务可以更长时间 ...
HDFS之Qurom Journal Manager（QJM）实现机制分析
前言 1.1背景自从hadoop2版本开始,社区引入了NameNode高可用方案.NameNode主从节点间需要同步操作日志来达到主从节点元数据一致.最初业界均通过NFS来实现日志同步,大家之所以选 ...
HDFS Federation与HDFS High Availability详解
HDFS Federation NameNode在内存中保存文件系统中每个文件和每个数据块的引用关系,这意味着对于一个拥有大量文件的超大集群来说,内存将成为限制系统横向扩展的瓶颈.在2.0发行版本系列 ...
构建高可靠hadoop集群之3- Quorum Journal Manager
在正式环境中,搭建高可靠(ha)的系统是必须的. 例如oralce的rac,apache集群,windows服务器集群本文不再赘言ha的重要性. 本文主要是对 http://hadoop.apach ...
分布式系统理论之Quorum机制
一,Quorum机制介绍在分布式系统中有个CAP理论,对于P(分区容忍性)而言,是实际存在从而无法避免的.因为,分布系统中的处理不是在本机,而是网络中的许多机器相互通信,故网络分区.网络通信故障问 ...
hadoop2.x HDFS HA linux环境搭建
HDFS High Availability Using the Quorum Journal Manager 准备3台机器可以更多 NN DN ZK ZKFC JN RM DM n ...

随机推荐

Docker笔记四：Elasticsearch实例部署
在运行或启动elasticsearch容器前,先在宿主机上执行 sysctl -w vm.max_map_count=262144: 解决" max virtual memory areas ...
Python开发工具PyCharm个性化设置
Python开发工具PyCharm个性化设置,包括设置默认PyCharm解析器.设置缩进符为制表符.设置IDE皮肤主题等,大家参考使用吧 1.设置默认PyCharm解析器: 操作如下: Pyt ...
Apache HTTPserver安装后报：无法启动,由于应用程序的并行配置不对-（已解决）
原创作品.出自 "深蓝的blog" 博客.欢迎转载,转载时请务必注明出处.否则有权追究版权法律责任. 深蓝的blog:http://blog.csdn.net/huangyanlo ...
Android系统匿名共享内存（Anonymous Shared Memory）Java调用接口分析
一.Ashmem驱动程序 ~/Android/kernel/goldfish ----include ----linux ----ashmem.h ----mm ----ashmem.c 驱动程序具体 ...
poj 2299 Ultra-QuickSort（树状数组求逆序数+离散化）
题目链接:http://poj.org/problem?id=2299 Description In this problem, you have to analyze a particular so ...
C++简易list
list不同于vector.每一个节点的结构须要自行定义,迭代器属于双向迭代器(不是随即迭代器),也须要自行定义.和通用迭代器一样,list的迭代器须要实现的操作有:++.--.*.->.==. ...
Apriori算法的C++实现
Apriori是经典的购物篮分析算法.该算法用SQL实现难度较大,所以考虑用C++实现. 花了两天,代码例如以下.原创转载请注明出处 //Apriori.c #include<iostream& ...
MyBatis动态代理
一.项目结构二.代码实现 import java.util.List; import java.util.Map; import com.jmu.bean.Student; public inter ...
这么说吧，java线程池的实现原理其实很简单
好处 : 线程是稀缺资源,如果被无限制的创建,不仅会消耗系统资源,还会降低系统的稳定性,合理的使用线程池对线程进行统一分配.调优和监控,有以下好处: 1.降低资源消耗: 2.提高响应速度: 3.提高线 ...
《TCP-IP详解卷2：实现》【PDF】下载
<TCP-IP详解卷2:实现>[PDF]下载链接: https://u253469.pipipan.com/fs/253469-230062539 内容简介 <TCP/IP详解·卷2 ...