HDFS高可用性及其分布式系统思想基础

源自单点失效问题，也就是当NameNode不可用的时候，用什么办法可以平滑过渡？

最直接的办法是再添加一个备用的NN，这就产生了Active NameNode和Standby NameNode的设计思路。

接下来的一个问题是，如何让Standby Namenode的文件系统命名空间元数据与Active NameNode 的一致呢？

目前的解决办法有QJM方法和NFS方法。

QJM方案：添加多个Journal Node，这个数字是2F+1，通过Paxos协议保证数据的一致性，QJM最多可容忍F个JournalNode同时发生故障而系统仍然可以正常运行。

还有一个问题是，当ANN出现了故障之后，如何自动切换？

目前采用的方案是使用zookeeper实现“领导选举”。

参见下图（图片来自Linux公社）：

现在有这样一个问题：

　　zookeeper如何实现“领导选举”？

以下内容来自《大数据日知录：架构与算法》一书。

Zookeeper在实现领导选举时，实现方法参加如下python代码：

　　ZookeeperLeaderElect.py

　　handle = zookeeper.init("localhost:2181",my_connection_watcher,10000,0);//初始化

　　(data,stat) = zookeeper.get(handle,"/services/myservice/leader",True)//获取领导者节点信息

　　if(stat=None)

　　　　path = zookeeper.create(handle,"/services/myservice/leader",hostname:info,[ZOO_OPEN_ACL_UNSAFE],zookeeper.EPHEMERAL)

　　　　if (path==None)//说明创建leader路径失败，也就是说无法将目前节点设置为领导者节点，也就意味着在程序执行过程中间，有其他的节点的进程设置了leader节点

　　　　　　(data,stat) = zookeeper.get(handle,"services/myservice/leader",True)

　　　　　　#其他服务器是领导者

　　　　　　#从leader节点读取并解析领导者地址信息

　　　　else

　　　　　　#当前节点已经成功设置为领导者节点

　　　else

　　　　#其他服务器是领导者

　　　　#从leader节点读取并解析领导者地址信息

HDFS高可用性及其分布式系统思想基础的更多相关文章

Apache hadoop namenode ha和yarn ha ---HDFS高可用性
HDFS高可用性Hadoop HDFS 的两大问题:NameNode单点:虽然有StandbyNameNode,但是冷备方案,达不到高可用--阶段性的合并edits和fsimage,以缩短集群启动的时 ...
理解HDFS高可用性架构
在Hadoop1.x版本的时候,Namenode存在着单点失效的问题.如果namenode失效了,那么所有的基于HDFS的客户端——包括MapReduce作业均无法读,写或列文件,因为namenode ...
C#面向接口编程详解（1）——思想基础
我想,对于各位使用面向对象编程语言的程序员来说,“接口”这个名词一定不陌生,但是不知各位有没有这样的疑惑:接口有什么用途?它和抽象类有什么区别?能不能用抽象类代替接口呢?而且,作为程序员,一定经常听到 ...
Google Dapper-大规模分布式系统的基础跟踪设施
[说明:本文是阅读Google论文"Dapper, a Large-Scale Distributed Systems Tracing Infrastructure"之后的一个简要 ...
HDFS分布式文件系统设计思想
HDFS设计目标 1)硬件错误是常态,数据保存需要冗余. 2)数据批量读取,Hadoop擅长数据分析而不是事务处理. 3)大规模数据集. 4)简单一致醒模型,降低系统复杂度,文件一次写入多次读取, 5 ...
HDFS文件读写操作（基础基础超基础）
环境 OS: Ubuntu 16.04 64-Bit JDK: 1.7.0_80 64-Bit Hadoop: 2.6.5 原理 <权威指南>有两张图,下次po上来好好聊一下实测读操作 ...
java编程思想-基础
interface: 方法默认为public:成员变量默认 static and final 对象数组的定义:理解? 多接口继承:可以多个接口,但只有一个具体类,具体类在前面自:多接口继承时,来自不 ...
[置顶] Hadoop2.2.0中HDFS的高可用性实现原理
在Hadoop2.0.0之前,NameNode(NN)在HDFS集群中存在单点故障(single point of failure),每一个集群中存在一个NameNode,如果NN所在的机器出现了故障 ...
Hadoop系列-HDFS基础
基本原理 HDFS(Hadoop Distributed File System)是Hadoop的一个基础的分布式文件系统,这个分布式的概念主要体现在两个地方: 数据分块存储在多台主机数据块采取冗余 ...

随机推荐

使用SolrNet访问Solr-5.5.0
由于今年年初刚发布的Solr-5.5.0,网上所能找到的资料少之又少,所以只能靠自己一点点摸索. 从某Hub上下载了SolrNet源码,按照教程提交文档或者查询均失败,无奈只得跟断点一点点差怎么回事. ...
tcp 大文件上传 ,切换目录及登陆文件加盐处理
实现大文件的传输服务器 import socketimport jsonimport structsk = socket.socket()sk.bind(("127.0.0.1" ...
Xshell使用
xshell更新之后窗口标题没了,多个窗口之后没法切换. 使用ctrl+shift+t恢复￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥
jap_spring
jar包 applicationContent.xml <?xml version="1.0" encoding="UTF-8"?> <bea ...
mvc框架路由原理
到目前为止已经使用过很多php框架,比如:Zendframework,ThinkPHP,YII,Slim.但还未静下心来研究过框架的原理. 今天首先来看一下mvc框架中路由的原理: 所谓路由,就是程序 ...
as3 根据鼠标移动方向
gz 为一个影片 import flash.display.Sprite; stage.addEventListener(MouseEvent.MOUSE_MOVE, onStageMouseMove ...
python中关键字的总结
python中各种关键字的总结:用表格形式,解释关键字符号的作用和案例说明关键字 ...
ios 缩放动画
CABasicAnimation *buttonAni = [CABasicAnimation animationWithKeyPath:@"transform.scale"]; ...
面试题-------SSL协议简介
SSL协议简介 SSL简介 Secure Socket Layer,为Netscape所研发,用以保障在Internet上数据传输之安全,利用数据加密(Encryption)技术,可确保数据在网络上之 ...
Java并发知识(1)
1. 进程和线程之间有什么不同? 一个进程是一个独立(self contained)的运行环境,它可以被看作一个程序或者一个应用.而线程是在进程中执行的一个任务.Java运行环境是一个包含了不同的类和 ...

HDFS高可用性及其分布式系统思想基础

HDFS高可用性及其分布式系统思想基础的更多相关文章

随机推荐

热门专题