Hadoop 2.x 之 HA 简介

HA结构图

HA是用来解决单点故障问题

DN: DataNode，启动时会往所有的NameNode汇报
NN: NameNode(主 Active(一个) 备 Standby(可以有多个))
JournalNodes:JournalNodes就是用来存储元数据的,是一个集群，节点数量必须为奇数个。
- 如果主NameNode的元数据存在本地磁盘中的fsimage及edits文件中，如果主挂掉了，那么备用NameNode将无法从主NameNode获取元数据文件，所以元数据文件不能存储在主NameNode的本地了，而是存储在JournalNodes中
- 所有的NameNode，不管是主还是备，读写元数据都是在JournalNodes中进行的。
- 主NameNode 挂掉后，备NameNode自动从JournalNodes中加载到元数据，然后进行工作。
FailoverController: 控制NameNode切换的一个服务，还对NameNode进行心跳检查，判断是否挂掉，挂掉后要切换到另外一个NameNode
ZooKeeper:主要工作是做高可用，任何一个服务的高可用都可以用ZooKeeper来做，节点数量必须为奇数个
- 客户端不指定IP地址访问NameNode，客户端去请求ZooKeeper，ZooKeeper知道哪个NameNode是Active的，然后ZooKeeper返回给客户端真正工作的NameNode
- 自动：ZooKeeper会对所有的NameNode进行心跳检测，检测有没有挂掉，可通过FailoverController对NameNode进行切换
- 手动：正常情况下，如果想对某个Active NameNode进行修改配置，可手动将其闲置下来，变成Standby,将另一个Standby的NameNode变成Active

HA优点

主备NameNode
解决单点故障
- 主NameNode对外提供服务，备NameNode同步主NameNode元数据，以待切换
- 所有DataNode同时向两个NameNode汇报数据块信息
两种切换选择
- 手动切换：通过命令实现主备之间的切换，可以用HDFS升级等场合
- 自动切换：基于ZooKeeper实现
基于ZooKeeper自动切换方案
- ZooKeeper FailoverController : 监控NameNode健康状态
- 并向Zookeeper注册NameNode
- NameNode挂掉后，ZKFC为NameNode竞争锁，获得ZKFC锁的NameNode变为active

主NameNode挂掉后，Standby竞争锁，每个NameNode对应的FailoverController在Zookeeper上竞争锁，获得锁之后就可以把该NameNode变成Active了
任何一个NameNode都要对应一个FailoverController
Zookeeper必须是奇数个，否则将不会得到一个锁，Zookeeper内部使用的是一个投票机制，竞争锁算法用的是投票机制

NFS网络文件系统（了解）

NFS 网络文件系统，相当于一个共享目录，找一台机器专门共享文件，让所有NameNode读写元数据都在那台共享机器上操作，读写在共享的目录中。（也会有单点故障问题）

Hadoop 2.x 之 HA 简介的更多相关文章

Hadoop 2.0 NameNode HA和Federation实践【转】
Hadoop 2.0 NameNode HA和Federation实践 Posted on 2012/12/10 一.背景天云趋势在2012年下半年开始为某大型国有银行的历史交易数据备份及查询提供基 ...
攻城狮在路上（陆）-- hadoop分布式环境搭建(HA模式)
一.环境说明: 操作系统:Centos6.5 Linux node1 2.6.32-431.el6.x86_64 #1 SMP Fri Nov 22 03:15:09 UTC 2013 x86_64 ...
Hadoop 2.2.0 HA构造
在这篇文章中<Ubuntu和CentOS分布式配置Hadoop-2.2.0>介绍hadoop 2.2.0最主要的配置.hadoop 2.2.0中提供了HA的功能,本文在前文的基础上介绍ha ...
菜鸟玩云计算之十九：Hadoop 2.5.0 HA 集群安装第2章
菜鸟玩云计算之十九:Hadoop 2.5.0 HA 集群安装第2章 cheungmine, 2014-10-26 在上一章中,我们准备好了计算机和软件.本章开始部署hadoop 高可用集群. 2 部署 ...
菜鸟玩云计算之十八：Hadoop 2.5.0 HA 集群安装第1章
菜鸟玩云计算之十八:Hadoop 2.5.0 HA 集群安装第1章 cheungmine, 2014-10-25 0 引言在生产环境上安装Hadoop高可用集群一直是一个需要极度耐心和体力的细致工作 ...
Hadoop 3.1.2(HA)+Zookeeper3.4.13+Hbase1.4.9(HA)+Hive2.3.4+Spark2.4.0(HA)高可用集群搭建
目录目录 1.前言 1.1.什么是 Hadoop? 1.1.1.什么是 YARN? 1.2.什么是 Zookeeper? 1.3.什么是 Hbase? 1.4.什么是 Hive 1.5.什么是 Sp ...
Hadoop集群搭建-HA高可用（手动切换模式）（四）
步骤和集群规划 1)保存完全分布式模式配置 2)在full配置的基础上修改为高可用HA 3)第一次启动HA 4)常规启动HA 5)运行wordcount 集群规划: centos虚拟机:node-00 ...
Hadoop生态圈-Ambari控制台功能简介
Hadoop生态圈-Ambari控制台功能简介作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 在经历一系列安装过程之后(部署过HDP后我终于发现为什么大家喜欢用它了,部署比CDH简 ...
一脸懵逼学习Hadoop分布式集群HA模式部署（七台机器跑集群）
1)集群规划:主机名 IP 安装的软件运行的进程master 192.168.199.130 jdk.hadoop ...

随机推荐

java学习笔记——java中对象的创建，初始化，引用的解析
如果有一个A类. 1.例如以下表达式: A a1 = new A(); 那么A是类,a1是引用.new A()是对象.仅仅是a1这个引用指向了new A()这个对象. 2.又如: A a2; A代 ...
我的_vimrc文件
""""""""""""""""&quo ...
mybatis 单一参数时的动态语句
public void getBookList(String publisher,String author){ Map<String,Object> maps = new HashMap ...
排序算法 python
1.先写个原始数组和测试算法是否正确,输出多次,方便计算算法运算的平均值 2.开始第一个最简单的冒泡排序 3.“”选择排序“”,跟冒泡很像,每次选最大/最小,放进新list中. 3.1发现测试test ...
spring+struts1
概括及介绍: 集成原理:在Action 中获得BeanFactory,通过BeanFactory取得业务逻辑对象本例采用:JDK1.8,tomcat7.0.9 技术点:spring与strut1集 ...
<转载> 为什么在Python里推荐使用多进程而不是多线程？
经常我们会听到老手说:“Python下多线程是鸡肋,推荐使用多进程!”,但是为什么这么说呢? 要知其然,更要知其所以然.所以有了下面的深入研究: 首先强调背景: ...
E - What Is Your Grade?
E - What Is Your Grade? Time Limit:1000MS Memory Limit:32768KB 64bit IO Format:%I64d & % ...
java对IO的操作
import java.io.*; public class HelloWorld { //Main method. public static void main(String[] args) { ...
为什么要对url进行encode
发现现在几乎所有的网站都对url中的汉字和特殊的字符,进行了urlencode操作,也就是: http://hi.baidu.com/%BE%B2%D0%C4%C0%CF%C8%CB/creat/bl ...
vue表单输入的绑定
vue的核心:声明式的指令和数据的双向绑定. 那么声明式的指令,已经给大家介绍完了.接下来我们来研究一下什么是数据的双向绑定? 另外,大家一定要知道vue的设计模式:MVVM M是Model的简写,V ...