Hdfs的HA高可用

打怪up 2024-08-22 15:47:27 原文

1、Hdfs的HA高可用：保证Hdfs高可用，其实就是保证namenode的高可用，保证namenode的高可用的机制有两个，editlog共享机制+ZKFC。ZKFC就是ZookeeperFailOverController，即zookeeper故障转移控制器。

2、nameNode的高可用机制：

（1）nameNode想要实现高可用，意味着集群中要存在多个nameNode，在nameNode出现故障的时候，能够进行快速切换。集群中平时只有一个nameNode在工作，这个nameNode就是active的，而其他nameNode是standby的。

（2）为了保证nameNode出现故障的时候，nameNode的切换速度。active nameNode将信息写入共享编辑日志文件，standby nameNode则读取共享文件，从而保持与active nameNode的同步。

（3）此外，集群中的dataNode要向所有的nameNode发送数据块处理报告。

（4）故障切换这个动作就需要ZKFC来保证，每个nameNode中都运行着一个ZKFC故障转移控制器，用于监视nameNode进程。而这个ZKFC是基于Zookeeper实现的，在启动的时候，会创建HealthMonitor和ActiveStandbyElector这两个组件，创建的同时，ZKFC也会向这两个组件中注册相应的回调方法。

（5）HealthMonitor初始化完成后会启动内部线程来定时调用nameNode的HAServiceProtocol Rpc接口，对nameNode进行健康监测。

（6）HealthMonitor如果检查到nameNode的健康状态发生了变化，就会回调ZKFC注册的相应方法进行处理。

（7）如果ZKFC经过判断后，认为需要进行主备切换话，会首先使用ActiveStandbyElector来进行自动的主备选举。

（8）ActiveStandbyElector完成了自动的主备选举后，会回调ZKFC的相应方法，通知相应的nameNode成为主nameNode或者备nameNode。

（9）ZKFC调用相应nameNode的HAServiceProtocol Rpc接口方法，将相应的nameNode设置成active或者standby。

3、Fencing实现：脑裂就是nameNode假死，Fencing就是防御脑裂。Hadoop公共库对外提供了两种Fencing实现，分别是sshfence和shellfence（缺省实现）。其中sshfence就是通过ssh登陆到目标nameNode节点上，用kill命令将其进程杀死；shellfence就是执行自定义的shell脚本。

4、如何判断是否发生了脑裂：判断持久化节点是否存在，持久化节点存在就是脑裂。

Hdfs的HA高可用的更多相关文章

Hadoop HA高可用集群搭建（Hadoop+Zookeeper+HBase）
声明:作者原创,转载注明出处. 作者:帅气陈吃苹果一.服务器环境主机名 IP 用户名密码安装目录 master188 192.168.29.188 hadoop hadoop /home/ha ...
Hadoop 3.1.2(HA)+Zookeeper3.4.13+Hbase1.4.9(HA)+Hive2.3.4+Spark2.4.0(HA)高可用集群搭建
目录目录 1.前言 1.1.什么是 Hadoop? 1.1.1.什么是 YARN? 1.2.什么是 Zookeeper? 1.3.什么是 Hbase? 1.4.什么是 Hive 1.5.什么是 Sp ...
CentOS7+Hadoop2.7.2(HA高可用+Federation联邦)+Hive1.2.1+Spark2.1.0 完全分布式集群安装
1 2 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 2.9.1 2.9.2 2.9.2.1 2.9.2.2 2.9.3 2.9.3.1 2.9.3.2 2.9.3.3 2. ...
hadoop 集群HA高可用搭建以及问题解决方案
hadoop 集群HA高可用搭建目录大纲 1. hadoop HA原理 2. hadoop HA特点 3. Zookeeper 配置 4. 安装Hadoop集群 5. Hadoop HA配置搭建环 ...
大数据Hadoop的HA高可用架构集群部署
1 概述在Hadoop 2.0.0之前,一个Hadoop集群只有一个NameNode,那么NameNode就会存在单点故障的问题,幸运的是Hadoop 2.0.0之后解决了这个问题,即支持N ...
HA 高可用集群概述及其原理解析
HA 高可用集群概述及其原理解析 1. 概述 1)所谓HA(High Available),即高可用(7*24小时不中断服务). 2)实现高可用最关键的策略是消除单点故障.HA严格来说应该分成各个组件 ...
大数据技术之HA 高可用
HDFS HA高可用 1.1 HA概述 1)所谓HA(High Available),即高可用(7*24小时不中断服务). 2)实现高可用最关键的策略是消除单点故障.HA严格来说应该分成各个组件的HA ...
Spark入门：第2节 Spark集群安装：1 - 3；第3节 Spark HA高可用部署：1 - 2
三. Spark集群安装 3.1 下载spark安装包下载地址spark官网:http://spark.apache.org/downloads.html 这里我们使用 spark-2.1.3-bi ...
Flink 集群搭建,Standalone,集群部署,HA高可用部署
基础环境准备3台虚拟机配置无密码登录配置方法:https://ipooli.com/2020/04/linux_host/ 并且做好主机映射. 下载Flink https://www.apach ...

随机推荐

[转帖]ARM A77+G77最强公版架构：联发科5G SoC计划11月26日发布
ARM A77+G77最强公版架构:联发科5G SoC计划11月26日发布 https://www.cnbeta.com/articles/tech/909025.htm 主流的手机SoC厂商已经纷纷 ...
顶级Apache Kafka术语和概念
1.卡夫卡术语基本上,Kafka架构包含很少的关键术语,如主题,制作人,消费者, 经纪人等等.要详细了解Apache Kafka,我们必须首先理解这些关键术语.因此,在本文“Kafka术语”中, ...
JZOJ
题目: 三类动物A.B.C,A吃B,B吃C,C吃A.给出K句话来描述N个动物(各属于A.B.C三类之一)之间的关系,格式及意义如下:1 X Y:表示X与Y是同类: 2 X Y:表示X吃Y.K句话中有真 ...
R学习笔记3 数据处理
1,日期类型日期类型比较特殊,日期值通常以字符串的形式输入到R中,然后使用as.Date()函数转换为以数值形式存储的日期变量 mydate <- as.Date("2019-01- ...
mysql_select 单表查询
select * *代表全部查询多个字段 select 字段1,字段2,字段3 聚合函数 count(*) 统计 select count(*) ...
Selenium_css 元素定位
1.通过id定位 # 代表id driver.find_element_by_css_selector("#kw").send_keys("hao" ...
【题解】Luogu P5398 [Ynoi2018]GOSICK
原题传送门二次离线莫队二次离线莫队的做法参考第十四分块(前体)的题解我们需要考虑从(1,i)如何推到(1,i+1) 我们算过了a[i]的答案,考虑加入a[i]的贡献我们需要在a[i]的所有约数 ...
Unity项目 - MissionDemolition 愤怒的小鸟核心机制
目录游戏原型项目演示绘图资源代码实现注意事项技术探讨参考来源游戏原型爆破任务 MissionDemolition 是一款核心机制类似于愤怒的小鸟的游戏,玩家将用弹弓发射炮弹,摧毁城堡 ...
python-django框架中使用docker和elasticsearch配合实现搜索功能
注意:系统环境为Ubuntu18 一.docker安装 0:如果之前有安装过docker使用以下命令卸载: sudo apt-get remove docker docker-engine docke ...
并发编程之Callable异步，Future模式
Callable 在Java中,创建线程一般有两种方式,一种是继承Thread类,一种是实现Runnable接口.然而,这两种方式的缺点是在线程任务执行结束后,无法获取执行结果.我们一般只能采用共享变 ...