HDFS HA(High Availability)高可用性

忠满cen 2024-08-19 06:02:25 原文

HDFS HA(High Availability)高可用性

参考文献：

官方文档

全文翻译

Hadoop组件之-HDFS(HA实现细节)

这张图片的个人理解

由于NameNode在Hadoop1只有一个节点，可能存在(SPOF)single point of file单节点故障。包括机器故障，软件硬件升级等。

在Hadoop2砍死你使用两台机器配置为NameNode，在任何时候，只有一个处于Active状态。为了保证两个NameNode节点的数据统一性，1：datanode同时向两个NameNode发送心跳和块报告；2：NameNode中磁盘存储的文件主要有镜像文件和编辑日志，通过JournalNode日志节点保证edits文件的可靠性。如下图：

![](http://images2015.cnblogs.com/blog/1047249/201707/1047249-20170709182235228-2073804790.png)
无ZKFC
![](http://images2015.cnblogs.com/blog/1047249/201707/1047249-20170710113906134-727438154.jpg)
有ZKFC
active的NameNode向JournalNode写如日志文件，standby的NameNode读取JournalNode中的数据，以达到编辑日志文件的同步。
通过Zookeeper的ZKFailoverContral来监控active的健康状态，一旦出现问题，安排Client访问第二个NameNode，从而实现熱备。

需要配置的四个地方（遵循官方文档即可）

1.share edits

	JournalNode

2.NameNode

	Active,Standby

3.Client

	Proxy代理(Zookper)

4.fence(篱笆)

	同一时刻仅有一个NameNode对外提供服务

	隔离方式：

		SSHfence:两个NameNode之间相互能够无密码登录

hdfs-site.xml

core-site.xml

启动HA

#1.在各个journalnode节点上启动journalNode服务

$ sbin/hadoop-daemon.sh start journalnode

#2.在nn1上对其进行格式化并启动

$ bin/hdfs namenode -format

$ sbin/hadoop-daemon.sh start namenode

#3.在nn2上同步nn1上的源数据

$ bin/hdfs namenode -bootstrapStandby

#4.在nn2上启动NameNode节点

$ sbin/hadoop-daemon.sh start namenode

#此时，两个节点都是standby状态

#5.将nn1节点的NameNode设置为activity

$ bin/hdfs haadmin -transitionToActive nn1

#获取状态

$ bin/hdfs haadmin -getServiceState nn1

#6.开启各个节点的DataNode

$ sbin/hadoop-deamon.sh start datanode

集群规划

123	124	125
NameNode	NameNode
ZKFC	ZKFC
JournalNode	JournalNode	JournalNode

不需要SecondaryNameNode，因为不会出现重启情况

Zookeeper用于自动故障转移

配置依据官方文档即可

启动带监控的HDFS HA服务器集群

#1.关闭所有hdfs服务

#2.启动ZK集群

$ bin/zkServer.sh start

#3.初始化HA在ZooKeeper中状态

$ bin/hdfs zkfc -formatZK

#4.启动HDFS文件系统，看到所有的NameNode节点上多了一个DFSZKFailoverController即zkfc启动成功

可以通过kill -9 1234来验证

HDFS HA(High Availability)高可用性的更多相关文章

第6章 HDFS HA配置
目录 6.1 hdfs-site.xml文件配置 6.2 core-site.xml文件配置 6.3 启动与测试 6.4 结合ZooKeeper进行自动故障转移在Hadoop 2.0.0之前,一个H ...
HDFS概述（5）————HDFS HA
HA With QJM 目标本指南概述了HDFS高可用性(HA)功能以及如何使用Quorum Journal Manager(QJM)功能配置和管理HA HDFS集群. 本文档假设读者对HDFS集群 ...
[转]HDFS HA 部署安装
1. HDFS 2.0 基本概念相比于 Hadoop 1.0,Hadoop 2.0 中的 HDFS 增加了两个重大特性,HA 和 Federaion.HA 即为 High Availability, ...
HDFS HA架构以及源代码引导
HA体系架构相关知识介绍 HDFS master/slave架构,HDFS节点分为NameNode节点和DataNode节点. NameNode存有HDFS的元数据:主要由FSImage和EditL ...
6，HDFS HA
目录 HDFS HA 一.HA(High Availability)的使用原因二.HA的同步三.HA的自动容灾 HDFS HA 一.HA(High Availability)的使用原因 1.1 在 ...
hadoop(二):hdfs HA原理及安装
早期的hadoop版本,NN是HDFS集群的单点故障点,每一个集群只有一个NN,如果这个机器或进程不可用,整个集群就无法使用.为了解决这个问题,出现了一堆针对HDFS HA的解决方案(如:Linux ...
【解决】HDFS HA无法自动切换问题
[解决]HDFS HA无法自动切换问题原因: 最早设置为root互相登录,可是zkfc服务是hdfs账号运行的,没有权限访问到root的id_rsa文件.更改为hdfs账号免密钥登录恢复正常. ...
Hadoop 学习笔记（十） hadoop2.2.0 生产环境部署 HDFS HA Federation 含Yarn部署
其他的配置跟HDFS-HA部署方式完全一样.但JournalNOde的配置不一样>hadoop-cluster1中的nn1和nn2和hadoop-cluster2中的nn3和nn4可以公用同样的 ...
Hadoop 学习笔记（九） hadoop2.2.0 生产环境部署 HDFS HA部署方法
step1:将安装包hadoop-2.2.0.tar.gz存放到某一个目录下,并解压 step2:修改解压后的目录中的文件夹/etc/hadoop下的xml配置文件(如果文件不存在,则自己创建) 包括 ...

随机推荐

使用swagger时遇到的问题
后端写好接口后开始和前端进行联调,为了减少时间成本或者说是后端不想写文档,所以便想使用一套可以自动化生成api接口文档的工具,swagger正是可以解决这一需求.于是很早之前就想把swagger集成到 ...
c\c++数据类型存储
C四个 C++五个一. 在c中分为这几个存储区 1.栈 - 由编译器自动分配释放 2.堆 - 一般由程序员分配释放,若程序员不释放,程序结束时可能由OS回收 3.全局区(静态区),全局变量和静态变量 ...
WebRTC协议
webrtc协议介绍 MDN webrtc协议 ICE 交互式连接建立Interactive Connectivity Establishment (ICE) 是一个允许你的浏览器和对端浏览器建立连接 ...
ABAP和Java SpringBoot的单元测试
ABAP 在ABAP类里,本地类(Local Class)里用关键字FOR TESTING声明过的方法, 在单元测试启动后会自动被调用到. Spring Boot 在Spring及Spring Boo ...
python 爬poj.org的题目
主要是正则表达式不熟练,基础知识不扎实,函数也不怎么会用,下次再深入了解这3个函数吧. 主要是一个翻页的功能,其实,就是通过一个url替换一下数字,然后得到一个新的url,再找这个新的链接的信息. # ...
react里面引入图片
引入图片确实走了很多的坑,开始的认知里,所有静态页面都需要放在public里面能执行,代码是这样的 css .back{ background-image: url('/images/homeBack ...
抽象类和final
抽象类: 概念:在继承过程中,形成一个继承金字塔,位于金字塔底部的类越来越具体(强大),位于塔顶的越来越抽象(简单). 关键字 :abstract 抽象类特性: [1]抽象类过于抽象,实例化后无语义 ...
编译安装 mysql 5.5,运行 cmake报错Curses library not found
是因为 curses库没有安装,执行下面的语句即可 yum -y install ncurses-devel 如果上述命令的结果是no package,则使用下面的命令安装 apt-get insta ...
PHP获取当前页面完整路径URL
//PHP获取当前页面完整路径URL 1 <?php function getFullUrl(){ # 解决通用问题 $requestUri = ''; if (isset($_SERVER[' ...
P1774 最接近神的人_NOI导刊2010提高（02）
P1774 最接近神的人_NOI导刊2010提高(02) 关于此题为什么可以使用求逆序对的方法来做假设一个数\(a_i\),且前\(i-1\)个数已经成为单调增的数列. 我们要从前\(a_1\)至\ ...