HDFS HA(High Availability)高可用性

忠满cen 2024-08-19 06:02:25 原文

HDFS HA(High Availability)高可用性

参考文献：

官方文档

全文翻译

Hadoop组件之-HDFS(HA实现细节)

这张图片的个人理解

由于NameNode在Hadoop1只有一个节点，可能存在(SPOF)single point of file单节点故障。包括机器故障，软件硬件升级等。

在Hadoop2砍死你使用两台机器配置为NameNode，在任何时候，只有一个处于Active状态。为了保证两个NameNode节点的数据统一性，1：datanode同时向两个NameNode发送心跳和块报告；2：NameNode中磁盘存储的文件主要有镜像文件和编辑日志，通过JournalNode日志节点保证edits文件的可靠性。如下图：

![](http://images2015.cnblogs.com/blog/1047249/201707/1047249-20170709182235228-2073804790.png)
无ZKFC
![](http://images2015.cnblogs.com/blog/1047249/201707/1047249-20170710113906134-727438154.jpg)
有ZKFC
active的NameNode向JournalNode写如日志文件，standby的NameNode读取JournalNode中的数据，以达到编辑日志文件的同步。
通过Zookeeper的ZKFailoverContral来监控active的健康状态，一旦出现问题，安排Client访问第二个NameNode，从而实现熱备。

需要配置的四个地方（遵循官方文档即可）

1.share edits

	JournalNode

2.NameNode

	Active,Standby

3.Client

	Proxy代理(Zookper)

4.fence(篱笆)

	同一时刻仅有一个NameNode对外提供服务

	隔离方式：

		SSHfence:两个NameNode之间相互能够无密码登录

hdfs-site.xml

core-site.xml

启动HA

#1.在各个journalnode节点上启动journalNode服务

$ sbin/hadoop-daemon.sh start journalnode

#2.在nn1上对其进行格式化并启动

$ bin/hdfs namenode -format

$ sbin/hadoop-daemon.sh start namenode

#3.在nn2上同步nn1上的源数据

$ bin/hdfs namenode -bootstrapStandby

#4.在nn2上启动NameNode节点

$ sbin/hadoop-daemon.sh start namenode

#此时，两个节点都是standby状态

#5.将nn1节点的NameNode设置为activity

$ bin/hdfs haadmin -transitionToActive nn1

#获取状态

$ bin/hdfs haadmin -getServiceState nn1

#6.开启各个节点的DataNode

$ sbin/hadoop-deamon.sh start datanode

集群规划

123	124	125
NameNode	NameNode
ZKFC	ZKFC
JournalNode	JournalNode	JournalNode

不需要SecondaryNameNode，因为不会出现重启情况

Zookeeper用于自动故障转移

配置依据官方文档即可

启动带监控的HDFS HA服务器集群

#1.关闭所有hdfs服务

#2.启动ZK集群

$ bin/zkServer.sh start

#3.初始化HA在ZooKeeper中状态

$ bin/hdfs zkfc -formatZK

#4.启动HDFS文件系统，看到所有的NameNode节点上多了一个DFSZKFailoverController即zkfc启动成功

可以通过kill -9 1234来验证

HDFS HA(High Availability)高可用性的更多相关文章

第6章 HDFS HA配置
目录 6.1 hdfs-site.xml文件配置 6.2 core-site.xml文件配置 6.3 启动与测试 6.4 结合ZooKeeper进行自动故障转移在Hadoop 2.0.0之前,一个H ...
HDFS概述（5）————HDFS HA
HA With QJM 目标本指南概述了HDFS高可用性(HA)功能以及如何使用Quorum Journal Manager(QJM)功能配置和管理HA HDFS集群. 本文档假设读者对HDFS集群 ...
[转]HDFS HA 部署安装
1. HDFS 2.0 基本概念相比于 Hadoop 1.0,Hadoop 2.0 中的 HDFS 增加了两个重大特性,HA 和 Federaion.HA 即为 High Availability, ...
HDFS HA架构以及源代码引导
HA体系架构相关知识介绍 HDFS master/slave架构,HDFS节点分为NameNode节点和DataNode节点. NameNode存有HDFS的元数据:主要由FSImage和EditL ...
6，HDFS HA
目录 HDFS HA 一.HA(High Availability)的使用原因二.HA的同步三.HA的自动容灾 HDFS HA 一.HA(High Availability)的使用原因 1.1 在 ...
hadoop(二):hdfs HA原理及安装
早期的hadoop版本,NN是HDFS集群的单点故障点,每一个集群只有一个NN,如果这个机器或进程不可用,整个集群就无法使用.为了解决这个问题,出现了一堆针对HDFS HA的解决方案(如:Linux ...
【解决】HDFS HA无法自动切换问题
[解决]HDFS HA无法自动切换问题原因: 最早设置为root互相登录,可是zkfc服务是hdfs账号运行的,没有权限访问到root的id_rsa文件.更改为hdfs账号免密钥登录恢复正常. ...
Hadoop 学习笔记（十） hadoop2.2.0 生产环境部署 HDFS HA Federation 含Yarn部署
其他的配置跟HDFS-HA部署方式完全一样.但JournalNOde的配置不一样>hadoop-cluster1中的nn1和nn2和hadoop-cluster2中的nn3和nn4可以公用同样的 ...
Hadoop 学习笔记（九） hadoop2.2.0 生产环境部署 HDFS HA部署方法
step1:将安装包hadoop-2.2.0.tar.gz存放到某一个目录下,并解压 step2:修改解压后的目录中的文件夹/etc/hadoop下的xml配置文件(如果文件不存在,则自己创建) 包括 ...

随机推荐

Chrome浏览器安装vue-devtools插件
插件功能:方便在浏览器调试vue代码插件git地址:https://github.com/vuejs/vue-devtools 因为chrome要FQ,打不开,所以不能直接进去安装拓展程序,只能选择 ...
iDempiere 使用指南插件安装过程
Created by 蓝色布鲁斯,QQ32876341,blog http://www.cnblogs.com/zzyan/ iDempiere官方中文wiki主页 http://wiki.idemp ...
SQL Union和Union All使用方法
格式: [SQL 语句 1]UNION [SQL 语句 2] 对两个结果集进行并集操作,不包括重复行,同时进行默认规则的排序: select ID,NAME from A UNION select I ...
Jetty服务器的使用
Jetty 是一个开源的servlet容器,它为基于Java的web容器,例如JSP和servlet提供运行环境.Jetty是使用Java语言编写的,它的API以一组JAR包的形式发布.开发人员可以将 ...
JDK、JRE、javac和JVM的关系
.java为Java的源文件后缀,编写的代码需要写在.java文件中. Javac编译器,用于读取Java源代码,并将其编译成字节代码.经过javac编译后形成.class,是字节码文件. ...
Ajax使用初始化数据 + mvc
2017-3-16 mvc+jquery+easyUI做项目 <input type="text" id="txtSTQty" name="tx ...
JavaScript 常用的Math对象
Math.ceil(x); //返回x向上取整后的整数值. Math.floor(x); //返回x向下取整后的整数值.. Math.round(x); //返回四舍五入后的整数. Math.abs( ...
Html5 web本地存储
Web Storage是HTML5引入的一个非常重要的功能,可以在客户端本地存储数据,类似HTML4的cookie,但可实现功能要比cookie强大的多,cookie大小被限制在4KB,Web Sto ...
eplise一键集成工具
因为要做平台,后台的内容就由我负责,目前想让测试人员在本地使用eplise可以进行脚本开发,但是很多人都死在了搭建环境的道路上,那我就做了一键集成,点击就可以把所需要的配置项进行配置,总结:实际就 ...
clear：both；和overflow：hidden；的应用理解。
摘自cbwcwy 前辈: clear是子模块之间限定的,如下:<div id="a"> <div id="1"></div& ...