HDFS---NameNode管理元数据及HA模式

NameNode主要保存了下面的内容

1-维护元数据信息。Block和文件之间的关系，即某一个特定文件都有哪些Block；

2-每一个Block存储在什么位置（DataNode上面）；

3-维护HDFS上面虚拟的目录树；

4-响应客户端的请求；

NameNode如何保证元数据的可靠性

fsimage 和内存中保存的元数据互为镜像；

edits.log中存储了一段时间内所有的元数据操作；edits.log文件大小是固定的（默认是64M），那么每当edits.log文件满了，那么将这段时间之内新产生的元数据加到fsimage中，注意这个过程不是直接在内存中持久化，而是将edits.log文件和fsiamge进行合并；由于这个合并操作会占用一定的cpu和内存资源，所以合并操作是在secondaryNameNode上面进行的。在合并期间所产生的元数据操作记录都保存在edits.new文件中，即下图的第3步。

1-客户端上传文件时，NN首先给edits.log文件中记录数据操作日志；

2-客户端得到NN返回的DN的位置，开始上传文件，完成之后返回成功信息给NN，NN就在内存中写入这次上传操作的新产生的元数据信息，并且将操作内容持久化到edits.log文件中；

3-知道edit.log文件被写满，那么开始合并；

Secondar要namenode工作流程；

1-secondary namenode通知namenode切换edits文件；

2-secondary namenode 通知namenode获得fsimage和edits文件（通过http）；

3-secondary namenode通过将fsimage载入内存、然后开始合并edits；

4-secondary namenode将新的image发回给namenode；

5-namenode用新的fsimage替换就得fsimage文件；

什么时候checkpoint

1-通过配置项fs.checkpoint.period执行两次checkpoint的最大时间间隔，默认是3600；

2fs.checkpoint.size 指定edits文件的最大值，一旦超过这个最大阈值，那么就会强制触发checkpoint，无论是不是是达到最大的时间间隔。默认的大小是64M

NameNode HA模式

待续。。。。

HDFS---NameNode管理元数据及HA模式的更多相关文章

HDFS中NameNode管理元数据机制
NameNode职责响应客户端请求维护目录树管理元数据(查询,修改) HDFS元数据存储内存中有一份完整的元数据(特定数据结构) 磁盘有一个“准完整”的元数据的镜像文件当客户端对HDFS中的 ...
HDFS namenode 高可用（HA）搭建指南 QJM方式 ——本质是多个namenode选举master，用paxos实现一致性
一.HDFS的高可用性 1.概述本指南提供了一个HDFS的高可用性(HA)功能的概述,以及如何配置和管理HDFS高可用性(HA)集群.本文档假定读者具有对HDFS集群的组件和节点类型具有一定理解.有 ...
HA模式下的java api访问要点
在非HA架构的HDFS中,客户端要通过java接口调用HDFS时一般是在JobRunner的类中按照下面的方式: 因为nodename只有一个节点所以会在代码中显式的指明要连接哪一个节点:但是在HA模 ...
hadoop hdfs ha 模式
这是我自己在公司一个搭建公司大数据框架是自己的选项,在配置yarn ha 出现了nodemanager起不来的问题于是我把yarn搭建为普通yarn 如果有人解决高yarn的nodemanager问 ...
HDFS NameNode HA 部署文档
简介: HDFS High Availability Using the Quorum Journal Manager Hadoop 2.x 中,HDFS 组件有三个角色:NameNode.DataN ...
hdfs、zookeepeer之HA模式
HA简介 1.所谓HA,即高可用(high available) 2.消除单点故障,避免集群瘫痪,hdfs中namenode保存了整个集群的元数据,如果namenode所在机器宕机,则整个集群瘫痪,H ...
一脸懵逼学习Hadoop分布式集群HA模式部署（七台机器跑集群）
1)集群规划:主机名 IP 安装的软件运行的进程master 192.168.199.130 jdk.hadoop ...
[hadoop][会装]hadoop ha模式安装
1.简介 2.X版本后namenode支持了HA特性,使得整个文件系统的可用性更加增强. 2.安装前提 zookeeper集群,zookeeper的安装参考[hadoop][会装]zookeeper安 ...
大数据技术之Hadoop3.1.2版本HA模式
大数据技术之Hadoop3.1.2版本HA模式作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.Hadoop的HA特点 1>.主备NameNode 2>.解决单点故障 ...

随机推荐

【树形DP】洛谷P2585 [ZJOI2006] 三色二叉树
[树形DP]三色二叉树标签(空格分隔): 树形DP [题目] 一棵二叉树可以按照如下规则表示成一个由0.1.2组成的字符序列,我们称之为"二叉树序列S": 0 该树没有子节点 1 ...
一文了解HAProxy主要特性
本文转自Rancher Labs 在Kubernetes中,Ingress对象定义了一些路由规则,这些规则规定如何将一个客户端请求路由到指定服务,该服务运行在你的集群中.这些规则可以考虑到输入的HTT ...
大型Java进阶专题(七) 设计模式之委派模式与策略模式
前言今天开始我们专题的第七课了.本章节将介绍:你写的代码中是否觉得很臃肿,程序中有大量的if...else,想优化代码,精简程序逻辑,提升代码的可读性,这章节将介绍如何通过委派模式.策略模式让你 ...
java 面向对象（二十五）：内部类：类的第五个成员
内部类:类的第五个成员 1.定义: Java中允许将一个类A声明在另一个类B中,则类A就是内部类,类B称为外部类.2.内部类的分类:成员内部类(静态.非静态 ) vs 局部内部类(方法内.代码块内.构 ...
redis入门指南（五）—— 复制与哨兵
写在前面学习<redis入门指南>笔记,结合实践,只记录重要,明确,属于新知的相关内容. 一.复制 1.在复制中,数据库分为两类,一类主数据库,一类从数据库,主库用来读写,从库用来读,主 ...
OSCP Learning Notes - Buffer Overflows(1)
Introduction to Buffer Overflows Anatomy of Memory Anatomy of the Stack Fuzzing Tools: Vulnserver - ...
Python Ethical Hacking - BACKDOORS(2)
Refactoring - Creating a Listener Class #!/usr/bin/env python import socket class Listener: def __in ...
P.SDA1.DEV - 一个没有服务器的图床
图床特色 P.SDA1.DEV的愿景是为大家提供一个免费.长期稳定外链分享图片的选择. P.SDA1.DEV的主要特点有: 完全建构在Serverless云服务上,致力于提供(墙外)可用性99.9%的 ...
Makefile中的奇葩字符
% : Makefile规则通配符,一般出现在目标或是依赖中 * : shell命令中的通配符,一般出现在命令中 $@:目标的名字 $^:所有依赖的名字 $<:第一个依赖的名字 $?:所有依赖中 ...
题解洛谷 P4171 【[JSOI2010]满汉全席】
考虑$2-SAT$. 将汉式看作$0$状态,满式看做$1$状态,将每个材料拆成$01$两个状态. 从$a$向$b$连有向边表示的意义为选了$a$后必须选$b$. 那么每 ...

HDFS---NameNode管理元数据及HA模式

HDFS---NameNode管理元数据及HA模式的更多相关文章

随机推荐

热门专题