NameNode和SecondaryNameNode(了解)

NameNode和SecondaryNameNode(了解)

NN 和 2NN 工作机制

问题1：NN的元数据存储在内存中还是磁盘中?

存储点	好处	坏处
内存	计算快	可靠性差
磁盘	可靠性高	计算速度慢

总和两者的好处，采用内存加磁盘的存储方式存储，磁盘中备份元数据Fslmage镜像文件。

如果内存中计算出结果之后，写入磁盘中，效率过低。引入了Edits编辑日志。

三个地方存储的内容

Fsimage：NameNode内存中元数据序列化后形成的文件。

Edits：记录客户端更新元数据信息的每一步操作（可通过Edits运算出元数据）。

内存中有的数据=fslmage镜像文件的数据+Edits的操作

服务器一启动将 fslmage镜像文件的数据+Edits的操作的结果加载到内存。因此，需要定期进行 FsImage 和 Edits 的合并，引入一个新的节点SecondaryNamenode，协助nn在过程中 FsImage 和 Edits 的合并。

NameNode工作机制

1.第一次启动 NameNode 格式化后，创建 Fsimage镜像文件、和 Edits编辑日志文件edits_inprogress_001。如果不是第一次启动，直接加载编辑日志和镜像文件到内存。

2.客户端对元数据访问,如增删改请求。

3.记录操作日志、更新滚动日志。

4.NameNode 在内存中对元数据进行增删改。

Secondary NameNode

1.Secondary NameNode 询问 NameNode 是否需要 CheckPoint，直接带回 NameNode是否检查结果。

问题1:多久询问一次NameNode，checkPoint触发条件。

①定时时间到了，默认一个小时

②Edits中的数据满了

2.Secondary NameNode 请求执行 CheckPoint。

3.NameNode 滚动正在写的Edits日志。

问题2:怎么滚动的？

edits滚动生成一个新的edits.inprogress文件edits_inprogress_002。原来的edits_inprogress_001修改名称为edits_001,之后的操作都记录在edits_inprogress_002。

4.将edits_001和镜像文件fsimage拷贝到Secondary NameNode。

5.Secondary NameNode 加载编辑日志edits_001和镜像文件到内存。

6.合并生成新的镜像文件fsimage.chkpoint。

7.拷贝 fsimage.chkpoint 到 NameNode。

8.NameNode 将 fsimage.chkpoint 重新命名成 fsimage。

下次启动就将新的fsimage和edits_inprogress_002的内容加在一起就是最新的元数据。

Fsimage 和 Edits 解析

NameNode服务器在hadoop102，在NameNode目录下有Fsiamge和Edits文件，NameNode目录/opt/module/hadoop-3.1.3/data/dfs/name/current。

Secondary NameNode服务器在hadoop104，Secondary NameNode目录/opt/module/hadoop-3.1.3/data/dfs/namesecondary/current/

NameNode比Secondary NameNode多一个edits_inprogress_xxxx，最新的操作

NameNode在格式化(初始化)之后，会在/opt/module/hadoop-3.1.3/data/dfs/name/current目录中产生如下文件

oiv查看 Fsimage 文件

oiv和oev查看命令

oiv 查看Fsiamge文件

oev 查看Edits文件

基本语法

dfs oiv -p 文件类型 -i 镜像文件 -o 转换后文件输出路径

正常通过cat看镜像文件看不了，全是乱码，需要通过-p把镜像文件转换成其他格式，输出在其他路径下。

案例

[ranan@hadoop102 current]$ hdfs oiv -p XML -i fsimage_0000000000000000363 -o /opt/software/fsimage.xml

将fsimage.xml下载到桌面，SecureCRT设置默认下载/上传路径

[ranan@hadoop102 software]$ sz fsimage.xml

fsimage.xml文件内容理解

引用文章

文件组成

<INodeDirectorySection>

	<inode> ... </inode>

	<inode> ... </inode>

</INodeDirectorySection>

<INodeDirectorySection>..</INodeDirectorySection>

<INodeDirectorySection>..</INodeDirectorySection>

主要内容

<inode>

    <id>16417</id>

    <type>FILE</type>         ------ 文件类型：常规文件（如果是文件夹则为 'DIRECTORY'）

    <name>b.xml</name> 　　    ----- 文件名

    <replication>3</replication> --- 副本数

    <mtime>1603342078483</mtime> --- 创建时间

    <atime>1603342078253</atime> --- 修改时间

    <perferredBlockSize>134217728</perferredBlockSize> --- 块大小

    <permission>ranan:supergroup:rw-r--r--</permission> --- 权限

    <blocks>                                          ---- 被切成了几个块

        <block>                                       ---- 第一个块

            <id>1073741836</id>     ----- 块的id

            <genstamp>1013</genstamp> --- 块的时间戳

            <numBytes>313</numBytes>  --- 块中存放的数据的大小（该文件只有一个块，该大小即为文件大小）

        </block>

    </blocks>

</inode>

问题：Fsimage 中没有记录块所对应 DataNode，为什么？

在集群启动后，要求 DataNode 上报数据块信息，并间隔一段时间后再次上报。

oev查看Edits文件

基本语法

dfs oev -p 文件类型 -i 日志文件 -o 转换后文件输出路径

正常通过cat看镜像文件看不了，全是乱码，需要通过-p把镜像文件转换成其他格式，输出在其他路径下。

案例

[ranan@hadoop102 current]$ hdfs oev -p XML -i edits_inprogress_0000000000000000400 -o /opt/software/edits.xml

将edits.xml下载到桌面

[ranan@hadoop102 software]$ sz edits.xml

edits.xml文件内容理解

引用文章

文件组成

一个edits文件记录了一次写文件的过程，该过程被分解成多个部分进行记录；（每条记录在hdfs中有一个编号）

<RECORD>    ---一个部分

<OPCODE> ... </OPCODE>

<DATA> ... </DATA>

</RECORD>

<RECORD>    ---一个部分

<OPCODE> ... </OPCODE>

<DATA> ... </DATA>

</RECORD>

文件内容理解，写入a.xml

1.文件首<OPCODE>OP_START_LOG_SEGMENT</OPCODE>

<RECORD>

    <OPCODE>OP_START_LOG_SEGMENT</OPCODE>   --- 表示对一次写操作记录的开始

    <DATA>

      <TXID>138</TXID>               ---------- HDFS的第138号记录

    </DATA>

</RECORD>

2.写入临时文件夹 <OPCODE>OP_ADD</OPCODE>

写入 'a.xml' 文件的过程中，会先将文件写到临时文件a.xml._COPYING_中，最后再将该文件重命名后存放到DN；

<RECORD>

    <OPCODE>OP_ADD</OPCODE>     ------------- 写文件操作

    <DATA>

      <TXID>139</TXID>       ---------------- HDFS的第139号记录

      <LENGTH>0</LENGTH>

      <INODEID>16416</INODEID>

      <PATH>/a.xml._COPYING_</PATH>       --- 写'a.xml'文件的过程中生成临时文件'a.xml._COPYING'

      <REPLICATION>3</REPLICATION>        --- 副本数

      <MTIME>1603341874966</MTIME>        --- 创建时间

      <ATIME>1603341874966</ATIME>        --- 修改时间

      <BLOCKSIZE>134217728</BLOCKSIZE>    --- 文件块的大小：128M

      <CLIENT_NAME>DFSClient_NONMAPREDUCE_-1327338057_1</CLIENT_NAME>   ---- 来源哪个客户端

      <CLIENT_MACHINE>192.168.10.102</CLIENT_MACHINE>        --------------- 通过哪个机器上传的

      <OVERWRITE>true</OVERWRITE>                            --------------- 是否允许被覆盖

      <PERMISSION_STATUS>                                         ---------- 权限信息

        <USERNAME>ranan</USERNAME>                                 ---------- 所属主

        <GROUPNAME>supergroup</GROUPNAME>                         ---------- 所属组

        <MODE>420</MODE>                                          ---------- 权限大小（777最大）

      </PERMISSION_STATUS>

      <RPC_CLIENTID>3299ce83-ba14-4468-8cf8-b5edb5dea153</RPC_CLIENTID> ---- 集群ID

      <RPC_CALLID>3</RPC_CALLID>

    </DATA>

  </RECORD>

3.分配块id<OPCODE>OP_ALLOCATE_BLOCK_ID</OPCODE>

<RECORD>

    <OPCODE>OP_ALLOCATE_BLOCK_ID</OPCODE> ---- 表示该步为记录 “定义块ID”

    <DATA>

      <TXID>140</TXID>                    ---- HDFS的第140号记录

      <BLOCK_ID>1073741835</BLOCK_ID>    ----- 块ID

    </DATA>

 </RECORD>

4.为块生成一个时间戳<OPCODE>OP_SET_GENSTAMP_V2</OPCODE>

<RECORD>

    <OPCODE>OP_SET_GENSTAMP_V2</OPCODE>

    <DATA>

      <TXID>141</TXID>

      <GENSTAMPV2>1012</GENSTAMPV2>

    </DATA>

</RECORD>

5.添加块<OPCODE>OP_ADD_BLOCK</OPCODE>

<RECORD>

    <OPCODE>OP_ADD_BLOCK</OPCODE>

    <DATA>

      <TXID>142</TXID>

      <PATH>/a.xml._COPYING_</PATH>

      <BLOCK>

        <BLOCK_ID>1073741835</BLOCK_ID>

        <NUM_BYTES>0</NUM_BYTES>

        <GENSTAMP>1012</GENSTAMP>

      </BLOCK>

      <RPC_CLIENTID></RPC_CLIENTID>

      <RPC_CALLID>-2</RPC_CALLID>

    </DATA>

 </RECORD>

6.封闭文件<OPCODE>OP_CLOSE</OPCODE>

<RECORD>

    <OPCODE>OP_CLOSE</OPCODE>

    <DATA>

      <TXID>143</TXID>

      <LENGTH>0</LENGTH>

      <INODEID>0</INODEID>

      <PATH>/a.xml._COPYING_</PATH>

      <REPLICATION>3</REPLICATION>

      <MTIME>1603341875516</MTIME>

      <ATIME>1603341874966</ATIME>

      <BLOCKSIZE>134217728</BLOCKSIZE>

      <CLIENT_NAME></CLIENT_NAME>

      <CLIENT_MACHINE></CLIENT_MACHINE>

      <OVERWRITE>false</OVERWRITE>

      <BLOCK>

        <BLOCK_ID>1073741835</BLOCK_ID>

        <NUM_BYTES>313</NUM_BYTES>

        <GENSTAMP>1012</GENSTAMP>

      </BLOCK>

      <PERMISSION_STATUS>

        <USERNAME>ranan</USERNAME>

        <GROUPNAME>supergroup</GROUPNAME>

        <MODE>420</MODE>

      </PERMISSION_STATUS>

    </DATA>

  </RECORD>

7.重命名临时文件 'a.xml.COPYING' 为 'a.xml' <OPCODE>OP_RENAME_OLD</OPCODE>

<RECORD>

    <OPCODE>OP_RENAME_OLD</OPCODE>

    <DATA>

      <TXID>144</TXID>

      <LENGTH>0</LENGTH>

      <SRC>/a.xml._COPYING_</SRC>

      <DST>/a.xml</DST>

      <TIMESTAMP>1603341875552</TIMESTAMP>

      <RPC_CLIENTID>3299ce83-ba14-4468-8cf8-b5edb5dea153</RPC_CLIENTID>

      <RPC_CALLID>8</RPC_CALLID>

    </DATA>

</RECORD>

问题：NameNode如何确定下次开机启动的时候合并哪些Edits

注意时间，看到每间隔1h进行一次合并

集群开关机要合并一次

CheckPoint时间设置

hdfs-default.xml

1.通常情况下，SecondaryNameNode每隔一小时执行一次CheckPoint

<property>

  <name>dfs.namenode.checkpoint.period</name>

  <value>3600s</value>

</property>

2.一分钟检查一次操作次数，当操作次数达到 1 百万时，SecondaryNameNode执行一次CheckPoint

<property>

  <name>dfs.namenode.checkpoint.txns</name>

  <value>1000000</value>

<description>操作动作次数</description>

</property> 

<property>

  <name>dfs.namenode.checkpoint.check.period</name>

  <value>60s</value>

<description> 1 分钟检查一次操作次数</description>

</property>

HDFS05 NameNode和SecondaryNameNode的更多相关文章

NameNode和SecondaryNameNode工作原理剖析
NameNode和SecondaryNameNode工作原理剖析作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.NameNode中的元数据是存储在那里的? 1>.首先,我 ...
NameNode和SecondaryNameNode（面试开发重点）
NameNode和SecondaryNameNode(面试开发重点) 1 NN和2NN工作机制思考:NameNode中的元数据是存储在哪里的? 首先,我们做个假设,如果存储在NameNode节点的磁 ...
hadoop及NameNode和SecondaryNameNode工作机制
hadoop及NameNode和SecondaryNameNode工作机制 1.hadoop组成 Common MapReduce Yarn HDFS (1)HDFS namenode:存放目录,最重 ...
HDFS【Namenode、SecondaryNamenode、Datanode】
目录一. NameNode和SecondaryNameNode 1.NN和2NN 工作机制 2. NN和2NN中的fsimage.edits分析 3.checkpoint设置 4.namenode故 ...
一探究竟：Namenode、SecondaryNamenode、NamenodeHA关系
NameNode与Secondary NameNode 很多人都认为,Secondary NameNode是NameNode的备份,是为了防止NameNode的单点失败的,其实并不是在这样.文章Sec ...
NameNode 与 SecondaryNameNode 的工作机制
一.NameNode.Fsimage .Edits 和 SecondaryNameNode 概述 NameNode:在内存中储存 HDFS 文件的元数据信息(目录) 如果节点故障或断电,存在内存中的数 ...
Hadoop(9)-HDFS的NameNode和SecondaryNameNode详解
1.NN和2NN工作机制首先,我们做个假设,如果存储在NameNode节点的磁盘中,因为经常需要进行随机访问,还有响应客户请求,必然是效率过低.因此,元数据需要存放在内存中.但如果只存在内存中,一旦 ...
NameNode和SecondaryNameNode的工作机制
NameNode&Secondary NameNode 工作机制 NameNode: 1.启动时,加载编辑日志和镜像文件到内存 2.当客户端对元数据进行增删改,请求NameNode 3.Nam ...
浅谈HDFS（二）之NameNode与SecondaryNameNode
NN与2NN工作机制思考:NameNode中的元数据是存储在哪里的? 假设存储在NameNode节点的硬盘中,因为经常需要随机访问和响应客户请求,必然效率太低,所以是存储在内存中的但是,如果存储在 ...

随机推荐

AGC036 A-Triangle | 构造
题目链接题意: 给出一个数$S(1\leqslant S \leqslant 10^{18})$. 要求在平面直角坐标系中找到三个点$(X_1,Y_1),(X_2,Y_2),(X_3,Y_3)$,满 ...
前端面试手写代码——JS数组去重
目录 1 测试用例 2 JS 数组去重4大类型 2.1 元素比较型 2.1.1 双层 for 循环逐一比较(es5常用) 2.1.2 排序相邻比较 2.2 查找元素位置型 2.2.1 indexOf ...
Linux&C———进程间通信
管道和有名管道消息队列共享内存信号套接字由于进程之间的并不会像线程那样共享地址空间和数据空间,所以进程之间就必须有自己特有的通信方式,这篇博客主要介绍自己了解到的几种进程之间的通信方式,内容 ...
ELK集群之kafka（7）
原理待补充: kafka依赖于zookeeper集群. 都是基于java 由于源码安装jdk 未声明bin下java 在各自server配置文件中声明 JAVA_HOME=/usr/local/jdk ...
Jenkins file一行代码部署.NET程序到K8S
什么是Jenkins共享库随着微服务的增多,每个项目的都需要pipline文件,这样的话Pipeline代码冗余度高,并且pipeline的功能越来越复杂. jenkins可以使用Shared Li ...
java中lamda表达式用法
map-> list Map<String, Object> map = new HashMap<>(); List<String> list = new A ...
coding game，边打游戏边学编程，是一种怎么样的体验？
前言 hello,大家好,我是bigsai,好久不见,甚是想念! 在日常生活中,很多人喜欢玩游戏,因为游戏中有着对抗博弈.控制的喜悦,用灵魂指法完成一波靓丽的操作. 但实际上,你的按键都是对应代码中一 ...
菜鸡的Java笔记第十九 - java 继承
继承性的主要目的,继承的实现,继承的限制继承是面向对象中的第二大主要特点,其核心的本质在于:可以将父类的功能一直沿用下去为什么需要继承? ...
[luogu7417]Minimizing Edges P
令$e_{G}(a)$和$o_{G}(a)$分别表示在图$G$中从1到$a$的长度为奇数/偶数的最短路(若该类最短路不存在则为$\infty$),不难得到有以下结论--$f_{G}(a,b)=\beg ...
github文件下载加速器
https://d.serctl.com/?dl_start

HDFS05 NameNode和SecondaryNameNode