Hadoop学习笔记之五：HDFS功能逻辑(1)

ZisZ 2024-10-12 13:49:40 原文

Block Report

DataNode会周期性（默认1小时）将自身节点全部block信息发送给NameNode，以让NameNode正确确维护block信息。

在Block Report的数据源DataNode端，处理逻辑比较简单，对磁盘上的所有Block文件进行遍历保存到一张表中，然后发送给NameNode；

在NameNode端，将该block report与blocksMap中该DataNode的block列表（参见BlocksMap）进行比较和处理，比较处理过程如下：

获取同一datanode的block list和最新的block report；
在block list头部插入一个分割用的空BlockInfo（Delimiter BlockInfo）；
将block report中的block与block list及整个blocksMap进行比较，如果
1. 在blocksMap中找到完全相符的block，则接收该block；(a)
2. 在blocksMap中找到id相同、版本号不同的block，且所属文件仍然存在，且如果block report的版本号较高、或文件仍未关闭，则接收该block；(b)
3. 对于a、b中接收的block，如果其存在该datanode的block list中，则将该block移到block list头部；(c)
4. 对于a、b中接收的block，如果其不存在该datanode的block list中，则添加到toAdd队列中，之后会更新blocksMap，使其进入该datanode的block list；(d)
5. 对于a、b中不接收的block，添加到toInvalidate中，之后会通知datanode对该block文件进行删除；(e)
此时Delimiter BlockInfo之前的是在block report中出现过的Block，之后的是未在block report中出现过的Block；将Delimiter BlockInfo之后的block加入toRemove队列；之后会更新blocksMap，将这些block对象从该datanode的block list中删除；

Checkpoint（检查点）

HDFS通过检查点机制对命名空间的磁盘存储文件进行合并，生成新的fsImage及edits，这个过程简记为doCheckpoint。关于命名空间的磁盘存储详见Namespace；

整个过程由secondaryNameNode发起，并引发NameNode内存经过一轮状态机变换，最终完成合并。下图描述的是整个doCheckpoint过程中NameNode的CheckPointState状态转换：

初始状态为START；当NameNode处于UPLOAD_DONE状态，通过rollFSImage舍弃旧的fsImage和旧的edits，保存新的fsImage和新的edits，会将状态置回START；
通过rollEditLog函数后，生成新的edits.new文件存储新的命名空间修改，状态转换为ROLLED_EDITS；
secondaryNameNode下载fsImage及旧的edits文件后，合并成新的检查点，通知NameNode下载；NameNode会通过validateCheckpointUpload进行检查，确认可以获取新的检查点后，状态转入UPLOAD_START；
NameNode获取新的检查点后，通过checkpointUploadDone将状态置为UPLOAD_DONE；

doCheckpoint过程中命名空间磁盘存储文件的变化过程如下图所示：

START状态下始终是fsimage生edits文件；
状态机经过2后，出现edits.new文件，edits文件不再修改；
状态机经过4后，出现新的fsimage.chkp文件；

对该状态机进行几点特殊说明：

NameNode为支持配备多个secondaryNameNode，因而当状态机转换至3、4步时，需要获取一个互斥锁；（防止多个SNN并发导致异常）
第2步rollEditLog时NameNode会生成一个令牌（edits的最终修改时间）；在状态转换进入3时，会对令牌进行检查；（保证数据一致）
为应对SecondaryNameNode可能在任意状态意外宕机，rollEditLog函数不对前一状态进行检查（可从任意状态到达ROLLED_EDITS）；

Decommission（退役）

hadoop管理员可以通过hdfs的配置文件hdfs-site.xml，设定dfs.hosts及dfs.hosts.exclude，指明对应的文件路径，以指定允许/排除的集群节点（写在文件内容中），如果不设定dfs.hosts，则认为任何节点都允许加入集群。

hadoop客户端可以向NameNode发起refreshNodes的请求，促使NameNode读取这两个文件，并与当前集群中的DataNode节点进行比对，如果：

某个DN不在允许的节点列表中，则立即设定其 Decommission；
某DN在允许的节点列表中，同时也在排除的节点列表中，则设定其开始进行Decommission（如果还没开始）；
某DN在允许的节点列表中，且不在排除的节点列表中，但却处于已经Decommissioned或正在进行Decommission的状态，则立即停止其Decommission。

当NameNode标记一个DN进入Decommission状态后，该DN上所有数据块的副本都不再记入有效副本个数，导致NameNode发现这些数据块的副本数不足，从而加入到NameNode的neededReplications集合中，以便在适当的时候通知相应DN对数据块进行复制；

NameNode使用一个线程，通过 DecommissionManager.Monitor进行定期检查，默认是每30秒进行一次检查：

如果DN正在进行Decommission行为，查看其是否完成了所有数据块的副本复制（耗时操作），如果完成，则标记为Decommissioned完成；对检查到的进行Decommission的节点进行计数，满5个就结束；

如果进行Decommission的DN数不足5个，则会扫描掉所有DN；

Heartbeat（心跳）

HDFS的NN服务通过接收DN的Heartbeat消息获取DN的运行状态。Heartbeat是一则很简短的RPC消息，由DN向NN主动发出，包含该DN的容量、传输请求数、磁盘卷状态等信息，默认发送间隔3秒。

DN发送的Heartbeat消息会被更新在NN的heartbeats结构中；NN通过一个线程定期检查该结构（默认5分钟一次），找到心跳超时的节点（默认10分30秒超时，2*检查周期5分钟+10*心跳周期3秒），判断其死亡；在这种配置下，一个节点从无心跳到最终断定死亡，最长可能经过15.5分钟时间。

Hadoop学习笔记之五：HDFS功能逻辑(1)的更多相关文章

Hadoop学习笔记： HDFS
注:该文内容部分来源于ChinaHadoop.cn上的hadoop视频教程. 一. HDFS概述 HDFS即Hadoop Distributed File System, 源于Google发表于200 ...
Hadoop学习笔记(2)-HDFS的基本操作(Shell命令)
在这里我给大家继续分享一些关于HDFS分布式文件的经验哈,其中包括一些hdfs的基本的shell命令的操作,再加上hdfs java程序设计.在前面我已经写了关于如何去搭建hadoop这样一个大数据平 ...
hadoop学习笔记贰 --HDFS及YARN的启动
1.初始化HDFS :hadoop namenode -format 看到如下字样,说明初始化成功. 启动HDFS,start-dfs.sh 终于启动成功了,原来是core-site.xml 中配置 ...
Hadoop学习笔记(三) ——HDFS
参考书籍:<Hadoop实战>第二版第9章:HDFS详解 1. HDFS基本操作 @ 出现的bug信息 @-@ WARN util.NativeCodeLoader: Unable to ...
hadoop学习笔记（四）：HDFS文件权限，安全模式，以及整体注意点总结
本文原创,转载注明作者和原文链接! 一:总结注意点: 到现在为止学习到的角色:三个NameNode.SecondaryNameNode.DataNode 1.存储的是每一个文件分割存储之后的元数据信息 ...
Hadoop学习笔记(2)
Hadoop学习笔记(2) ——解读Hello World 上一章中,我们把hadoop下载.安装.运行起来,最后还执行了一个Hello world程序,看到了结果.现在我们就来解读一下这个Hello ...
Hadoop学习笔记(5) ——编写HelloWorld(2)
Hadoop学习笔记(5) ——编写HelloWorld(2) 前面我们写了一个Hadoop程序,并让它跑起来了.但想想不对啊,Hadoop不是有两块功能么,DFS和MapReduce.没错,上一节我 ...
Hadoop学习笔记(2) ——解读Hello World
Hadoop学习笔记(2) ——解读Hello World 上一章中,我们把hadoop下载.安装.运行起来,最后还执行了一个Hello world程序,看到了结果.现在我们就来解读一下这个Hello ...
Hadoop学习笔记(9) ——源码初窥
Hadoop学习笔记(9) ——源码初窥之前我们把Hadoop算是入了门,下载的源码,写了HelloWorld,简要分析了其编程要点,然后也编了个较复杂的示例.接下来其实就有两条路可走了,一条是继续 ...

随机推荐

Fast-R-CNN
基于R-CNN和SPP-Net思想,RBG提出了Fast-R-CNN算法.如果选用VGG16网络进行特征提取,在训练阶段,Fast-R-CNN的速度相比RCNN和SPP-Net可以分别提升9倍和3倍: ...
【LeetCode每天一题】3Sum Closest（最接近的三数和）
Given an array nums of n integers and an integer target, find three integers in nums such that the s ...
[LeetCode] 329. Longest Increasing Path in a Matrix_Hard tag: Dynamic Programming, DFS, Memoization
Given an integer matrix, find the length of the longest increasing path. From each cell, you can eit ...
Windows Server 2008服务器上测试几个站点，改完host居然没有生效
Windows Server 2008服务器上测试几个站点,改完host居然没有生效看了下资料,估计是因为Dnscache这个服务引起的(DNS Client)于是从服务了把他禁用掉,果然host生效 ...
Struts上传文件
Struts上传文件分为两个步骤: 1). 首先将客户端上传的文件保存到Struts.multipart.saveDir键所指定的目录中,如果该键所对应的目录不存在,那么就保存到javax.servl ...
如何简单地理解Python中的if __name__ == '__main__'(https://blog.csdn.net/yjk13703623757/article/details/77918633)
1. 摘要通俗的理解__name__ == '__main__':假如你叫小明.py,在朋友眼中,你是小明(__name__ == '小明'):在你自己眼中,你是你自己(__name__ == '_ ...
关于js语句的分号
我在使用js的时候可能发现一个现象:js语句结尾有时候有分号,有时候没有,没有的时候js代码也是能正确执行的. 到底要不要写分号?QAQ 转自博客园@winter-cn JavaScript自动加分号 ...
C# HtmlDocument和HtmlNode的使用以及节点的模糊查询
C#HtmlAgilityPack.HtmlDocument和HtmlAgilityPack.HtmlNode的使用 HtmlAgilityPack.HtmlDocument response = n ...
report源码分析——report_object和report_message
uvm的report机制,主要涉及uvm_report_object,uvm_report_handle,uvm_report_server这三个类: uvm_report_object主要是提供uv ...
mysql 知识
1. 数据库事务的四个特性及含义数据库事务transanction正确执行的四个基本要素.ACID,原子性(Atomicity).一致性(Correspondence).隔离性(Isolation ...