HDFS源码分析数据块之CorruptReplicasMap

CorruptReplicasMap用于存储文件系统中所有损坏数据块的信息。仅当它的所有副本损坏时一个数据块才被认定为损坏。当汇报数据块的副本时，我们隐藏所有损坏副本。一旦一个数据块被发现完好副本达到预期，它将从CorruptReplicasMap中被移除。

我们先看下CorruptReplicasMap都有哪些成员变量，如下所示：

// 存储损坏数据块Block与它对应每个数据节点与损坏原因集合映射关系的集合
private final SortedMap<Block, Map<DatanodeDescriptor, Reason>> corruptReplicasMap =
new TreeMap<Block, Map<DatanodeDescriptor, Reason>>();

是的，你没看错，就这一个corruptReplicasMap集合，它是一个用来存储损坏数据块Block实例与它对应每个数据节点和损坏原因集合的映射关系的集合。

我们看下CorruptReplicasMap都提供了哪些有用的方法。

一、addToCorruptReplicasMap()

标记属于指定数据节点的数据块为损坏

/**
* Mark the block belonging to datanode as corrupt.
* 标记属于指定数据节点的数据块为损坏
*
* @param blk Block to be added to CorruptReplicasMap
* @param dn DatanodeDescriptor which holds the corrupt replica
* @param reason a textual reason (for logging purposes)
* @param reasonCode the enum representation of the reason
*/
void addToCorruptReplicasMap(Block blk, DatanodeDescriptor dn,
String reason, Reason reasonCode) {
/ 先从corruptReplicasMap集合中查找是否存在对应数据块blk
Map <DatanodeDescriptor, Reason> nodes = corruptReplicasMap.get(blk);
// 如果不存在，构造一个HashMap<DatanodeDescriptor, Reason>集合nodes，将blk与nodes存入corruptReplicasMap
if (nodes == null) {
nodes = new HashMap<DatanodeDescriptor, Reason>();
corruptReplicasMap.put(blk, nodes);
}
String reasonText;
if (reason != null) {
reasonText = " because " + reason;
} else {
reasonText = "";
}
// 判断nodes中是否存在对应数据节点dn，分别记录日志信息
if (!nodes.keySet().contains(dn)) {
NameNode.blockStateChangeLog.info("BLOCK NameSystem.addToCorruptReplicasMap: "+
blk.getBlockName() +
" added as corrupt on " + dn +
" by " + Server.getRemoteIp() +
reasonText);
} else {
NameNode.blockStateChangeLog.info("BLOCK NameSystem.addToCorruptReplicasMap: "+
"duplicate requested for " +
blk.getBlockName() + " to add as corrupt " +
"on " + dn +
" by " + Server.getRemoteIp() +
reasonText);
}
// Add the node or update the reason.
// 将数据节点dn、损坏原因编码reasonCode加入或更新入nodes
nodes.put(dn, reasonCode);
}

处理逻辑很简单，大体如下：

1、先从corruptReplicasMap集合中查找是否存在对应数据块blk；

2、如果不存在，构造一个HashMap<DatanodeDescriptor, Reason>集合nodes，将blk与nodes存入corruptReplicasMap；

3、判断nodes中是否存在对应数据节点dn，分别记录日志信息；

4、将数据节点dn、损坏原因编码reasonCode加入或更新入nodes。

二、removeFromCorruptReplicasMap()

将指定数据块、数据节点，根据指定原因从集合corruptReplicasMap移除

// 将指定数据块、数据节点，根据指定原因从集合corruptReplicasMap移除
boolean removeFromCorruptReplicasMap(Block blk, DatanodeDescriptor datanode,
Reason reason) {
/ 先从corruptReplicasMap集合中查找是否存在对应数据块blk，获得datanodes
Map <DatanodeDescriptor, Reason> datanodes = corruptReplicasMap.get(blk);
// 如果不存在，直接返回false，表明移除失败
if (datanodes==null)
return false;
// if reasons can be compared but don't match, return false.
// 取出数据节点datanode对应的存储损坏原因storedReason
Reason storedReason = datanodes.get(datanode);
// 判断存储损坏原因storedReason与参数损坏原因reason是否一致，不一致直接返回false，表明移除失败，
// 判断的依据为参数损坏原因reason不是ANY且存储损坏原因storedReason不为空的情况下，两者不一致
if (reason != Reason.ANY && storedReason != null &&
reason != storedReason) {
return false;
}
// 将datanode对应数据从datanodes中移除
if (datanodes.remove(datanode) != null) { // remove the replicas
// 移除datanode后，如果datanodes为空
if (datanodes.isEmpty()) {
// remove the block if there is no more corrupted replicas
// 将数据块blk从集合corruptReplicasMap中移除
corruptReplicasMap.remove(blk);
}
// 返回true，表明移除成功
return true;
}
// 其他情况下直接返回false，表明移除失败
return false;
}

三、getCorruptReplicaBlockIds()

获取指定大小和起始数据块ID的损坏数据块ID数组

/**
* Return a range of corrupt replica block ids. Up to numExpectedBlocks
* blocks starting at the next block after startingBlockId are returned
* (fewer if numExpectedBlocks blocks are unavailable). If startingBlockId
* is null, up to numExpectedBlocks blocks are returned from the beginning.
* If startingBlockId cannot be found, null is returned.
* 获取指定大小和起始数据块ID的损坏数据块ID数组
*
* @param numExpectedBlocks Number of block ids to return.
* 0 <= numExpectedBlocks <= 100
* @param startingBlockId Block id from which to start. If null, start at
* beginning.
* @return Up to numExpectedBlocks blocks from startingBlockId if it exists
*
*/
long[] getCorruptReplicaBlockIds(int numExpectedBlocks,
Long startingBlockId) {
/ 校验numExpectedBlocks，需要获取的数据块ID数组最多有100个元素
if (numExpectedBlocks < 0 || numExpectedBlocks > 100) {
return null;
}
// 获得corruptReplicasMap集合的数据块迭代器blockIt
Iterator<Block> blockIt = corruptReplicasMap.keySet().iterator();
// if the starting block id was specified, iterate over keys until
// we find the matching block. If we find a matching block, break
// to leave the iterator on the next block after the specified block.
// 如果设定了起始数据块艾迪startingBlockId
if (startingBlockId != null) {
boolean isBlockFound = false;
// 遍历corruptReplicasMap，查看是否存在startingBlockId，如果存在，跳出循环，此时已记录住迭代器的位置了
while (blockIt.hasNext()) {
Block b = blockIt.next();
if (b.getBlockId() == startingBlockId) {
isBlockFound = true;
break;
}
}
// 如果不存在，直接返回null
if (!isBlockFound) {
return null;
}
}
// 构造一个存储数据块ID的列表corruptReplicaBlockIds
ArrayList<Long> corruptReplicaBlockIds = new ArrayList<Long>();
// append up to numExpectedBlocks blockIds to our list
// 遍历corruptReplicasMap，将最多numExpectedBlocks个数据块ID添加到列表corruptReplicaBlockIds，
// 此时的迭代器可能不是从头开始取数据的，在startingBlockId需要并存在的情况下，它是从下一个元素开始获取的
for(int i=0; i<numExpectedBlocks && blockIt.hasNext(); i++) {
corruptReplicaBlockIds.add(blockIt.next().getBlockId());
}
// 将数据块ID列表corruptReplicaBlockIds转换成数组ret
long[] ret = new long[corruptReplicaBlockIds.size()];
for(int i=0; i<ret.length; i++) {
ret[i] = corruptReplicaBlockIds.get(i);
}
// 返回数据块ID数组ret
return ret;
}

四、getNodes()

根据损坏数据块获取对应数据节点集合

/**
* Get Nodes which have corrupt replicas of Block
* 根据损坏数据块获取对应数据节点集合
*
* @param blk Block for which nodes are requested
* @return collection of nodes. Null if does not exists
*/
Collection<DatanodeDescriptor> getNodes(Block blk) {
Map <DatanodeDescriptor, Reason> nodes = corruptReplicasMap.get(blk);
if (nodes == null)
return null;
return nodes.keySet();
}

五、isReplicaCorrupt()

检测指定数据块和数据节点是否为损坏的

/**
* Check if replica belonging to Datanode is corrupt
* 检测指定数据块和数据节点是否为损坏的
*
* @param blk Block to check
* @param node DatanodeDescriptor which holds the replica
* @return true if replica is corrupt, false if does not exists in this map
*/
boolean isReplicaCorrupt(Block blk, DatanodeDescriptor node) {
Collection<DatanodeDescriptor> nodes = getNodes(blk);
return ((nodes != null) && (nodes.contains(node)));
}

六、numCorruptReplicas()

获取给定数据块对应数据节点数量

// 获取给定数据块对应数据节点数量
int numCorruptReplicas(Block blk) {
Collection<DatanodeDescriptor> nodes = getNodes(blk);
return (nodes == null) ? 0 : nodes.size();
}

七、size()

获取损坏数据块数量

// 获取损坏数据块数量
int size() {
return corruptReplicasMap.size();
}

HDFS源码分析数据块之CorruptReplicasMap的更多相关文章

HDFS源码分析数据块校验之DataBlockScanner
DataBlockScanner是运行在数据节点DataNode上的一个后台线程.它为所有的块池管理块扫描.针对每个块池,一个BlockPoolSliceScanner对象将会被创建,其运行在一个单独 ...
HDFS源码分析数据块复制监控线程ReplicationMonitor（二）
HDFS源码分析数据块复制监控线程ReplicationMonitor(二)
HDFS源码分析数据块复制监控线程ReplicationMonitor（一）
ReplicationMonitor是HDFS中关于数据块复制的监控线程,它的主要作用就是计算DataNode工作,并将复制请求超时的块重新加入到待调度队列.其定义及作为线程核心的run()方法如下: ...
HDFS源码分析数据块汇报之损坏数据块检测checkReplicaCorrupt()
无论是第一次,还是之后的每次数据块汇报,名字名字节点都会对汇报上来的数据块进行检测,看看其是否为损坏的数据块.那么,损坏数据块是如何被检测的呢?本文,我们将研究下损坏数据块检测的checkReplic ...
HDFS源码分析数据块复制选取复制源节点
数据块的复制当然需要一个源数据节点,从其上拷贝数据块至目标数据节点.那么数据块复制是如何选取复制源节点的呢?本文我们将针对这一问题进行研究. 在BlockManager中,chooseSourceDa ...
HDFS源码分析数据块复制之PendingReplicationBlocks
PendingReplicationBlocks实现了所有正在复制的数据块的记账工作.它实现以下三个主要功能: 1.记录此时正在复制的块: 2.一种对复制请求进行跟踪的粗粒度计时器: 3.一个定期识别 ...
HDFS源码分析之数据块及副本状态BlockUCState、ReplicaState
关于数据块.副本的介绍,请参考文章<HDFS源码分析之数据块Block.副本Replica>. 一.数据块状态BlockUCState 数据块状态用枚举类BlockUCState来表示,代 ...
HDFS源码分析心跳汇报之数据块汇报
在<HDFS源码分析心跳汇报之数据块增量汇报>一文中,我们详细介绍了数据块增量汇报的内容,了解到它是时间间隔更长的正常数据块汇报周期内一个smaller的数据块汇报,它负责将DataNod ...
HDFS源码分析心跳汇报之数据块增量汇报
在<HDFS源码分析心跳汇报之BPServiceActor工作线程运行流程>一文中,我们详细了解了数据节点DataNode周期性发送心跳给名字节点NameNode的BPServiceAct ...

随机推荐

17.2.10 NOIP模拟赛藏妹子之处（excel）
藏妹子之处(excel) 问题描述: 今天CZY又找到了三个妹子,有着收藏爱好的他想要找三个地方将妹子们藏起来,将一片空地抽象成一个R行C列的表格,CZY要选出3个单元格.但要满足如下的两个条件: ( ...
RowFilter 对于已获取到的dataset进行过滤
原文发布时间为:2009-11-12 -- 来源于本人的百度文章 [由搬家工具导入] DataView的属性RowFilter使用方法 p.s. 重点在于DataView是DateTable相关联的一 ...
nginx报404的可能错误
1.转移地址写错,如root E:software_setup\ftpfile,而你实际的目录地址(比如test.jpg)在ftpfile文件夹里面的img文件夹下,如果直接找ftpfile\test ...
javascript 数据类型的一些方法总结
字符串slice()与substring()的区别: 相同点:均接收两个参数,分别是子字符串的起始位置和终止位置.返回这两者之间的子字符串,不包括终止位置的字符.如果第2个参数不设置,则默认字符串的长 ...
springBoot Json
pom 加json配置 <dependency> <groupId>com.alibaba</groupId> <artifactId>fastjson ...
HDU 1020 Encoding【连续的计数器重置】
Encoding Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)Total Su ...
Codeforces 782B The Meeting Place Cannot Be Changed(二分答案)
题目链接 The Meeting Place Cannot Be Changed 二分答案即可. check的时候先算出每个点可到达的范围的区间,然后求并集.判断一下是否满足l <= r就好了. ...
centos 7 关闭firewalld开启iptables
1: 关闭系统高级防火墙firewalld systemctl stop firewalld.service #停止firewall systemctl disable firewalld.servi ...
mysql 性能容量评估
性能容量评估分析上线业务场景评估数据库服务器所需性能指标预估可能成为瓶颈的服务器资源帮助数据库性能调优数据库服务器硬件性能指标项: 磁盘IO性能内存容量 CPU 网络吞吐量磁盘容 ...
IOS 开发之 Method Swizzling
ios 分类中如果增加的方法与被扩展的类方法名重复,则原方法就没法被调用….看以下例子例如: @interface ClassA : NSObject - (NSString *) myMethod ...

HDFS源码分析数据块之CorruptReplicasMap

HDFS源码分析数据块之CorruptReplicasMap的更多相关文章

随机推荐

热门专题