HDFS源码分析数据块之CorruptReplicasMap
CorruptReplicasMap用于存储文件系统中所有损坏数据块的信息。仅当它的所有副本损坏时一个数据块才被认定为损坏。当汇报数据块的副本时,我们隐藏所有损坏副本。一旦一个数据块被发现完好副本达到预期,它将从CorruptReplicasMap中被移除。
我们先看下CorruptReplicasMap都有哪些成员变量,如下所示:
- // 存储损坏数据块Block与它对应每个数据节点与损坏原因集合映射关系的集合
- private final SortedMap<Block, Map<DatanodeDescriptor, Reason>> corruptReplicasMap =
- new TreeMap<Block, Map<DatanodeDescriptor, Reason>>();
是的,你没看错,就这一个corruptReplicasMap集合,它是一个用来存储损坏数据块Block实例与它对应每个数据节点和损坏原因集合的映射关系的集合。
我们看下CorruptReplicasMap都提供了哪些有用的方法。
一、addToCorruptReplicasMap()
标记属于指定数据节点的数据块为损坏
- /**
- * Mark the block belonging to datanode as corrupt.
- * 标记属于指定数据节点的数据块为损坏
- *
- * @param blk Block to be added to CorruptReplicasMap
- * @param dn DatanodeDescriptor which holds the corrupt replica
- * @param reason a textual reason (for logging purposes)
- * @param reasonCode the enum representation of the reason
- */
- void addToCorruptReplicasMap(Block blk, DatanodeDescriptor dn,
- String reason, Reason reasonCode) {
- / 先从corruptReplicasMap集合中查找是否存在对应数据块blk
- Map <DatanodeDescriptor, Reason> nodes = corruptReplicasMap.get(blk);
- // 如果不存在,构造一个HashMap<DatanodeDescriptor, Reason>集合nodes,将blk与nodes存入corruptReplicasMap
- if (nodes == null) {
- nodes = new HashMap<DatanodeDescriptor, Reason>();
- corruptReplicasMap.put(blk, nodes);
- }
- String reasonText;
- if (reason != null) {
- reasonText = " because " + reason;
- } else {
- reasonText = "";
- }
- // 判断nodes中是否存在对应数据节点dn,分别记录日志信息
- if (!nodes.keySet().contains(dn)) {
- NameNode.blockStateChangeLog.info("BLOCK NameSystem.addToCorruptReplicasMap: "+
- blk.getBlockName() +
- " added as corrupt on " + dn +
- " by " + Server.getRemoteIp() +
- reasonText);
- } else {
- NameNode.blockStateChangeLog.info("BLOCK NameSystem.addToCorruptReplicasMap: "+
- "duplicate requested for " +
- blk.getBlockName() + " to add as corrupt " +
- "on " + dn +
- " by " + Server.getRemoteIp() +
- reasonText);
- }
- // Add the node or update the reason.
- // 将数据节点dn、损坏原因编码reasonCode加入或更新入nodes
- nodes.put(dn, reasonCode);
- }
处理逻辑很简单,大体如下:
1、先从corruptReplicasMap集合中查找是否存在对应数据块blk;
2、如果不存在,构造一个HashMap<DatanodeDescriptor, Reason>集合nodes,将blk与nodes存入corruptReplicasMap;
3、判断nodes中是否存在对应数据节点dn,分别记录日志信息;
4、将数据节点dn、损坏原因编码reasonCode加入或更新入nodes。
二、removeFromCorruptReplicasMap()
将指定数据块、数据节点,根据指定原因从集合corruptReplicasMap移除
- // 将指定数据块、数据节点,根据指定原因从集合corruptReplicasMap移除
- boolean removeFromCorruptReplicasMap(Block blk, DatanodeDescriptor datanode,
- Reason reason) {
- / 先从corruptReplicasMap集合中查找是否存在对应数据块blk,获得datanodes
- Map <DatanodeDescriptor, Reason> datanodes = corruptReplicasMap.get(blk);
- // 如果不存在,直接返回false,表明移除失败
- if (datanodes==null)
- return false;
- // if reasons can be compared but don't match, return false.
- // 取出数据节点datanode对应的存储损坏原因storedReason
- Reason storedReason = datanodes.get(datanode);
- // 判断存储损坏原因storedReason与参数损坏原因reason是否一致,不一致直接返回false,表明移除失败,
- // 判断的依据为参数损坏原因reason不是ANY且存储损坏原因storedReason不为空的情况下,两者不一致
- if (reason != Reason.ANY && storedReason != null &&
- reason != storedReason) {
- return false;
- }
- // 将datanode对应数据从datanodes中移除
- if (datanodes.remove(datanode) != null) { // remove the replicas
- // 移除datanode后,如果datanodes为空
- if (datanodes.isEmpty()) {
- // remove the block if there is no more corrupted replicas
- // 将数据块blk从集合corruptReplicasMap中移除
- corruptReplicasMap.remove(blk);
- }
- // 返回true,表明移除成功
- return true;
- }
- // 其他情况下直接返回false,表明移除失败
- return false;
- }
三、getCorruptReplicaBlockIds()
获取指定大小和起始数据块ID的损坏数据块ID数组
- /**
- * Return a range of corrupt replica block ids. Up to numExpectedBlocks
- * blocks starting at the next block after startingBlockId are returned
- * (fewer if numExpectedBlocks blocks are unavailable). If startingBlockId
- * is null, up to numExpectedBlocks blocks are returned from the beginning.
- * If startingBlockId cannot be found, null is returned.
- * 获取指定大小和起始数据块ID的损坏数据块ID数组
- *
- * @param numExpectedBlocks Number of block ids to return.
- * 0 <= numExpectedBlocks <= 100
- * @param startingBlockId Block id from which to start. If null, start at
- * beginning.
- * @return Up to numExpectedBlocks blocks from startingBlockId if it exists
- *
- */
- long[] getCorruptReplicaBlockIds(int numExpectedBlocks,
- Long startingBlockId) {
- / 校验numExpectedBlocks,需要获取的数据块ID数组最多有100个元素
- if (numExpectedBlocks < 0 || numExpectedBlocks > 100) {
- return null;
- }
- // 获得corruptReplicasMap集合的数据块迭代器blockIt
- Iterator<Block> blockIt = corruptReplicasMap.keySet().iterator();
- // if the starting block id was specified, iterate over keys until
- // we find the matching block. If we find a matching block, break
- // to leave the iterator on the next block after the specified block.
- // 如果设定了起始数据块艾迪startingBlockId
- if (startingBlockId != null) {
- boolean isBlockFound = false;
- // 遍历corruptReplicasMap,查看是否存在startingBlockId,如果存在,跳出循环,此时已记录住迭代器的位置了
- while (blockIt.hasNext()) {
- Block b = blockIt.next();
- if (b.getBlockId() == startingBlockId) {
- isBlockFound = true;
- break;
- }
- }
- // 如果不存在,直接返回null
- if (!isBlockFound) {
- return null;
- }
- }
- // 构造一个存储数据块ID的列表corruptReplicaBlockIds
- ArrayList<Long> corruptReplicaBlockIds = new ArrayList<Long>();
- // append up to numExpectedBlocks blockIds to our list
- // 遍历corruptReplicasMap,将最多numExpectedBlocks个数据块ID添加到列表corruptReplicaBlockIds,
- // 此时的迭代器可能不是从头开始取数据的,在startingBlockId需要并存在的情况下,它是从下一个元素开始获取的
- for(int i=0; i<numExpectedBlocks && blockIt.hasNext(); i++) {
- corruptReplicaBlockIds.add(blockIt.next().getBlockId());
- }
- // 将数据块ID列表corruptReplicaBlockIds转换成数组ret
- long[] ret = new long[corruptReplicaBlockIds.size()];
- for(int i=0; i<ret.length; i++) {
- ret[i] = corruptReplicaBlockIds.get(i);
- }
- // 返回数据块ID数组ret
- return ret;
- }
四、getNodes()
根据损坏数据块获取对应数据节点集合
- /**
- * Get Nodes which have corrupt replicas of Block
- * 根据损坏数据块获取对应数据节点集合
- *
- * @param blk Block for which nodes are requested
- * @return collection of nodes. Null if does not exists
- */
- Collection<DatanodeDescriptor> getNodes(Block blk) {
- Map <DatanodeDescriptor, Reason> nodes = corruptReplicasMap.get(blk);
- if (nodes == null)
- return null;
- return nodes.keySet();
- }
五、isReplicaCorrupt()
检测指定数据块和数据节点是否为损坏的
- /**
- * Check if replica belonging to Datanode is corrupt
- * 检测指定数据块和数据节点是否为损坏的
- *
- * @param blk Block to check
- * @param node DatanodeDescriptor which holds the replica
- * @return true if replica is corrupt, false if does not exists in this map
- */
- boolean isReplicaCorrupt(Block blk, DatanodeDescriptor node) {
- Collection<DatanodeDescriptor> nodes = getNodes(blk);
- return ((nodes != null) && (nodes.contains(node)));
- }
六、numCorruptReplicas()
获取给定数据块对应数据节点数量
- // 获取给定数据块对应数据节点数量
- int numCorruptReplicas(Block blk) {
- Collection<DatanodeDescriptor> nodes = getNodes(blk);
- return (nodes == null) ? 0 : nodes.size();
- }
七、size()
获取损坏数据块数量
- // 获取损坏数据块数量
- int size() {
- return corruptReplicasMap.size();
- }
HDFS源码分析数据块之CorruptReplicasMap的更多相关文章
- HDFS源码分析数据块校验之DataBlockScanner
DataBlockScanner是运行在数据节点DataNode上的一个后台线程.它为所有的块池管理块扫描.针对每个块池,一个BlockPoolSliceScanner对象将会被创建,其运行在一个单独 ...
- HDFS源码分析数据块复制监控线程ReplicationMonitor(二)
HDFS源码分析数据块复制监控线程ReplicationMonitor(二)
- HDFS源码分析数据块复制监控线程ReplicationMonitor(一)
ReplicationMonitor是HDFS中关于数据块复制的监控线程,它的主要作用就是计算DataNode工作,并将复制请求超时的块重新加入到待调度队列.其定义及作为线程核心的run()方法如下: ...
- HDFS源码分析数据块汇报之损坏数据块检测checkReplicaCorrupt()
无论是第一次,还是之后的每次数据块汇报,名字名字节点都会对汇报上来的数据块进行检测,看看其是否为损坏的数据块.那么,损坏数据块是如何被检测的呢?本文,我们将研究下损坏数据块检测的checkReplic ...
- HDFS源码分析数据块复制选取复制源节点
数据块的复制当然需要一个源数据节点,从其上拷贝数据块至目标数据节点.那么数据块复制是如何选取复制源节点的呢?本文我们将针对这一问题进行研究. 在BlockManager中,chooseSourceDa ...
- HDFS源码分析数据块复制之PendingReplicationBlocks
PendingReplicationBlocks实现了所有正在复制的数据块的记账工作.它实现以下三个主要功能: 1.记录此时正在复制的块: 2.一种对复制请求进行跟踪的粗粒度计时器: 3.一个定期识别 ...
- HDFS源码分析之数据块及副本状态BlockUCState、ReplicaState
关于数据块.副本的介绍,请参考文章<HDFS源码分析之数据块Block.副本Replica>. 一.数据块状态BlockUCState 数据块状态用枚举类BlockUCState来表示,代 ...
- HDFS源码分析心跳汇报之数据块汇报
在<HDFS源码分析心跳汇报之数据块增量汇报>一文中,我们详细介绍了数据块增量汇报的内容,了解到它是时间间隔更长的正常数据块汇报周期内一个smaller的数据块汇报,它负责将DataNod ...
- HDFS源码分析心跳汇报之数据块增量汇报
在<HDFS源码分析心跳汇报之BPServiceActor工作线程运行流程>一文中,我们详细了解了数据节点DataNode周期性发送心跳给名字节点NameNode的BPServiceAct ...
随机推荐
- 洛谷 P1038 神经网络
题目背景 人工神经网络(Artificial Neural Network)是一种新兴的具有自我学习能力的计算系统,在模式识别.函数逼近及贷款风险评估等诸多领域有广泛的应用.对神经网络的研究一直是当今 ...
- Eval的格式,主要看大括号的格式,其他不用那样写
原文发布时间为:2009-08-26 -- 来源于本人的百度文章 [由搬家工具导入] 使用范例:<%#Eval("date","{0:d}") %> ...
- C#、.Net学习资料免注册下载基地。。。
原文发布时间为:2008-11-28 -- 来源于本人的百度文章 [由搬家工具导入] http://club.topsage.com/forumdisplay.php?fid=121&filt ...
- hdu 5952 Counting Cliques 求图中指定大小的团的个数 暴搜
题目链接 题意 给定一个\(n个点,m条边\)的无向图,找出其中大小为\(s\)的完全图个数\((n\leq 100,m\leq 1000,s\leq 10)\). 思路 暴搜. 搜索的时候判断要加进 ...
- selenium题
一.selenium中如何判断元素是否存在? 首先selenium里面是没有这个方法的,判断元素存在需要自己写一个方法了. 元素存在有几种形式,一种是页面有多个元素属性重复的,这种直接操作会报错的:还 ...
- saltstack 模块学习之 state
入口文件top.sls 三要素环境:通过file-roots指定目标主机:可以使用通配符*配置文件路径:路径分割符为. 比如a.mysql 表示在环境指定的路径下有个a目录,a目录下有个mysql. ...
- BZOJ1858 [Scoi2010]序列操作(线段树)
题目链接 [Scoi2010]序列操作 考验代码能力的一道好题. 思想还是很简单的(直接上线段树),但是比较难写. #include <bits/stdc++.h> using names ...
- 机器学习(4):数据分析的工具-pandas的使用
前面几节说一些沉闷的概念,你若看了估计已经心生厌倦,我也是.所以,找到了一个理由来说一个有兴趣的话题,就是数据分析.是什么理由呢?就是,机器学习的处理过程中,数据分析是经常出现的操作.就算机器对大量样 ...
- 某考试T2 frog
题目背景 无 题目描述 数轴上有 n 只青蛙,分别编号为 1 到 n.青蛙 i 的初始位置的坐标为 xi. 它们准备进行如下形式的移动:每轮包括 m 次跳跃,第 i 次跳跃由青蛙 ai(1 < ...
- (入门SpringBoot)SpringBoot发送邮件(十一)
SpringBoot配置邮件服务: 1.引入jar <!-- 邮件 --> <dependency> <groupId>org.springframework ...