Hadoop NameNode判断 DataNode 节点宕机的时间

、namenode 如何判断datanode节点是否宕机？

先决条件：

datanode每隔一段时间像namenode汇报，汇报的信息有两点

()自身datanode的状态信息；

()自身datanode所持有的所有的数据块的信息。

如果namenode连续十次没有收到datanode的汇报，那么namenode就会认为该datanode存在宕机的可能。

datanode启动以后会专门启动一个进程负责给namenode发送心跳数据包，如果datanode没有问题，仅仅只是发送信息数据包的进程挂了，namenode会发送命令像这个datanode进行确认，

查看这个发送心跳包的进程是否还能正常运行，namenode会向datanode确认两遍，每五分钟确认一次。如果两次都没有返回结果，那么namenode就会认为datanode已经宕机了。

最终namenode判断一个datanode死亡的时间计算公式：

timeout =  * 心跳间隔时间 +  * 检查一次消耗的时间

心跳间隔时间

配置参数：dfs.heartbeat.interval

默认值：3s，单位s

检查一次消耗的时间

配置参数：dfs.namenode.heartbeat.recheck-interval

默认值：    ，单位ms

、数据块读写操作的一些配置项

()配置参数：dfs.blocksize

参数说明：客户端数据分块的大小

默认值：(128M)；单位：字节

()dfs.client-write-packet-size

参数说明：客户端写入数据时packet数据包的大小

默认值：(64K)，单位字节

()dfs.bytes-per-checksum

参数说明：chunk(写入数据时最小的一个单位)，数据校验的粒度

默认值：512字节

注：事实上一个chunk还包含4B的校验值，因而chunk写入packet时是516B；数据与检验值的比值为128:，所以对于一个128M的block会有一个1M的校验文件与之对应；

、集群数据损坏以后，自动删除时长

配置项：dfs.blockreport.intervalMsec

默认值：(36分钟)，单位：ms

、元数据checkPount

在分布式或者伪分布集群中，每隔一段时间，会由 secondary namenode 将 namenode 上积累的所有 edits 和一个最新的 fsimage 下载到本地，并加载到内存进行 merge（这个过程称为 checkpoint）

dfs.namenode.checkpoint.check.period= ##检查触发条件是否满足的频率， 秒

dfs.namenode.checkpoint.dir=file://${hadoop.tmp.dir}/dfs/namesecondary

##以上两个参数做 checkpoint 操作时，secondary namenode 的本地工作目录

dfs.namenode.checkpoint.edits.dir=${dfs.namenode.checkpoint.dir}

dfs.namenode.checkpoint.max-retries= ##最大重试次数

dfs.namenode.checkpoint.period= ##两次 checkpoint 之间的时间间隔  秒

dfs.namenode.checkpoint.txns= ##两次 checkpoint 之间最大的操作记录

、jvm重用

配置参数：mapred.job.reuse.jvm.num.tasks

参数解释：一个jvm内部跑多少个task，默认是1，可以设置为多个。这个参数在2..2版本中未找到。

Hadoop NameNode判断 DataNode 节点宕机的时间的更多相关文章

redis集群节点宕机
redis集群是有很多个redis一起工作,那么就需要这个集群不是那么容易挂掉,所以呢,理论上就应该给集群中的每个节点至少一个备用的redis服务.这个备用的redis称为从节点(slave). 1. ...
clickhouse高可用-节点宕机数据一致性方案-热扩容
1. 集群节点及服务分配说明: 1.1. 在每个节点上启动两个clickhouse服务(后面会详细介绍如何操作这一步),一个数据分片,一个数据备份,为了确保宕机数据一致性,数据分片和数据备份不能同一 ...
Redis生产环境节点宕机问题报错及恢复排错
Redis故障发现主观下线当cluster-node-timeout时间内某节点无法与另一个节点顺利完成ping消息通信时,则将该节点标记为主观下线状态. 客观下线当某个节点判断另一个节点主观下 ...
Vertica集群单节点宕机恢复方法
Vertica集群单节点宕机恢复方法第一种方法: 直接通过admintools -> 5 Restart Vertica on Host 第二种方法: 若第一种方法无法恢复,则清空宕机节点的c ...
Vertica节点宕机处理一例
Vertica节点宕机处理一例: 查询数据库版本和各节点状态常规方式启动宕机节点失败进一步查看宕机节点的详细日志定位问题并解决 1. 查询数据库版本和各节点状态 dbadmin=> sel ...
elasticsearch介绍集群,模拟横向扩展节点、节点宕机、改变分片
出处:[http://www.cnblogs.com/dennisit/p/4133131.html] ,防楼主删博,故保留一份! elasticsearch用于构建高可用和可扩展的系统.扩展 ...
openstack高可用集群20-openstack计算节点宕机迁移方案
openstack计算节点宕机迁移方案情景一:/var/lib/nova/instances/ 目录不共享的处理方法(类似手动迁移云主机到其他节点)
『叶问』#41，三节点的MGR集群，有两个节点宕机后还能正常工作吗
『叶问』#41,三节点的MGR集群,有两个节点宕机后还能正常工作吗每周学点MGR知识. 1. 三节点的MGR集群,有两个节点宕机后还能正常工作吗要看具体是哪种情况. 如果两个节点是正常关闭的话,则 ...
mongodb副本集中其中一个节点宕机无法重启的问题
2-8日我还在家中的时候,被告知mongodb副本集中其中一个从节点因未知原因宕机,然后暂时负责代管的同事无论如何就是启动不起来. 当时mongodb的日志信息是这样的: 实际上这里这么长一串最重要的 ...

随机推荐

Mac 磁盘分区格式
Mac 磁盘分区格式来源 https://www.chadou.me/p/190 参考文章 macOS磁盘工具帮助在Mac系统中抹掉(格式化)磁盘的时候,要求选择分区方案,包括GUID分区图.主引 ...
OC与swift相互调用
一.OC调用swift文件二.swift调用OC文件三.注意和总结添加: 四.自定义桥接文件一.OC调用swift文件在OC项目中创建一个swift文件的时候,Xcode 会提示需要创建一 ...
【转载】C#中List集合使用Exists方法判断是否存在符合条件的元素对象
在C#的List集合操作中,有时候需要根据条件判断List集合中是否存在符合条件的元素对象,此时就可以使用List集合的扩展方法Exists方法来实现,Exists方法的签名为bool Exists( ...
js 的七大原则--单一原则、开闭原则、替换原则（一）
一.前言: js 的七大设计原则: 1.单一原则 2.开闭原则 3.里氏替换原则 4.依赖倒转原则 5.接口隔离原则 6.合成复用原则 7.迪米尔法则二.单一原则 1.定义:单一原则就是一个对象或者 ...
Qt 窗口相关的常用操作
PS: 本文使用的是Qt 4.8.4版本,不同版本代码可能会有差异设置窗口标题 setWindowTitle(QString::fromLocal8Bit("易语言")); 禁用 ...
UCOSIII等待多个内核对象
内核对象内核对象包括信号量.互斥信号量.消息队列和事件标志组 UCOSIII中允许任务同时等待多个信号量和多个消息队列主结构体 typedef struct os_pend_data OS_PEN ...
vi / vim 基本操作
进入vi的命令 vi filename :打开或新建文件,并将光标置于第一行首 vi n filename :打开文件,并将光标置于第n行首 vi filename :打开 ...
1-Spark-1-性能调优-数据倾斜1-特征/常见原因/后果/常见调优方案
数据倾斜特征:个别Task处理大部分数据后果:1.OOM;2.速度变慢,甚至变得慢的不可接受常见原因: 数据倾斜的定位: 1.WebUI(查看Task运行的数据量的大小). 2.Log,查看log ...
浅析MySQL使用 GROUP BY 分组聚合与细分聚合
原创文章,转载请注明出处:http://www.cnblogs.com/weix-l/p/7521278.html: 若有错误,请评论指出,谢谢! 1. 聚合函数(Aggregate Function ...
Windows 下的常规命令（收藏）
1. gpedit.msc-----组策略 2. sndrec32-------录音机 3. Nslookup-------IP地址侦测器 4. explorer-------打开资源管理器 5. l ...

Hadoop NameNode判断 DataNode 节点宕机的时间

Hadoop NameNode判断 DataNode 节点宕机的时间的更多相关文章

随机推荐

热门专题