这一讲主要深入使用HDFS命令行工具操作Hadoop分布式集群，主要是通过实验的配置hdfs-site.xml文件的心跳来测试replication具体的工作和流程。

通过HDFS的心跳来测试replication具体的工作机制和流程的PDF版本请猛击这里。

，每天都会在群中发布云计算实战性资料，欢迎大家加入！

在王家林第六讲Hadoop图文训练课程：使用HDFS命令行工具操作Hadoop分布式集群初体验中，我们配置了hadoop.main这台主机的hdfs-site.xml这个配置文件的“dfs.replication”的值为2：

当我们上传文件时候文件会保存2份副本：

下面我们通过实验的方式探究replication属性配置的作用。

首先关闭集群：

然后修改hadoop.main这台机器上的hdfs-site.xml配置文件：

在这个配置文件中加入新的配置信息：

保存退出。

新加入的配置信息：

的具体含义是当DataNode和NameNode的心跳失去连接的时间超过15秒之后，Hadoop系统就会认为这个DataNode已经死亡，此时Hadoop会把这个DataNode标记为不能工作的状态，以后如果客户端去访问数据的时候，Hadoop就不会尝试到这个DataNode去获取数据。

下面看一下其工作的具体方式：

首先启动HDFS:

进入HDFS的Web监控台的Node页面：

我们发现hadoop.main和hadoop.slave这两个DataNode均在正常的工作中。

我们观察到“Last Contact”选项的数据，该数据是表明DataNode和NameNode最近联系的心跳成功的时间，我们再次刷新页面看一下这个数据：

我们发现这个具体的数据时比较低的。

此时我们通过命令行工作查看datanode进程：

我们发现hadoop.main上运行的DataNode节点的进程是16228，我们把这个DataNode杀掉：

我们再次刷新HDFS的Node的控制台：

继续刷新：

继续刷新：

可以发现第一个DataNode的心跳时间不断的在增加，同时在第三次刷新的时候心跳间隔时间为25，这个数据超过我们配置文件中的15，再刷新一次：

此时发现只有一个正在服务的DataNode，因为我们的Hadoop.main中的DataNode心跳间隔时间超过了15秒，Hadoop此时把把该节点标记为无效节点。

我们返回文件系统页面看一下我们上传的文件存储信息：

此外发现文件的可访问信息只是存放在了hadoop.slave这个节点中了，当然，此时我们还是可以正常的访问文件，虽然只有一份可用副本，这就是replication节点的作用，我们在配置该节点的时候把值设置为2，表明同一个文件在HDFS中有两个副本，当一个运行DataNode的进程因为某些原因不能工作的时候，我们依旧可以使用剩余的一份副本工作，这不会影响客户端对数据的访问。

云计算分布式大数据Hadoop实战高手之路第七讲Hadoop图文训练课程：通过HDFS的心跳来测试replication具体的工作机制和流程的更多相关文章

云计算分布式大数据Hadoop实战高手之路第八讲Hadoop图文训练课程：Hadoop文件系统的操作实战
本讲通过实验的方式讲解Hadoop文件系统的操作. “云计算分布式大数据Hadoop实战高手之路”之完整发布目录云计算分布式大数据实战技术Hadoop交流群:312494188,每天都会在群中发布云 ...

Spark GraphX宝刀出鞘，图文并茂研习图计算秘笈与熟练的掌握Scala语言【大数据Spark实战高手之路】
Spark GraphX宝刀出鞘,图文并茂研习图计算秘笈大数据的概念与应用,正随着智能手机.平板电脑的快速流行而日渐普及,大数据中图的并行化处理一直是一个非常热门的话题.图计算正在被广泛地应用于社交 ...

王家林的“云计算分布式大数据Hadoop实战高手之路---从零开始”的第十一讲Hadoop图文训练课程：MapReduce的原理机制和流程图剖析
这一讲我们主要剖析MapReduce的原理机制和流程. “云计算分布式大数据Hadoop实战高手之路”之完整发布目录云计算分布式大数据实战技术Hadoop交流群:312494188,每天都会在群中发 ...

王家林的81门一站式云计算分布式大数据&移动互联网解决方案课程第14门课程：Android软硬整合设计与框架揭秘： HAL&Framework &Native Service &App&HTML5架构设计与实战开发
掌握Android从底层开发到框架整合技术到上层App开发及HTML5的全部技术: 一次彻底的Android架构.思想和实战技术的洗礼: 彻底掌握Andorid HAL.Android Runtime ...

一站式Hadoop&Spark云计算分布式大数据和Android&HTML5移动互联网解决方案课程（Hadoop、Spark、Android、HTML5）V2的第一门课程
Hadoop是云计算的事实标准软件框架,是云计算理念.机制和商业化的具体实现,是整个云计算技术学习中公认的核心和最具有价值内容. 如何从企业级开发实战的角度开始,在实际企业级动手操作中深入浅出并循序渐 ...

云计算分布式大数据神器Spark实战高手之旅
从2012年1月份研究Spark到如今已经两年多的时间了. 在这两年多的时间里比較彻底的研究了Spark的源码并已经在2014年4月24日编写完毕了世界上第一本Spark书籍. 鉴于CSDN在大陆IT ...

云计算、大数据、编程语言学习指南下载，100+技术课程免费学！这份诚意满满的新年技术大礼包，你Get了吗？
开发者认证.云学院.技术社群,更多精彩,尽在开发者会场近年来,新技术发展迅速.互联网行业持续高速增长,平均薪资水平持续提升,互联网技术学习已俨然成为学生.在职人员都感兴趣的“业余项目”. 阿里云大学 ...

大数据开发实战：Hadoop数据仓库开发实战
1.Hadoop数据仓库架构设计如上图. ODS(Operation Data Store)层:ODS层通常也被称为准备区(Staging area),它们是后续数据仓库层(即基于Kimball维度 ...

终于有人把云计算、大数据和 AI 讲明白了
最近学习hadoop以及生态,顺便看到了这篇文章,总结的很到位,转载下. 我今天要讲这三个话题,一个是云计算,一个大数据,一个人工智能,我为什么要讲这三个东西呢?因为这三个东西现在非常非常的火,它们之 ...

随机推荐

无开发经验，初学python
1.无开发经验,初学python 如果你不会其他语言,python是你的第一门语言: A Byte of Python (简明python教程,这个有中文版简明 Python 教程)是非常好的入门 ...

pyhton3多线程
from time import ctime,sleep def music(): for i in range(2): print ("I was listening to music. ...

【HDOJ】3208 Integer’s Power
1. 题目描述定义如下函数$f(x)$:对于任意整数$y$,找到满足$x^k = y$同时$x$最小并的$k$值.所求为区间$[a, b]$的数代入$f$的累加和,即\[\sum_{x=a}^{b} ...

《OD学Hive》第六周20160730
一.Hive的JDBC连接日志分析结果数据,存储在hive中 <property> <name>hive.server2.thrift.port</name> & ...

Vector示例一,二
#include <iostream> int main(void) { double a[] = {1, 2, 3, 4, 5}; std::cout<<mean(a, 5) ...

Less tips:声明变量之前可以引用变量！
Less中的variable可以在使用之后才被声明,这一特性对于希望覆盖前期声明的(比如bootstrap等第三方library的variable)变量,从而优雅地使用你希望的效果提供了便利. 比如 ...

多个MapReduce作业相互依赖时，使用JobControl进行管理
要处理复杂关系的数据,一个工程里面绝对不止一个MapReduce作业,当有多个MapReduce作业时, 并且每个作业之间有依赖关系,所谓的依赖就是一个作业得到的结果是另外一个作业的输入, ...

[转]FFMPEG视音频编解码零基础学习方法
在CSDN上的这一段日子,接触到了很多同行业的人,尤其是使用FFMPEG进行视音频编解码的人,有的已经是有多年经验的“大神”,有的是刚开始学习的初学者.在和大家探讨的过程中,我忽然发现了一个问题:在“ ...

Fragment的知识总结
1. Fragment概念及作用. 以下是使用Fragment提供思路 2. 创建继承于 Fragment的类:(可extends Fagment 或 ListFagment) 注意导包:如果考虑兼 ...

python练习程序（c100经典例10）
题目: 打印楼梯,同时在楼梯上方打印两个笑脸. print '..' for i in range(1,9): print '**' for j in range(1,i+1): print ' ',

云计算分布式大数据Hadoop实战高手之路第七讲Hadoop图文训练课程：通过HDFS的心跳来测试replication具体的工作机制和流程

在王家林 第六讲Hadoop图文训练课程：使用HDFS命令行工具操作Hadoop分布式集群初体验中，我们配置了hadoop.main这台主机的hdfs-site.xml这个配置文件的“dfs.replication”的值为2：

云计算分布式大数据Hadoop实战高手之路第七讲Hadoop图文训练课程：通过HDFS的心跳来测试replication具体的工作机制和流程的更多相关文章

随机推荐

热门专题

在王家林第六讲Hadoop图文训练课程：使用HDFS命令行工具操作Hadoop分布式集群初体验中，我们配置了hadoop.main这台主机的hdfs-site.xml这个配置文件的“dfs.replication”的值为2：