Hadoop学习笔记记录

NameNode的介绍：

NameNode是HDFS的核心，也称为master,它仅存储元数据（文件系统中所有文件的目录树）

NameNode不存储实际的数据或数据集，数据本身存储在DateNodes中

NameNode知道HDFS中任何给定文件的块列表及其位置信息，当NameNode

关闭时，Hdfs/Hardoop集群无法访问

DateNode的介绍：

Datanode启动时，他将自己发布到NameNode 并汇报自己负责持有的块列表

当某个dataNode 关闭时，不会影响数据或集群的可用性

DateNode会定期（默认3秒钟）向Namenode发送心跳，如果NameNode长时间

没有收到心跳信息，就认为datenode失效。

DataNode还会定期的（默认是6小时）向nameNode发送自己所持有的块信息

HDFS的工作机制：

NameNode负责整理整个文件系统元数据：DataNode负责管理具体的文件数据块

存储：secondary NameNode协助NameNode进行元数据的备份

HDFS写数据流程：

1）客户端请求上传文件

2）Namenode检测文件系统目录树，如果目录树中相应位置不存在，则返回客户

端可以上传，请求上传文件的3个备份，检测dataNode 的信息池，返回3个可用的

dataNode的地址信息

3）建立连接，请求数据传输，建立管道plpeline-->建立数据传输流（以大小为64K的包

为单位）

4）dataNode保存传递过来源源不断的数据包，

HDFS读数据流程：

1）客户端请求读取文件

2）NameNode 向客户端返回跟请求相关的文件所有的元数据信息

3）客户端向dataNode请求下载下载文件的不同数据块并进行合并

MapReduce的运行介绍：

1）MRAppmaster:负责整个程序过程调度以及状态协调

2）MapTask:负责Map阶段整个数据处理流程

3）ReduceTask：负责reduce阶段的整个数据处理流程

Hadoop学习笔记记录的更多相关文章

Hadoop学习笔记(7) ——高级编程
Hadoop学习笔记(7) ——高级编程从前面的学习中,我们了解到了MapReduce整个过程需要经过以下几个步骤: 1.输入(input):将输入数据分成一个个split,并将split进一步拆成 ...
Hadoop学习笔记(2)
Hadoop学习笔记(2) ——解读Hello World 上一章中,我们把hadoop下载.安装.运行起来,最后还执行了一个Hello world程序,看到了结果.现在我们就来解读一下这个Hello ...
Hadoop学习笔记(2) ——解读Hello World
Hadoop学习笔记(2) ——解读Hello World 上一章中,我们把hadoop下载.安装.运行起来,最后还执行了一个Hello world程序,看到了结果.现在我们就来解读一下这个Hello ...
Hadoop学习笔记—5.自定义类型处理手机上网日志
转载自http://www.cnblogs.com/edisonchou/p/4288737.html Hadoop学习笔记—5.自定义类型处理手机上网日志一.测试数据:手机上网日志 1.1 关于这 ...
Hadoop学习笔记(9) ——源码初窥
Hadoop学习笔记(9) ——源码初窥之前我们把Hadoop算是入了门,下载的源码,写了HelloWorld,简要分析了其编程要点,然后也编了个较复杂的示例.接下来其实就有两条路可走了,一条是继续 ...
Hadoop学习笔记(8) ——实战做个倒排索引
Hadoop学习笔记(8) ——实战做个倒排索引倒排索引是文档检索系统中最常用数据结构.根据单词反过来查在文档中出现的频率,而不是根据文档来,所以称倒排索引(Inverted Index).结构如 ...
Hadoop学习笔记之HBase Shell语法练习
Hadoop学习笔记之HBase Shell语法练习作者:hugengyong 下面我们看看HBase Shell的一些基本操作命令,我列出了几个常用的HBase Shell命令,如下: 名称命令 ...
hadoop学习笔记（四）：HDFS文件权限，安全模式，以及整体注意点总结
本文原创,转载注明作者和原文链接! 一:总结注意点: 到现在为止学习到的角色:三个NameNode.SecondaryNameNode.DataNode 1.存储的是每一个文件分割存储之后的元数据信息 ...
Hadoop学习笔记—22.Hadoop2.x环境搭建与配置
自从2015年花了2个多月时间把Hadoop1.x的学习教程学习了一遍,对Hadoop这个神奇的小象有了一个初步的了解,还对每次学习的内容进行了总结,也形成了我的一个博文系列<Hadoop学习笔 ...

随机推荐

java-log4j日志打印
参考路径: https://blog.csdn.net/edward0830ly/article/details/8250412 https://www.cnblogs.com/ITtangtang/ ...
Linux文件夹文件改英文
打开终端,在终端中输入命令: export LANG=en_US xdg-user-dirs-gtk-update 跳出对话框询问是否将目录转化为英文路径,同意并关闭. 在终端中输入命令: expor ...
【转】Docker简介与入门
转自:https://segmentfault.com/a/1190000000448808 Docker是个新生的事物,概念类似虚拟化.网上关于Docker入门的东西已经很多了.不过本文探讨了Doc ...
【C++】类中this指针的理解
转自苦涩的茶https://www.cnblogs.com/liushui-sky/p/5802981.html C++类中this指针的理解先要理解class的意思.class应该理解为一种类型 ...
EVM项目管理
详细参照:https://zhuanlan.zhihu.com/p/33925657 报告日实际: 按预算完成按原始cpi完成按时完成
微信小程序布局
尺寸单位与设计原则首先,我们现在页面中引入一张图片但是实际上,这个图片的大小是32*18的,之所以会显示这么大,是因为image组件默认的宽度为300px,默认的高度为225px,如果我们需 ...
激活WINDOWS SERVER 2019
Windows Server 2019 Datacenter WMDGN-G9PQG-XVVXX-R3X43-63DFGWindows Server 2019 Standard N69G4-B89J2 ...
qnx spi 学习笔记
文档还在编辑中,目前排版很乱,边看边写..等写完了编辑 qnx spi 学习 --目前只是看了代码,学的不深入,有错误的地方请联系我谢谢 spi init spi init应该是分为2条线,一条是 ...
[SQL]事务回滚详解及示例
存储过程中的 SET XACT_ABORT ON 和事务在存储过程中写SET XACT_ABORT ON 有什么用? SET XACT_ABORT ON是设置事务回滚的! 当为ON时,如果你存储中的 ...
iPerf 笔记
iPerf 笔记 iperf 是一个网络性能测试工具,可以测试最大TCP和UDP带宽质量,具有多种参数和UDP特性,可以报告带宽.延迟抖动和数据包丢失. iperf 可以用来测一些网络设备,比如路由器 ...

Hadoop学习笔记记录

Hadoop学习笔记记录的更多相关文章

随机推荐

热门专题