HDFS-SecondaryNameNode（SNN）角色介绍

它出现在Hadoop1.x版本中，又称辅助NameNode，在Hadoop2.x以后的版本中此角色消失。如果充当datanode节点的一台机器宕机或者损害，其数据不会丢失，因为备份数据还存在于其他的datanode中。但是，如果充当namenode节点的机器宕机或损害导致文件系统无法使用，那么文件系统上的所有文件将会丢失，因为我们不知道如何根据datanode的块重建文件。因此，对namenode实现容错非常重要。Hadoop提供了两种机制实现高容错性。

第一种机制是备份那些组成文件系统元数据持久状态的文件。Hadoop可以通过配置使namenode在多个文件系统上保存元数据的持久化状态。这些写操作是实时同步的，是原子操作。一般的配置是，将持久状态写入本地磁盘的同时，写入一个远程挂载的网络文件系统(NFS)。

另一种可行的方法是运行一个辅助namenode，但是它不能用作namenode，这个辅助namenode，在hadoop1.x中被称为secondary namenode，在hadoop2.x中，利用高可用（HA）解决单点故障问题。

Secondary namenode，以下简称SN，其重要作用是定期将编辑日志和元数据信息合并，防止编辑日志文件过大，并且能保证其信息与namenode信息保持一致。SN一般在另一台单独的物理计算机上运行，因为它需要占用大量CPU时间来与namenode进行合并操作，一般情况是单独开一个线程来执行操作过程。但是，SN保存的信息永远是滞后于namenode，所以在namenode失效时，难免会丢失部分数据。在这种情况下，一般把存储在NFS上的namenode元数据复制到SN并作为新的namenode。SN不是namenode的备份，可以作为备份。SN主要工作是帮助NN合并edits和fsimage，减少namenode的启动时间。

它不是NameNode的备份，但可以做备份，其主要工作是帮助NameNode合并editslog，减少NameNode的启动时间。SecondaryNameNode执行合并的时机决定于：

（1）配置文件设置的时间间隔fs.checkpoint.period，默认为3600秒。

（2）配置文件设置edits log大小fs.checkpoint.size,规定edits文件的最大值默认是64MB。

图1.6 SecondaryNameNode合并流程

如上图，当namenode运行了3600s后，SN取出fsimage和edits，合并，更新fsimage，命名为fsimage.ckpt，将fsimage.ckpt文件传入namenode中，合并过程中，客户端会继续上传文件。同时，namenode会创建新的edits.new文件，将合并过程中，产生的日志存入edits.new，namenode将 fsimage.ckpt,更名为fsimage，edits.new更名为edits。

如果在合并过程中，namenode损坏，那么，丢失了在合并过程中产生的edits.new,因此namenode失效时，难免会丢失部分数据。

HDFS-SecondaryNameNode（SNN）角色介绍的更多相关文章

Spark角色介绍及spark-shell的基本使用
Spark角色介绍 1.Driver 它会运行客户端的main方法,构建了SparkContext对象,它是所有spark程序的入口 2.Application 它就是一个应用程序,包括了Driver ...
HDFS中hsync方法介绍
HDFS中hsync方法介绍原创文章,转载请注明:博客园aprogramer 原文链接:HDFS中hsync方法介绍 1. 背景介绍 HDFS在写数据务必要保证数据的一致性与持久性,从HDFS最初的 ...
【Q】类和对象：游戏角色开发（角色介绍）
案例情景:某公司要开发新游戏,请用面向对象的思想设计英雄类.怪物类和武器类. 编写测试类,创建英雄对象.怪物对象和武器对象,并输出各自的信息. 其中设定分别如下: 1.英雄类属性:英雄名字.生命值. ...
2 Spark角色介绍及运行模式
第2章 Spark角色介绍及运行模式 2.1 集群角色从物理部署层面上来看,Spark主要分为两种类型的节点,Master节点和Worker节点:Master节点主要运行集群管理器的中心化部分,所承 ...
HBase在HDFS上的目录介绍
总所周知,HBase 是天生就是架设在 HDFS 上,在这个分布式文件系统中,HBase 是怎么去构建自己的目录树的呢? 第一,介绍系统级别的目录树. 一.0.94-cdh4.2.1版本系统级别的一 ...
大数据框架hadoop服务角色介绍
翻了一下最近一段时间写的分享,DKHadoop发行版本下载.安装.运行环境部署等相关内容几乎都已经写了一遍了.虽然有的地方可能写的不是很详细,个人理解水平有限还请见谅吧!我记得在写DKHadoop运行 ...
Windows Server 2016-FSMO操作主机角色介绍
FSMO五个操作主机角色 1.林范围操作主机角色(两种): 架构主机角色:Schema Master 域命名主机角色:Domain Naming Master 2.域范围操作主机角色(三种): 域范围 ...
012_Eclipse中使用 HDFS URL API 事例介绍
本事例其实和使用hdfs FileSystem API差不多,FileSystem API也是通过解释成URL在hdfs上面执行的,性质相同,但是实际中用的fFileSystem会多一点,源码如下: ...
javascript中间preventDefault与stopPropagation角色介绍
preventDefault的作用是什么方法,它? 我们知道,例如,<a href="http://www.baidu.com">百度</a>,这是html ...

随机推荐

linux设置程序运行超时时间
在某些情况下,我们需要限制程序的运行时间(比如cronjob等),这里简单介绍下使用信号及timeout的实现方法 1. 假如有如下代码(test_timout.sh): #!/bin/bash wh ...
Mac下 python2和python3共存
一般是python2默认安装了,python3没有安装,这时候一般使用命令:brew install python3 进行安装不同方法安装python的路径是不一样的,如下所示: 接下来就要看具体步 ...
Python之内置装饰器property
# -*- coding: utf-8 -*- # author:baoshan class Student(object): def __init__(self, name): self.name ...
how-does-mysql-replication-really-work/ what-causes-replication-lag
https://www.cnblogs.com/kevingrace/p/6274073.html https://www.cnblogs.com/kevingrace/p/6261091.html ...
gdb命名记录
gdb常用命令显示类 info locals 显示当前局部变量 info args 显示当前函数的参数 info sharedlibrary 显示当前程序依赖的动态库 ptype val 打印变量类 ...
[LeetCode] 636. Exclusive Time of Functions 函数的独家时间
Given the running logs of n functions that are executed in a nonpreemptive single threaded CPU, find ...
leetocode 207 课程表
解题思路: 本题可约化为:课程安排图是否是有向无环图(DAG).即课程间规定了前置条件,但不能构成任何环路,否则课程前置条件将不成立. 思路是通过拓扑排序判断此课程安排图是否是有向无环图(DA ...
Qt编译理解（Qt 对 C++ 的扩展主要是3个方面）
沉沉的黑夜都是白天的前奏.--郭小川舍弃IDE或qmake.cmake等工具的束缚,通过几个例子, 一步步从标准 C++ 的编译过渡到 Qt 的编译. Qt 对 C++ 的扩展主要是3个方面: 1) ...
GCC 基础知识
目录 GCC 基础知识一.GCC编译选项解析二.多模块.多个文件一起编译三.静态库与动态库四.查看帮助文档 GCC 基础知识一.GCC编译选项解析 1. 常用编译选项命令格式:gcc [选 ...
java笔记3
面向对象的特点: 1.封装: 2.继承 3.多态好处: 是一种符合人们思考习惯的思想可以将复杂的事情简单化将程序员从执行者变为指挥者二类与对象成员变量与局部变量的区别: ...

HDFS-SecondaryNameNode（SNN）角色介绍

HDFS-SecondaryNameNode（SNN）角色介绍的更多相关文章

随机推荐

热门专题