为什么要用集群?
企业里面,多台机器 伪分布式 每一个角色都是一个进程 HDFS:
NN
SNN
DN YARN:
RM
NM 大数据所有组件, 都是主从架构 master-slave
HDFS读写请求都是先到NN节点,
但是,HBase 读写请求不是经过master, 建表和删除表是需要经过master NN节点挂了,就不能提供对外服务 (-put,-get)
需要配置两个NN节点(实时的,任何时刻只有一台active对外,
另外一台是standby,做实时备份,
随时准备着从standby切换到active状态,对外服务)
NN1 active 11:00点,挂了 hdfs://ip1:8020/ 代码,shell脚本
NN2 standby active hdfs://ip2:8020/
当前对外提供服务的只有一台机器提供,另外一台机器随时准备着
SNN 1h checkpoint 提供备份(fsimage+editlog) 如果有了HA,就不需要SNN了
假设11:00点,NN1挂了,NN2会在一刹那间,切换成active,对外服务. 无感知的
命名空间 nameservice1 CDH
dw NN节点有两个文件: fsimage editlog(读写请求记录)
SNN 用于checkpoint,合并fsimage+editlog HA进程: 3 台机器
hadoop001: ZK NN ZJFC JN DN hadoop002: ZK NN ZKFC JN DN hadoop003: ZK ZKFC JN DN JounalNode(实时日志记录): HDFS数据量及请求量
HDFS请求比较频繁,就要记录数据, 几十T,就搞多一点
HDFS很悠闲,搞个 7台即可. 如果机器20台,和ZK保持一致 ZKFC 手动切换 ZK集群: 做选举 (leader(active), follower(standby)) 生产上节点部署:
20台节点: 5台ZK (2n+1) 奇数
20~~100台节点: 7/9/11台ZK
>100台节点: 11台ZK
但是:
1.不是说ZK节点越多越好
2.zk越多,当我们选举的时候,性能很慢 几百台节点,ZK部署的机器就它一个进程,任务很重,还有其他进程,会消耗资源,会影响ZK选举的性能.
32G / 256G
ZK是最底层的,如果ZK进程繁忙,导致不能进行选举,就不能对外提供服务
standby 如果 不能切换到 active 状态,就是ZK的问题 进程: ps -ef
线程: 存在于进程中 ZKFC: Zookeeper Failover Control (Zookeeper故障转移控制) 当我们通过Cliecnt提交我们的请求的时候,读写,通过ruozeg6 命名空间进行找去找active,找到后,在那个机器上面进行真正的请求. 读写, 此时就是HDFS的读写流程. editlog自己写一份,同时写一份都JounalNode,同时standby的NN节点,会进行重演, 此时DN会向相隔NN发送心跳和快报告.
参数和时间是多少 可以去官网找配置文件 (这两个参数去找,进行整理) ZKFC,当一台机器挂了,通过zk进行选举,zk会通知ZKFC,切换成active状态.
ZKFC会定期向zk发送心跳. ------------------------------------- HA是为了解决单点问题
通过JN集群共享状态
通过ZKFC选举active
监控状态,自动备援
DN: 同时向NN1 NN2发送心跳和快报告
ACTIVE NN: 操作记录写到自己的editlog,
同时写到JN集群
接收DN的心跳和快报告
STANDBY NN: 同时接受JN集群的日志,显式读取执行log操作(重演)
使得自己的元数据和ACTIVE NN节点保持一致 (备份元数据)
同时接收心跳和快报告 JounalNode: 用于ACTIVE NN 与STANDBY NN节点的 数据同步
一般部署2n+1 ZKFC: 单独的进程
监控NN健康状态
向zk集群定期发送心跳,使得自己可以被选举;随时准备着
当自己被zk选举为active的时候,zkfc进程通过RPC协议调用,使NN节点的状态变为active. 只有active状态,才能对外提供实时服务. 它是无感知的 standby状态是不行的.

Hadoop HA 架构的更多相关文章

  1. hadoop HA架构安装部署(QJM HA)

    ###################HDFS High Availability Using the Quorum Journal Manager########################## ...

  2. hadoop HA架构

    什么是Hadoop? http://hadoop.apache.org/ 解决问题:·海量数据的存储 (HDFS)·海量数据的分析 (MapReduce)·资源管理调度 (YARN) 集群规划:(这里 ...

  3. Hadoop技术之Hadoop HA 机制学习

    欢迎大家前往腾讯云技术社区,获取更多腾讯海量技术实践干货哦~ 作者:温球良 导语 最近分享过一次关于Hadoop技术主题的演讲,由于接触时间不长,很多技术细节认识不够,也没讲清楚,作为一个技术人员,本 ...

  4. hadoop HA 详解

    NameNode 高可用整体架构概述 在 Hadoop 1.0 时代,Hadoop 的两大核心组件 HDFS NameNode 和 JobTracker 都存在着单点问题,这其中以 NameNode ...

  5. hadoop HA学习

    一 HDFS HA架构图 二 HDFS HA组件 Active NameNode和Standby NameNode 在NameNode的HA方案中有两个不同状态的NameNode,分别为活跃态(Act ...

  6. hadoop HA分布式集群搭建

    概述 hadoop2中NameNode可以有多个(目前只支持2个).每一个都有相同的职能.一个是active状态的,一个是standby状态的.当集群运行时,只有active状态的NameNode是正 ...

  7. Hadoop(HA)分布式集群部署

    Hadoop(HA)分布式集群部署和单节点namenode部署其实一样,只是配置文件的不同罢了. 这篇就讲解hadoop双namenode的部署,实现高可用. 系统环境: OS: CentOS 6.8 ...

  8. Hadoop HA 深度解析

    社区hadoop2.2.0 release版本开始支持NameNode的HA,本文将详细描述NameNode HA内部的设计与实现. 为什么要Namenode HA? 1. NameNode High ...

  9. 1、hadoop HA分布式集群搭建

    概述 hadoop2中NameNode可以有多个(目前只支持2个).每一个都有相同的职能.一个是active状态的,一个是standby状态的.当集群运行时,只有active状态的NameNode是正 ...

随机推荐

  1. 参加杭州 2019 AI Bootcamp有感与总结(1)

    上周末参加了微软人工智能的活动,感慨多多. 感谢活动主讲和主办方. 通过参加活动,对微软认知服务和ML.NET的现状与发展有了更多的认识.文章不是活动内容的堆叠,总结少点,更多的大概是感慨. 微软认知 ...

  2. Java设计模式13:责任链模式

    前言 来菜鸟这个大家庭10个月了,总得来说比较融入了环境,同时在忙碌的工作中也深感技术积累不够,在优秀的人身边工作必须更加花时间去提升自己的技术能力.技术视野,所以开一个系列文章,标题就轻松一点叫做最 ...

  3. Python爬虫基础面试题,为2020年初就业做准备

    前言本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理.作者:qiaoziheng 一.题目部分1.python中常用的数据结构有哪些 ...

  4. js 日期格式化小问题

    看一个图 toLocaleString 的格式是 yyyy/MM/d , 想要 yyyy/MM/dd, toISOString 的格式基本满足, 本想直接 split("T"),  ...

  5. 持续集成(CI):Jmeter+Ant+Jenkins定时构建

    这里Jenkins的安装部署以及工程项目的整体配置不做赘述,其它博文已经说明,这里主要是赘述Ant的相关配置,build.xml文件配置以及项目中的部分配置 一.build.xml 在Ant的安装目录 ...

  6. 一起学SpringMVC之Request方式

    本文主要以一些简单的小例子,简述在SpringMVC开发过程中,经常用到的Request方面的内容,仅供学习分享使用,如有不足之处,还请指正. 概述 在客户机和服务器之间进行请求-响应时,两种最常被用 ...

  7. 对Python中一些“坑”的总结及技巧

    一.赋值即定义 1.运行以下代码会出现报错 #!/usr/bin/env python #_*_conding:utf-8_*_ x = 100 def outer(): def inner(): x ...

  8. 微信小程序模板(template)和组件的区别

    template模块主要是展示,方法需要在使用template的页面中定义,对于通用的数据,最先想到或者理应是template,但是template有个缺点,那就是只是页面效果,不会有对应的js操作. ...

  9. SQL Server启动/关闭xp_cmdshell

    ==>启用xp_cmdshell USE master RECONFIGURE WITH OVERRIDE RECONFIGURE WITH OVERRIDE RECONFIGURE WITH ...

  10. 如何抓取 framework input 事件相关 log

    出现事件输入相关的问题时, 建议先 followhttp://429564140.iteye.com/blog/2355405来检测对应的设备是否有响应输入 如果没有响应输入,则可能是 driver ...