Hadoop的HA集群启动和停止流程

假设我们有3台虚拟机，主机名分别是hadoop01、hadoop02和hadoop03。

这3台虚拟机的Hadoop的HA集群部署计划如下：

3台虚拟机的Hadoop的HA集群部署计划
hadoop01	zookeeper	journalnode	nodemanager	datanode	resourcemanager	namenode	zkfc
hadoop02	zookeeper	journalnode	nodemanager	datanode	resourcemanager	namenode	zkfc
hadoop03	zookeeper	journalnode	nodemanager	datanode


从上面的集群部署计划中可以看出，3台机器上都部署了Zookeeper、journalnode、nodemanager、datanode，而只有hadoop01和hadoop02这两台机器上部署有zkfc和ResourceManager以及NameNode。

下面是Hadoop的HA集群启动流程：

第一步，在Hadoop01机器上启动Zookeeper：

[root@hadoop01 ~]# /root/apps/zookeeper/bin/zkServer.sh start

第二步，在Hadoop02机器上启动Zookeeper：

[root@hadoop02 ~]# /root/apps/zookeeper/bin/zkServer.sh start

第三步，在Hadoop03机器上启动Zookeeper：

[root@hadoop03 ~]# /root/apps/zookeeper/bin/zkServer.sh start

启动Zookeeper之后，可以分别在3台机器上使用如下命令查看Zookeeper的启动状态：

/root/apps/zookeeper/bin/zkServer.sh status

第四步，在Hadoop01机器上启动HDFS：

[root@hadoop01 ~]# /root/apps/hadoop/sbin/start-dfs.sh

第五步，在Hadoop01机器上启动YARN：

[root@hadoop01 ~]# /root/apps/hadoop/sbin/start-yarn.sh

第六步，在Hadoop02机器上单独启动一个ResourceManager：

（注意这里使用的是“yarn-daemon.sh”命令，而不是“hadoop-daemon.sh”，不知道为什么使用“hadoop-daemon.sh”无法启动ResourceManager）

[root@hadoop02 ~]# /root/apps/hadoop/sbin/yarn-daemon.sh start resourcemanager

最后，分别在3台机器上使用jps命令查看进程：

[root@hadoop01 ~]# jps

2836 ResourceManager

2310 DataNode

2036 QuorumPeerMain

2630 DFSZKFailoverController

2481 JournalNode

2938 NodeManager

3212 Jps

2212 NameNode

[root@hadoop02 ~]# jps

2489 DFSZKFailoverController

3281 Jps

2193 QuorumPeerMain

2292 NameNode

2348 DataNode

3028 NodeManager

2427 JournalNode

3244 ResourceManager

[root@hadoop03 ~]# jps

2734 Jps

2420 DataNode

2327 QuorumPeerMain

2484 JournalNode

2616 NodeManager

[root@hadoop03 ~]#

如果某一个NameNode进程挂掉了的话，就使用如下命令单独启动一个NameNode：

/root/apps/hadoop/sbin/hadoop-daemon.sh start namenode

================================================================

下面是停止Hadoop的HA集群的流程：

第一步，在Hadoop01机器上停止HDFS：

[root@hadoop01 ~]# /root/apps/hadoop/sbin/stop-dfs.sh

第二步，在Hadoop01机器上停止YARN：

[root@hadoop01 ~]# /root/apps/hadoop/sbin/stop-yarn.sh

第三步，在Hadoop02机器上单独停止ResourceManager：

[root@hadoop02 ~]# /root/apps/hadoop/sbin/yarn-daemon.sh stop resourcemanager

第四步，在Hadoop01机器上停止Zookeeper：

[root@hadoop01 ~]# /root/apps/zookeeper/bin/zkServer.sh stop

第五步，在Hadoop02机器上停止Zookeeper：

[root@hadoop02 ~]# /root/apps/zookeeper/bin/zkServer.sh stop

第六步，在Hadoop03机器上停止Zookeeper：

[root@hadoop03 ~]# /root/apps/zookeeper/bin/zkServer.sh stop

最后，分别在3台机器上使用jps命令查看进程，确定有关进程是否停止成功。

[root@hadoop01 ~]# jps

4455 Jps

[root@hadoop02 sbin]# jps

4713 Jps

[root@hadoop03 ~]# jps

3208 Jps

如果启动或停止Hadoop的时候，遇到了问题，我们想查看一下日志，由于日志中的内容可能会非常多，我们改怎么查看呢？我们以查看hadoop01机器上的namenode的日志为例来说明一下，这里我们使用的是less命令：

[root@hadoop01 ~]# less /root/apps/hadoop/logs/hadoop-root-namenode-hadoop01.log

使用以上命令进入到日志之后，按回车光标处会显示一个冒号，输入斜杠“/”会进入到搜索模式，输入关键字再按回车，可以在日志中查询关键字小写的字母“n”可以向下搜索关键字，输入大写的字母“N”可以向上查找关键字。

在键盘上输入大写的字母“G”，可以瞬间跳转到日志的末尾。

输入小写字母“q”可以退出日志。

如果觉得本文对您有帮助，不妨扫描下方微信二维码打赏点，您的鼓励是我前进最大的动力：

Hadoop的HA集群启动和停止流程的更多相关文章

全网最详细的Hadoop HA集群启动后，两个namenode都是active的解决办法（图文详解）
不多说,直接上干货! 这个问题,跟全网最详细的Hadoop HA集群启动后,两个namenode都是standby的解决办法(图文详解) 是大同小异. 欢迎大家,加入我的微信公众号:大数据躺过的坑 ...
全网最详细的Hadoop HA集群启动后，两个namenode都是standby的解决办法（图文详解）
不多说,直接上干货! 解决办法因为,如下,我的Hadoop HA集群. 1.首先在hdfs-site.xml中添加下面的参数,该参数的值默认为false: <property> < ...
ZooKeeper学习之路（九）利用ZooKeeper搭建Hadoop的HA集群
Hadoop HA 原理概述为什么会有 hadoop HA 机制呢? HA:High Available,高可用在Hadoop 2.0之前,在HDFS 集群中NameNode 存在单点故障 (SP ...
hadoop namenode HA集群搭建
hadoop集群搭建(namenode是单点的) http://www.cnblogs.com/kisf/p/7456290.html HA集群需要zk, zk搭建:http://www.cnblo ...
hadoop搭建HA集群之后不能自动切换namenode
在搭好HA集群之后,想测试一下集群的高可用性,于是先把active的namenode给停掉: hadoop-daemon.sh stop namenode 或者直接kill掉该节点namenode的对 ...
ZooKeeper学习之路（十）Hadoop的HA集群的机架感知
一.背景 Hadoop 的设计目的:解决海量大文件的处理问题,主要指大数据的存储和计算问题,其中, HDFS 解决数据的存储问题:MapReduce 解决数据的计算问题 Hadoop 的设计考虑:设计 ...
搭建hadoop的HA集群模式（hadoop2.7.3+hive+spark）
参考:http://blog.51cto.com/12824426/2177663?source=drh 一.集群的规划 Zookeeper集群:192.168.176.131 (bigdata112 ...
hadoop yarn HA集群搭建
可先完成hadoop namenode HA的搭建:http://www.cnblogs.com/kisf/p/7458519.html 搭建yarnde HA只需要在namenode HA配置基础上 ...
Oracle RAC 集群启动与停止
Oracle RAC 启动时,需要使用 root 用户执行,为了方便,写了启动和停止的脚本, 将该脚本放到 /root/bin ,因为bin 目录本身就在环境变量里,所以使用时直接root用户运行脚本 ...

随机推荐

配置开发支持高并发TCP连接的Linux应用程序全攻略
http://blog.chinaunix.net/uid-20733992-id-3447120.html http://blog.chinaunix.net/space.php?uid=16480 ...
HDU 4910 Problem about GCD 找规律+大素数判断+分解因子
Problem about GCD Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others ...
uva 11417 - GCD
GCDInput: Standard Input Output: Standard Output Given the value of N, you will have to find the val ...
reactjs入门到实战（一）---- hello world例子
React 起源于 Facebook 的内部项目,因为该公司对市场上所有 JavaScript MVC 框架,都不满意,就决定自己写一套,用来架设 Instagram 的网站.做出来以后,发现这套东西 ...
如何用Pr完成作业~
要求~ 我的工具~(随便搞搞就好了,自己的录音还没弄~)
libevent系列之一——libevent介绍
摘自:http://libevent.org/ libevent概述:一套事件通知库. libevent提供一套机制完成以下功能:当指定的事件发生在file descriptor时或者超时后执行一个回 ...
dubbo源码之四——dubbo服务发布
dubbo版本:2.5.4 服务发布是服务提供方向注册中心注册服务过程,以便服务消费者从注册中心查阅并调用服务. 服务发布方在spring的配置文件中配置如下: <bean id="d ...
CodeForces 483C Diverse Permutation
Diverse Permutation Time Limit:1000MS Memory Limit:262144KB 64bit IO Format:%I64d & %I64 ...
[SAP ABAP开发技术总结]日期函数
声明:原创作品,转载时请注明文章来自SAP师太技术博客( 博/客/园www.cnblogs.com):www.cnblogs.com/jiangzhengjun,并以超链接形式标明文章原始出处,否则将 ...
FJNU 1153 Fat Brother And XOR（胖哥与异或）
FJNU 1153 Fat Brother And XOR(胖哥与异或) Time Limit: 1000MS Memory Limit: 257792K [Description] [题目描述] ...

Hadoop的HA集群启动和停止流程

Hadoop的HA集群启动和停止流程的更多相关文章

随机推荐

热门专题