使用QJM部署HDFS HA集群

一寸相思万千劫 2024-10-30 10:30:47 原文

一、所需软件

　　1. JDK版本

　　　　下载地址：http://www.oracle.com/technetwork/java/javase/index.html

　　　　版本： jdk-7u79-linux-x64.gz

　　2. Hadoop软件

　　　　下载地址：http://hadoop.apache.org/releases.html

　　　　版本： hadoop-2.6.0.tar.gz

二、配置ssh免密码登陆：

　　查阅之前博客：http://www.cnblogs.com/yinchengzhe/p/4967928.html

三、环境说明

　　主备NameNode有多种配置，本文采用QJM(Quorum Journal Manager) ，主备NameNode应位于不同机器上

　　集群中包括4个节点：1个Master，3个Salve，节点之间局域网连接，可以相互ping通。

　　本人有3台云主机，主机名分别为h1,h2,h3。由于资源紧缺，master和其中一个salve共用h1主机。

　　搭建手动切换ha集群，较自动切换少了一个zookeeper集群。

　　主机分布情况如下：

　　h1: master namenode(主) journalnode datanode

　　h2: salve　 namenode(备) journalnode datanode

　　h3: salve　　　　　　　　　 journalnode datanode

四、HDFS HA (QJM)集群安装

　　参考官网site：http://hadoop.apache.org/docs/r2.6.0/hadoop-project-dist/hadoop-hdfs/HDFSHighAvailabilityWithQJM.html

　　1. 在h1上解压hadoop-2.6.0.tar.gz并重命名为hadoop

　　　　> tar zxvf hadoop-2.6.0.tar.gz

　　　　> mv hadoop-2.6.0 hadoop

　　2. 配置hadoop-env.sh

　　　　配置jdk路径，如： export JAVA_HOME=/root/software/jdk1.7.0_79

　　3. 配置core-site.xml

　　　　修改Hadoop核心配置文件core-site.xml，这里配置的是HDFS的地址和端口号

　　　　> cd /hadoop/etc/hadoop

　　　　> vim core-site.xml

　　　　配置如下：

　　　　

　　　　注：此处h1为本机的hostname

　　4. 配置slaves

　　　　此配置为master主机特有，配置此文件有两种方式

　　　　第一种：去掉"localhost"，每行只添加一个主机名，把所有的Slave主机名都填上。

　　　　　　如：h1

　　　　　　　　h2

　　　　　　　　h3

　　　　第二种：去掉"localhost"，加入集群中所有Slave机器的IP，也是每行一个。

　　　　　　如：192.168.1.1

　　　　　　　　192.168.1.2

　　　　　　　　192.168.1.3

　　5. 配置hdfs-site.xml

　　　　如下所示：

　　　　

　　　　(1). dfs.nameservices

　　　　　　集群中命名服务列表（自定义）

　　　　(2). dfs.ha.namenodes.[nameservice ID]

　　　　　　命名服务中的namenode逻辑名称（自定义）

　　　　(3). dfs.namenode.rpc-address.[nameservice ID].[name node ID]

　　　　　　命名服务中逻辑名称对应的RPC地址

　　　　(4). dfs.namenode.http-address.[nameservice ID].[name node ID]

　　　　　　命名服务中逻辑名称对应的HTTP地址

　　　　(5). dfs.namenode.name.dir

　　　　　　NameNode fsiamge存放目录

　　　　(6). dfs.namenode.shared.edits.dir

　　　　　　主备NameNode同步元信息的共享存储系统

　　　　(7). dfs.journalnode.edits.dir

　　　　　　Journal Node数据存放目录

　　6. 将h1上的hadoop文件夹复制到h2、h3节点上

　　7. 启动关闭HDFS

　　　　步骤1：在各个JournalNode节点上，输入以下命令启动journalnode服务：

　　　　　　　　> sbin/hadoop-daemon.sh start journalnode
　　　　步骤2：在[nn1]上，对其进行格式化，并启动：
　　　　　　　　> bin/hdfs namenode -format
　　　　　　　　> sbin/hadoop-daemon.sh start namenode
　　　　步骤3：在[nn2]上，同步nn1的元数据信息：
　　　　　　　　> bin/hdfs namenode -bootstrapStandby
　　　　步骤4：在[nn2]，启动NameNode：
　　　　　　　　> sbin/hadoop-daemon.sh start namenode
　　　　（经过以上四步操作，nn1和nn2均处理standby状态）
　　　　步骤5：在[nn1]上，将NameNode切换为Active
　　　　　　　　> bin/hdfs haadmin -transitionToActive nn1
　　　　步骤6：在[nn1]上，启动所有datanode
　　　　　　　　> sbin/hadoop-daemons.sh start datanode

　　　　启动成功可通过jps命令查看结果，如下所示：

　　　　

　　　　

　　　　

　　　　

　　　　关闭：

　　　　在[nn1]上输入命令 sbin/stop-dfs.sh

　　8. HDFS WEB界面浏览

　　　　Windows访问Linux方式参照 http://www.cnblogs.com/yinchengzhe/p/5012936.html

　　　　启动hdfs后界面如下：

　　　　

　　　　

使用QJM部署HDFS HA集群的更多相关文章

手动部署 kubernetes HA 集群
前言关于kubernetes HA集群部署的方式有很多种(这里的HA指的是master apiserver的高可用),比如通过keepalived vip漂移的方式.haproxy/nginx负载均 ...
JAVA API连接HDFS HA集群
使用JAVA API连接HDFS时我们需要使用NameNode的地址,开启HA后,两个NameNode可能会主备切换,如果连接的那台主机NameNode挂掉了,连接就会失败. HDFS提供了names ...
菜鸟玩云计算之十八：Hadoop 2.5.0 HA 集群安装第1章
菜鸟玩云计算之十八:Hadoop 2.5.0 HA 集群安装第1章 cheungmine, 2014-10-25 0 引言在生产环境上安装Hadoop高可用集群一直是一个需要极度耐心和体力的细致工作 ...
ZooKeeper学习之路（九）利用ZooKeeper搭建Hadoop的HA集群
Hadoop HA 原理概述为什么会有 hadoop HA 机制呢? HA:High Available,高可用在Hadoop 2.0之前,在HDFS 集群中NameNode 存在单点故障 (SP ...
菜鸟玩云计算之十九：Hadoop 2.5.0 HA 集群安装第2章
菜鸟玩云计算之十九:Hadoop 2.5.0 HA 集群安装第2章 cheungmine, 2014-10-26 在上一章中,我们准备好了计算机和软件.本章开始部署hadoop 高可用集群. 2 部署 ...
Canalv1.1.4版本搭建HA集群
前提 Canal上一个正式版是于2019-9-2发布的v1.1.4,笔者几个月前把这个版本的Canal推上了生产环境,部署了HA集群.过程中虽然遇到不少的坑,但是在不出问题的前提下,Canal的作用还 ...
HDFS的HA集群原理分析
1.简单hdfs集群中存在的问题不能存在两个NameNode 单节点问题单节点故障转移 2.解决单节点问题找额外一个NameNode备份原有的数据会出现脑裂脑裂:一个集群中多个管理者数据 ...
Hadoop HA集群与开发环境部署
每一次 Hadoop 生态的更新都是如此令人激动像是 hadoop3x 精简了内核,spark3 在调用 R 语言的 UDF 方面,速度提升了 40 倍所以该文章肯定得配备上最新的生态 hadoo ...
Hadoop(HDFS,YARN)的HA集群安装
搭建Hadoop的HDFS HA及YARN HA集群,基于2.7.1版本安装. 安装规划角色规划 IP/机器名安装软件运行进程 namenode1 zdh-240 hadoop NameNode ...

随机推荐

Activity是如何挂载Pargment的Day35
Activity是如何挂载Pargment的Day35 mebile5.0 1.Fragment优化早上任务思路一个主Activity 短信群发器中秋给朋友发短信,都能够加上他们的姓名,这样他们 ...
ios 用LLDB查看模拟器文件路径以及一些常用的命令
我看网络上有好多有关lldb调试命令的介绍,我都看了一遍,都没有这个方法,所以我在这里补充出来,帮助需要的人. 另外附上一些实用LLDB命令我们可以使用e命令定义变量 (lldb) e NSStr ...
iphone"此证书是由未知颁发机构签名的"的解决办法
由于误删除,将开发证书给弄没了,导致Certificates中更新的证书都提示此证书是由未知颁发机构签名的,不能实机调试,解决办法是重新下载AppleWWDRCA.cer 地址是:http://dev ...
java 反射取得方法入参类型的泛形
package TestReflectClass; import java.util.List; /** * Created by wangyang on 2016/12/16. */ public ...
SVM技法
PLA不管胖瘦,SVM喜欢胖的 fewer dichotomies=> small VC 演算法的VC dimension shatter 掉3个点如果限制胖瘦,两个点都shatter不掉喜 ...
Memcached认知[分布式]
Memcached是一个高性能的分布式内存对象缓存系统,用于动态Web应用以减轻数据库负载. Memcached的服务器客户端通信使用简单的基于文本行的协议. Memcached基于一个存储键/值对的 ...
为什么我们需要使用 touch 命令
为什么我们需要使用 touch 命令既然 touch 命令描述的是改变时间戳,那么我们可能会想为什么我们需要去改变时间戳呢?这个问题会引发我们的深思.然而,我想有个理由可以解释为什么我们需要使用它. ...
网站开发常用jQuery插件总结(四）验证插件validation
在网站开发过程中,有时我们需要验证用户输入的信息是否符合我们的要求,所以我们会对用户提交的数据进行验证.验证分两次进行,一次是在客户端,一次是在服务端.客户端的验证可以提升用户的体验. jquery验 ...
getimagesize函数介绍
getimagesize(); 返回结果说明索引 0 给出的是图像宽度的像素值索引 1 给出的是图像高度的像素值索引 2 给出的是图像的类型,返回的是数字,其中1 = GIF,2 = JPG,3 ...
运用预加载提升H5移动页面的用户体验
原文地址:http://www.grycheng.com/?p=2188 在做h5移动页面,相信大家一定碰到过页面已经打开,但是里面的图片还未加载出来的情况,这种问题虽然不影响页面的功能,但是不利于用 ...