HADOOP HA组态

hadoop2.x的ha组态。这份文件是在那里的描述中hdfs与yarn的ha组态。

这份文件的假设是zk它已被安装并配置,事实上，任何安装。

hdfs ha组态

首先。配置core-site.xml配置文件：

在老版本号中使用mr1时,还可能使用fs.default.name来进行配置

<name>fs.defaultFS</name>

此处配置的mycluster眼下还未定义。我们须要记住这个值,

这个表示此namenode的nameServiceId,在hdfs-site中定义,此处进行引用

<value>hdfs://mycluster</value>

</property>

接下来，配置当namenode发生切换时的检查方法。当NAMENODE切换时。

须要检查并确保仅仅有一个active节点。

因此会通过SHELL或SSH的方式过去强制中止或运行检查

<property>

  <name>dfs.ha.fencing.methods</name>

此处的可配置值sshfence/shell

  <value>sshfence</value>

</property>

<property>

  <name>dfs.ha.fencing.ssh.private-key-files</name>

  <value>/root/.ssh/id_rsa</value>

</property>

配置ha连接的zk的连接地址，

<property>

  <name>ha.zookeeper.quorum</name>

  <value>one.cluster:2181,two.cluster:2181,three.cluster:2181</value>

</property>

还能够有例如以下几个配置：

ha.zookeeper.session-timeout.ms，zk的session超时时间，默认是5000ms

ha.zookeeper.parent-znode，hdfs的ha在zk上的存储路径 ,默认是/hadoop-ha

接下来对hdfs-site.xml进行配置

定义上面提到过的nameserviceid的值，

<property>

  <name>dfs.nameservices</name>

此处对当前配置的ha的nameserviceid进行定义,此处的mycluster中间不能使用"_"线

  <value>mycluster</value>

</property>

接下来定义nameserviceid中须要使用到的namenode的id,

<property>

  <name>dfs.ha.namenodes.mycluster</name>

此处定义了两个namenode的id,也就是须要配置两具namenode,id各自是nn1与nn2

  <value>nn1,nn2</value>

</property>

在定义完毕须要的namenode id后。

须要针对每个namenode,定义其相关的rpc,http地址。

假设有启用https,还须要设置https-address

此处的配置通过nameserviceid.namenodeid来进行配置。

<property>

  <name>dfs.namenode.rpc-address.mycluster.nn1</name>

  <value>one.cluster:8020</value>

</property>

<property>

  <name>dfs.namenode.rpc-address.mycluster.nn2</name>

  <value>two.cluster:8020</value>

</property>

<property>

  <name>dfs.namenode.http-address.mycluster.nn1</name>

  <value>one.cluster:50070</value>

</property>

<property>

  <name>dfs.namenode.http-address.mycluster.nn2</name>

  <value>two.cluster:50070</value>

</property>

接下来配置namenode edits的共享存储。在这里使用QJM来进行配置：

qjm是一个非常轻量的进程，能够直接部署到namenode或datanode中。

qjm的默认rpcport是8485,默认httpport是8480,

可通过配置dfs.journalnode.rpc-address。dfs.journalnode.http-address来改动port。

qjm必须配置为单数个(N)，可以保证在(N-1)/2个正常执行时，可以正常提供服务。

<property>

  <name>dfs.namenode.shared.edits.dir</name>

  <value>qjournal://one.cluster:8485;two.cluster:8485;three.cluster:8485/mycluster</value>

</property>

配置QJM的存储路径：

<property>

  <name>dfs.journalnode.edits.dir</name>

  <value>/data/1/dfs/jn</value>

</property>

设置针对此nameserviceid的client代理：

client请求时通过nameserviceid来做请求。

nameserviceid解析出相应的active namenode就通过此配置中的java类来完毕。

<property>

  <name>dfs.client.failover.proxy.provider.mycluster</name>

  <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>

</property>

接下来配置namenode的自己主动故障转换。

<property>

  <name>dfs.ha.automatic-failover.enabled</name>

  <value>true</value>

</property>

把配置文件拷贝到全部的节点中。这个不能忘呀。

在配置有QJM的节点中启动QJM.

进入hadooop_home/sbin文件夹

./hadoop-daemon.sh start journalnode

进入hadoop_home/bin文件夹下，运行./hdfs zkfc -formatZK在zk上进行格式化

对namenode进行format操作：

进入hadoop_home/bin文件夹，并运行例如以下命令

运行./hadoop namenode -format -clusteridhacluster命令。

./hdfs namenode-initializeSharedEdits

接下来启动主的namenode, 进入hadooop_home/sbin文件夹,运行例如以下命令

./hadoop-daemon.sh start namenode

赶往standby的namenode节点。

进入hadoop_home/bin文件夹，运行例如以下命令：

./hdfs namenode -bootstrapStandby

启动standby 的namenode,进入hadooop_home/sbin文件夹,运行例如以下命令

./hadoop-daemon.sh start namenode

接下来启动各个datanode节点。

./hadoop-daemon.sh start datanode

最后一步。启动zkfc,自己主动切换namenode节点的服务。

由于此时两个namenode都是standby的状态，须要启动zkfc来实现切换。

在主namenode与standby的namenode中进行hadoop_home/sbin文件夹。并运行例如以下命令

./hadoop-daemon.sh start zkfc

the end.

YARN RM的HA配置

配置yarn中resourcemanager的HA仅仅有在hadoop2.3.x后才引进，

yarn的ha配置相对简单，直接配置yarn-site.xml文件

<property>

rm连接失败的重试间隔

    <name>yarn.resourcemanager.connect.retry-interval.ms</name>

    <value>2000</value>

  </property>

<property>

是否启用ha配置。默认是false.

    <name>yarn.resourcemanager.ha.enabled</name>

    <value>true</value>

  </property>

<property>

启动自己主动故障转移,默觉得false

    <name>yarn.resourcemanager.ha.automatic-failover.enabled</name>

    <value>true</value>

  </property>

<property>

启用一个内嵌的故障转移，与ZKRMStateStore一起使用。

    <name>yarn.resourcemanager.ha.automatic-failover.embedded</name>

    <value>true</value>

  </property>

<property>

    <name>yarn.resourcemanager.cluster-id</name>

    <value>rm-cluster</value>

  </property>

<property>

    <name>yarn.resourcemanager.ha.rm-ids</name>

    <value>rm1,rm2</value>

  </property>

<property>

配置当前的rm节点。这个地方要注意。在rm1这个机器上时，配置为rm1

在rm2这台机器上时，须要配置为rm2.它们之间通过zk来实现active操作

    <name>yarn.resourcemanager.ha.id</name>

    <value>rm1</value>

  </property>

<property>

    <name>yarn.resourcemanager.recovery.enabled</name>

    <value>true</value>

  </property>

<property>

HA时，RMStateStore须要配置为这个值。

    <name>yarn.resourcemanager.store.class</name>

 <value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore</value>

  </property>

<property>

配置与zk的连接地址

    <name>yarn.resourcemanager.zk.state-store.address</name>

    <value>localhost:2181</value>

  </property>

<property>

  <name>yarn.resourcemanager.zk-address</name>

  <value>localhost:2181</value>

</property>

<!-- RM1 configs -->

  <property>

    <name>yarn.resourcemanager.address.rm1</name>

    <value>host1:23140</value>

  </property>

  <property>

    <name>yarn.resourcemanager.scheduler.address.rm1</name>

    <value>host1:23130</value>

  </property>

  <property>

    <name>yarn.resourcemanager.webapp.https.address.rm1</name>

    <value>host1:23189</value>

  </property>

  <property>

    <name>yarn.resourcemanager.webapp.address.rm1</name>

    <value>host1:23188</value>

  </property>

  <property>

    <name>yarn.resourcemanager.resource-tracker.address.rm1</name>

    <value>host1:23125</value>

  </property>

  <property>

    <name>yarn.resourcemanager.admin.address.rm1</name>

    <value>host1:23141</value>

  </property>

<!-- RM2 configs -->

  <property>

    <name>yarn.resourcemanager.address.rm2</name>

    <value>host2:23140</value>

  </property>

  <property>

    <name>yarn.resourcemanager.scheduler.address.rm2</name>

    <value>host2:23130</value>

  </property>

  <property>

    <name>yarn.resourcemanager.webapp.https.address.rm2</name>

    <value>host2:23189</value>

  </property>

  <property>

    <name>yarn.resourcemanager.webapp.address.rm2</name>

    <value>host2:23188</value>

  </property>

  <property>

    <name>yarn.resourcemanager.resource-tracker.address.rm2</name>

    <value>host2:23125</value>

  </property>

  <property>

    <name>yarn.resourcemanager.admin.address.rm2</name>

    <value>host2:23141</value>

  </property>

启动yarn的各节点，

在主resourcemanager与standby的resourcemanager运行

yarn-daemon.sh start resourcemanager

在nodemanager运行

yarn-daemon.sh start nodemanager

hadoop-ha组态的更多相关文章

使用Nginx+Lua代理Hadoop HA
一.Hadoop HA的Web页面访问 Hadoop开启HA后,会同时存在两个Master组件提供服务,其中正在使用的组件称为Active,另一个作为备份称为Standby,例如HDFS的NameNo ...
Hadoop技术之Hadoop HA 机制学习
欢迎大家前往腾讯云技术社区,获取更多腾讯海量技术实践干货哦~ 作者:温球良导语最近分享过一次关于Hadoop技术主题的演讲,由于接触时间不长,很多技术细节认识不够,也没讲清楚,作为一个技术人员,本 ...
hadoop HA 详解
NameNode 高可用整体架构概述在 Hadoop 1.0 时代,Hadoop 的两大核心组件 HDFS NameNode 和 JobTracker 都存在着单点问题,这其中以 NameNode ...
Hadoop HA高可用集群搭建（Hadoop+Zookeeper+HBase）
声明:作者原创,转载注明出处. 作者:帅气陈吃苹果一.服务器环境主机名 IP 用户名密码安装目录 master188 192.168.29.188 hadoop hadoop /home/ha ...
hadoop ha zkfc 异常自动切换机制和hdfs 没有空间问题解决
在我搭建hadoop ha 后,我启动了各个功能,但是发现hadoop hdfs 没法使用,在web 页面也显示hdfs 可用空间为零,并且自动备份机制无法使用,本人也不理解,然后就是指定hdfs t ...
Hadoop ha CDH5.15.1-hadoop集群启动后，集群容量不正确，莫慌，这是正常的表现！
Hadoop ha CDH5.15.1-hadoop集群启动后,集群容量不正确,莫慌,这是正常的表现! 作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.集群启动顺序 1>. ...
Hadoop ha CDH5.15.1-hadoop集群启动后，两个namenode都是standby模式
Hadoop ha CDH5.15.1-hadoop集群启动后,两个namenode都是standby模式作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一说起周五,想必大家都特别 ...
基于zookeeper的高可用Hadoop HA集群安装
(1)hadoop2.7.1源码编译 http://aperise.iteye.com/blog/2246856 (2)hadoop2.7.1安装准备 http://aperise.iteye.com ...
hadoop ha 读取 activce状态的活动节点
方式一 package com.xxx.hadoop; import com.sun.demo.jvmti.hprof.Tracker; import com.sun.xml.bind.util.Wh ...
Hadoop HA方案调研
原文成文于去年(2012.7.30),已然过去了一年,很多信息也许已经过时,不保证正确,与Hadoop学习笔记系列一样仅为留做提醒. ----- 针对现有的所有Hadoop HA方案进行调研,以时间为 ...

随机推荐

iOS高效开源类库
因为iOS SDK相对比较底层,所以开发者就得受累多做一些体力活.不过幸运的是,有很多第三方的类库可以用来简化很多不必要的工作.笔者整理了一下在本人学习过程中用到的一些比较有用Objective-C开 ...
（三）----使用HttpClient发送HTTP请求（分别通过GET和POST方法发送数据）
文章来源:http://www.cnblogs.com/smyhvae/p/4006009.html 一.GET和POST的对比: 在漫长的时间当中,其他的方法逐渐的退出了历史舞台,最常用的只剩下GE ...
旧发票要保留SIRET等信息，或者整个PDF
查看旧发票时,每次都实时生成发票是不行的,因为公司的SIRET居然会是变的!!
（Google面试题）有四个线程1、2、3、4。线程1的功能就是输出1，线程2的功能就是输出2，以此类推.........现在有四个文件ABCD。初始都为空。
现要让四个文件呈如下格式: A:1 2 3 4 1 2.... B:2 3 4 1 2 3.... C:3 4 1 2 3 4.... D:4 1 2 3 4 1.... 请设计程序. 下面举例A,对 ...
给工程师的 10 条哲理（浅薄者迷信运气，强者相信因果，软件复制成本为零，文凭不重要，AWS使得创业成本为零，每个手机都是口袋里的强大电脑）
无论是主题分布式数据库,微服务,Soylent,尤伯杯,或者矮人要塞,我们试图从物质分离出来炒作,推迟叙事的客人.与尊重有软件工程日报的社论部分客观性. 一位渠道的成员说,“当软件工程每日的意见公布, ...
docs/pcs/rest/file data apis list - 百度开发者中心
docs/pcs/rest/file data apis list - 百度开发者中心更新通知: 2013.6.20 上传.下载新域名正式上线使用,相关接口“上传单个文件”.“分片上传-文件分片上传 ...
【Java&Android开源库代码剖析】のAndroid-Universal-Image-Loader-part1
做Android app开发的同学应该都听说过或者用过nostra13的Android-Universal-Image-Loader开源库,它在图片异步加载.缓存和显示等方面提供了强大灵活的框架.之前 ...
Centos 6安装完美搭建mysql、php、apache之旅
安装apache [root@centos share]# yum -y install httpd Loaded plugins: fastestmirror, refresh-packagekit ...
android中更改spinner、AutoCompleteTextView切割线的颜色
话说去除切割线的方法找了非常久也没找到,最终发现了更改切割线的方法 spinner和AutoCompleteTextView提示列表中间有一条黑色的切割线.想要改变它的颜色值,就要重写style. 1 ...
BASH Shell 简易进度条小函数
不多说,直接上脚本. # processbar <current> <total> processbar() { local current=$1; local total=$ ...

hadoop-ha组态

HADOOP HA组态

hdfs ha组态

YARN RM的HA配置

hadoop-ha组态的更多相关文章

随机推荐

热门专题