扩展为HA需要注意的问题

原Namenode称为namenode1，新增的Namenode称为namenode2.

从namenode单节点扩展为HA模式官网上有详细的教程，下面是扩展过程中疏忽的地方。

namenode2部署后需要复制namenode1格式化好的数据，就是namenode1部署的时候，通过hdfs namenode -format生成的数据。
journalnode部署好后，也需要格式化数据。格式化方式为：journalnode启动之后，在namenode执行hdfs namenode -bootstrapStandby来初始化journalnode，namenode不能是在运行状态，否则会报数据被锁定的异常。

然后执行hadoop/bin/hdfs haadmin -transitionToActive nn1手动吧nn1切换成active节点。

下面是简写的笔记，按照个人知识基础写的，建议部署过程参照官网。

HA 原理

hadoop可以通过nfs和quorum journal manager(QJM)实现。

通过QJM共享edit log。

当主节点挂了，备从edit log迅速成为主节点。

架构

HA 集群中有一个namenode是Active ，另一个是Standby。

部署Standby的时候，把Active节点上格式化好的数据拷贝到Standby。

要布署HA，需要准备一下内容：

Namenode: 主节点和备节点。
JournalNode：JournalNode是轻量级的，所以JournalNode可以布署在其他的Hadoop机器上，比如job tracker或者yarn RecourceManager。注意：必须至少三个JournalNode，这种结构允许系统有一个节点故障。可以大于单台，但是要增加允许故障节点的数量，journalnode的数量必须时奇数。因为系统健康状况的最低标准为（n/2）+1 个。所以三个节点只允许一台挂掉，4个节点也允许1台挂掉。

HA配置

参数说明

hdfs-site.xml

dfs.nameservices 用于标识集群

<property>

  <name>dfs.nameservices</name>

  <value>mycluster</value>

</property>

dfs.ha.namenodes.[nameservice ID] 集群mycluster的namenode成员

<property>

  <name>dfs.ha.namenodes.mycluster</name>

  <value>nn1,nn2</value>

</property>

dfs.namenode.rpc-address.[nameservice ID].[name node ID]

<property>

  <name>dfs.namenode.rpc-address.mycluster.nn1</name>

  <value>machine1.example.com:8020</value>

</property>

<property>

  <name>dfs.namenode.rpc-address.mycluster.nn2</name>

  <value>machine2.example.com:8020</value>

</property>

dfs.namenode.http-address.[nameservice ID].[name node ID]

<property>

  <name>dfs.namenode.http-address.mycluster.nn1</name>

  <value>machine1.example.com:50070</value>

</property>

<property>

  <name>dfs.namenode.http-address.mycluster.nn2</name>

  <value>machine2.example.com:50070</value>

</property>

dfs.namenode.shared.edits.dir 配置edits共享地址，journalnode的地址。

mycluster是nameservice ID

<property>

  <name>dfs.namenode.shared.edits.dir</name>

  <value>qjournal://node1.example.com:8485;node2.example.com:8485;node3.example.com:8485/mycluster</value>

</property>

dfs.client.failover.proxy.provider.[nameservice ID] 客户端用来连接avtive namenode的类。

<property>

  <name>dfs.client.failover.proxy.provider.mycluster</name>

  <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>

</property>

dfs.ha.fencing.methods 再故障转移时的一种保护机制。Hadoop可以使用shell和sshfence的方式。

sshfence参数远程连接到目标节点杀死进程。

   <property>

      <name>dfs.ha.fencing.methods</name>

      <value>sshfence</value>

    </property>

    <property>

      <name>dfs.ha.fencing.ssh.private-key-files</name>

      <value>/home/exampleuser/.ssh/id_rsa</value>

    </property>

shell 可以使用的变量


$target_host	hostname of the node to be fenced
$target_port	IPC port of the node to be fenced
$target_address	the above two, combined as host:port
$target_nameserviceid	the nameservice ID of the NN to be fenced
$target_namenodeid	the namenode ID of the NN to be fenced

    <property>

      <name>dfs.ha.fencing.methods</name>

      <value>shell(/path/to/my/script.sh --nameservice=$target_nameserviceid $target_host:$target_port)</value>

    </property>

core-site.xml

<property>

  <name>fs.defaultFS</name>

  <value>hdfs://mycluster</value>

</property>

dfs.journalnode.edits.dir journalnode保存edits的路径

JournalNode的配置

<property>

  <name>dfs.journalnode.edits.dir</name>

  <value>/path/to/journal/node/local/data</value>

</property>

JournalNode

上面是配置，启动方式为：

hadoop-2.9.2/sbin/hadoop-daemon.sh --config /opt/hadoop-2.9.2/etc/hadoop --script hdfs start journalnode

journalnode启动之后在namenode执行hdfs namenode -bootstrapStandby来初始化journalnode

然后执行hadoop/bin/hdfs haadmin -transitionToActive nn1手动吧nn1切换成active节点。

自动故障转移

上面的配置只能使用手动转移。

zookeeper布署

namenode

core-site.xml

<configuration>

<property>

	<name>fs.defaultFS</name>

	<value>hdfs://ns1</value>

</property>

<property>

	<name>hadoop.tmp.dir</name>

	<value>/opt/modules/App/hadoop-2.5.0/data/tmp</value>

</property>

<property>

	<name>hadoop.http.staticuser.user</name>

	<value>beifeng</value>

</property>

<property>

	<name>ha.zookeeper.quorum</name>

	<value>bigdata-01:2181,bigdata-02:2181,bigdata-03:2181</value>

</property>

</configuration>

hdfs-site.xml

<configuration>

<property>

	<name>dfs.replication</name>

	<value>3</value>

</property>

property>

	<name>dfs.permissions.enabled</name>

	<value>false</value>

</property>

<property>

	<name>dfs.nameservices</name>

	<value>ns1</value>

</property>

<property>

	<name>dfs.blocksize</name>

	<value>134217728</value>

</property>

<property>

	<name>dfs.ha.namenodes.ns1</name>

	<value>nn1,nn2</value>

</property>

<!-- nn1的RPC通信地址，nn1所在地址  -->

<property>

	<name>dfs.namenode.rpc-address.ns1.nn1</name>

	<value>bigdata-01:8020</value>

</property>

<!-- nn1的http通信地址，外部访问地址 -->

<property>

	<name>dfs.namenode.http-address.ns1.nn1</name>

	<value>bigdata-01:50070</value>

</property>

<!-- nn2的RPC通信地址，nn2所在地址 -->

<property>

	<name>dfs.namenode.rpc-address.ns1.nn2</name>

	<value>bigdata-02:8020</value>

</property>

<!-- nn2的http通信地址，外部访问地址 -->

<property>

	<name>dfs.namenode.http-address.ns1.nn2</name>

	<value>bigdata-02:50070</value>

</property>

<!-- 指定NameNode的元数据在JournalNode日志上的存放位置(一般和zookeeper部署在一起) -->

<property>

	<name>dfs.namenode.shared.edits.dir</name>

	<value>qjournal://bigdata-01:8485;bigdata-02:8485;bigdata-03:8485/ns1</value>

</property>

<!-- 指定JournalNode在本地磁盘存放数据的位置 -->

<property>

	<name>dfs.journalnode.edits.dir</name>

	<value>/opt/modules/App/hadoop-2.5.0/data/journal</value>

</property>

<!--客户端通过代理访问namenode，访问文件系统，HDFS 客户端与Active 节点通信的Java 类，使用其确定Active 节点是否活跃  -->

<property>

	<name>dfs.client.failover.proxy.provider.ns1</name>

	<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>

</property>

<!--这是配置自动切换的方法，有多种使用方法，具体可以看官网，在文末会给地址，这里是远程登录杀死的方法  -->

<property>

	<name>dfs.ha.fencing.methods</name>

	<value>sshfence</value>     ----这个参数的值可以有多种，你也可以换成shell(/bin/true)试试，也是可以的，这个脚本do nothing 返回0

</property>

<!-- 这个是使用sshfence隔离机制时才需要配置ssh免登陆 -->

<property>

	<name>dfs.ha.fencing.ssh.private-key-files</name>

	<value>/home/beifeng/.ssh/id_rsa</value>

</property>

<!-- 配置sshfence隔离机制超时时间，这个属性同上，如果你是用脚本的方法切换，这个应该是可以不配置的 -->

<property>

	<name>dfs.ha.fencing.ssh.connect-timeout</name>

	<value>30000</value>

</property>

<!-- 这个是开启自动故障转移，如果你没有自动故障转移，这个可以先不配 -->

<property>

	<name>dfs.ha.automatic-failover.enabled</name>

	<value>true</value>

</property>

</configuration>

mapred-site.xml

<configuration>

<property>

        <name>mapreduce.framework.name</name>

        <value>yarn</value>

</property>

<property>

	<name>mapreduce.jobhistory.address</name>

	<value>bigdata-01:10020</value>

</property>

<property>

	<name>mapreduce.jobhistory.webapp.address</name>

	<value>bigdata-01:19888</value>

</property>

</configuration>

yarn-site.xml

<configuration>

    <property>

        <name>yarn.nodemanager.aux-services</name>

        <value>mapreduce_shuffle</value>

    </property>

	<property>

        <name>yarn.resourcemanager.hostname</name>

        <value>bigdata-03</value>

    </property>

	<property>

        <name>yarn.log-aggregation-enable</name>

        <value>true</value>

    </property>

		<property>

        <name>yarn.log-aggregation.retain-seconds</name>

        <value>106800</value>

    </property>

</configuration>

HDFS的namenode从单节点扩展为HA需要注意的问题的更多相关文章

HDFS环境搭建（单节点配置）
[参考文章]:hadoop集群搭建(hdfs) 1. Hadoop下载官网下载地址: https://hadoop.apache.org/releases.html,进入官网根据自己需要下载具体的安 ...
二、hdfs单节点安装
一.准备环境在配置hdfs之前,我们需要先安装好hadoop的配置,本文主要讲述hdfs单节点的安装配置. hadoop的单节点安装配置请参考:https://www.cnblogs.com/lay ...
【大数据系列】hadoop单节点安装官方文档翻译
Hadoop: Setting up a Single Node Cluster. HADOOP:建立单节点集群 Purpose Prerequisites Supported Platforms R ...
Centos7安装 Hadoop（单节点）
1.Hadoop简介 Hadoop是一个由Apache基金会所开发的开源分布式系统基础框架,使用Java开发,是处理大规模数据的软件平台. Hadoop可以从单一节点扩展到上千节点.用户可以在不了解分 ...
Hbase入门教程--单节点伪分布式模式的安装与使用
Hbase入门简介 HBase是一个分布式的.面向列的开源数据库,该技术来源于 FayChang 所撰写的Google论文"Bigtable:一个结构化数据的分布式存储系统".就像 ...
单节点部署Hadoop教程
搭建HDFS 增加主机名我这里仅仅增加了master主机名 [root@10 /xinghl/hadoop/bin]$ cat /etc/hosts 127.0.0.1 localhost 10.0 ...
Hadoop 2.6.4单节点集群配置
1.安装配置步骤 # wget http://download.oracle.com/otn-pub/java/jdk/8u91-b14/jdk-8u91-linux-x64.rpm # rpm -i ...
Hadoop介绍及最新稳定版Hadoop 2.4.1下载地址及单节点安装
Hadoop介绍 Hadoop是一个能对大量数据进行分布式处理的软件框架.其基本的组成包括hdfs分布式文件系统和可以运行在hdfs文件系统上的MapReduce编程模型,以及基于hdfs和MapR ...
hadoop2.7【单节点】单机、伪分布、分布式安装指导
问题导读 1.从本文部署实际部署,总结本地模式.伪分布.分布式的区别是什么?2.单机是否是伪分布?3.本地模式是否可以运行mapreduce? 来源:about云 http://www.aboutyu ...

随机推荐

JavaWeb学习（二十二）———EL表达式
一.EL表达式简介 EL 全名为Expression Language.EL主要作用: 1.获取数据 EL表达式主要用于替换JSP页面中的脚本表达式,以从各种类型的web域中检索java对象.获取数 ...
netty源码解解析(4.0)-13 Channel NIO实现: 关闭和清理
Channel提供了3个方法用来实现关闭清理功能:disconnect,close,deregister.本章重点分析这个3个方法的功能的NIO实现. disconnect实现: 断开连接 disco ...
Python 3 进阶 —— 使用 PyMySQL 操作 MySQL
PyMySQL 是一个纯 Python 实现的 MySQL 客户端操作库,支持事务.存储过程.批量执行等. PyMySQL 遵循 Python 数据库 API v2.0 规范,并包含了 pure-Py ...
2017 ACM/ICPC Asia Regional Qingdao Online解题报告（部分）
HDU 6206 Apple 题意: 给出四个点的坐标(每个点的坐标值小于等于1,000,000,000,000),问最后一个点是否在前三个点组成的三角形的外接圆内,是输出Accept,否输出Reje ...
Django之视图层
一.视图函数一个视图函数,简称视图,是一个简单的python函数,接收web请求并返回web响应.响应可以是一张网页的HTML内容,一个重定向,一个404错误等.在函数中必须写一个request的参 ...
.net实现支付宝在线支付
流程参考<实物商品交易服务集成技术文档2.0.pdf>网关地址http://paytest.rupeng.cn/AliPay/PayGate.ashx 网关参数说明:partner:商户编 ...
[redis] Redis的介绍
mysql数据库:数据以“文件的形式”存储在硬盘里网站的瓶颈是在数据库的访问上,mysql数据库是运行在硬盘上面的,把数据放到内存里速度就快多了 Redis是一款内存高速缓存数据库,使用c语言编写, ...
cocoapods使用-库托管到svn或者github
下拉svn库(自定义库或者第三方库)到工程中: 1. 若未安装,请安装cocoapods: http://www.cnblogs.com/sunjianfei/p/6089231.html ...
[VUE ERROR] Error in render: "TypeError: Cannot create property 'header' on boolean 'true'"
项目基于ElemnetUi进行的开发,在引入第三方扩展库 vue-element-extends 之后使用它的表格组件报了这个错解决方案: 1. 删除项目中的 node_modules 2. 删除 ...
为什么 C# 比 C++ 编译快那么多
Go 我不懂,下面以 C++ 和 C# 对比来说明为什么 C++ 编译慢和 C# 编译快. C 和 C++ 文件的编译经过几个主要步骤: 处理续行符处理(“\”)之类的杂事词法分析,解析出 toke ...

HDFS的namenode从单节点扩展为HA需要注意的问题