Hadoop 2、配置HDFS HA (高可用)

前提条件

先搭建 http://www.cnblogs.com/raphael5200/p/5152004.html 的环境，然后在其基础上进行修改

一、安装Zookeeper

由于环境有限，所以在仅有的4台虚拟机上完成多个操作；

a.在4台虚拟中选3台安装Zookeeper,我选 node5 node6 node7

b.在4台虚拟中选3台作为JournalNode的节点，我选node6 node7 node8

c..在4台虚拟中选2台作为NameNode ，我选node5(Active) node8(Standby)

1.解压并移动

下载并解压zookper压缩包，将zookeeper复制到/usr/local/zookeeper目录下；

2.配置Zookeeper

$ cd /usr/local/zookeeper/

$ vim /conf/zoo.cfg

#写入

tickTime=2000

dataDir=/opt/zookeeper  #指定Zookeeper的Data目录

clientPort=2181

initLimit=5

syncLimit=2

# 3台节点

server.1=node5:2888:3888

server.2=node6:2888:3888

server.3=node7:2888:3888

3.配置zookeeper的环境变量

$ vim /root/.bash_profile

#写入

PATH=$PATH:/usr/local/zookeeper-3.4.6/bin

4.覆盖node6 和 node7的zookeeper配置文件和.bash_profile

5.创建myid

分别在node5 node6 node7的dataDir目录中创建一个myid的文件，文件内容分别为1，2，3（即server的id）

Node 5:

$ vim /opt/zookeeper/myid

#写入

1

Node 6:

$ vim /opt/zookeeper/myid

#写入

2

Node 7:

$ vim /opt/zookeeper/myid

#写入

3

6.启动zookeeper

$ cd /usr/local/zookeeper

$ bin/zkServer.sh start

# 显示：Starting zookeeper ... STARTED 表示启动成功

二、免密码登录

node5 node8 两台NameNode相互做免密码登录，在上一文中已经在node5上做了免密码登录，下面只在Node8上做node5的免密码登录：

Node8:

$ ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa

$ scp ~/.ssh/id_dsa.pub root@node5:/opt

Node5:

$ cat /opt/id_dsa.pub >> ~/.ssh/authorized_keys

完成以后，测试一下 node8 $: ssh node5

三、配置HDFS 高可用

1.配置HDFS配置文件

$ cd  /usr/local/hadoop-2.5.1/etc/hadoop

$ vi hdfs-site.xml

#写入

<configuration>

#配置NameService 名字随便起

 <property>

  <name>dfs.nameservices</name>

  <value>raphael</value>

 </property>

# 这里的最后一个名字就是上面的nameService   value是两台NameNode的节点

<property>

  <name>dfs.ha.namenodes.raphael</name>

  <value>node5,node8</value>

</property>

# node5和node8的rpc地址

<property>

  <name>dfs.namenode.rpc-address.raphael.node5</name>

  <value>node5:8020</value>

</property>

<property>

  <name>dfs.namenode.rpc-address.raphael.node8</name>

  <value>node8:8020</value>

</property>

# node5和node8的http地址

<property>

  <name>dfs.namenode.http-address.raphael.node5</name>

  <value>node5:50070</value>

</property>

<property>

  <name>dfs.namenode.http-address.raphael.node8</name>

  <value>node8:50070</value>

</property>

# 3台JournalNode地址，后台跟名字，但后面的名字不能与nameService相同

<property>

  <name>dfs.namenode.shared.edits.dir</name>

 <value>qjournal://node6:8485;node7:8485;node8:8485/raphael5200</value>

</property>

#配置客户端调用接口

<property>

  <name>dfs.client.failover.proxy.provider.raphael</name>

 <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>

</property>

<property>

  <name>dfs.ha.fencing.methods</name>

  <value>sshfence</value>

</property>

<property>

  <name>dfs.ha.fencing.ssh.private-key-files</name>

  <value>/root/.ssh/id_dsa</value>

</property>

<property>

  <name>dfs.ha.fencing.methods</name>

  <value>sshfence</value>

</property>

<property>

  <name>dfs.ha.fencing.ssh.connect-timeout</name>

  <value>30000</value>

</property>

#配置journalnode目录

<property>

  <name>dfs.journalnode.edits.dir</name>

  <value>/opt/journalnode</value>

</property>

<property>

   <name>dfs.ha.automatic-failover.enabled</name>

   <value>true</value>

 </property>

$ vi core-site.xml

#这里的value就是NameService的名字

   <property>

        <name>fs.defaultFS</name>

        <value>hdfs://raphael</value>

    </property>

    <property>

        <name>hadoop.tmp.dir</name>

        <value>/opt/hadoop</value>

    </property>

#3台zookeeper节点

 <property>

   <name>ha.zookeeper.quorum</name>

   <value>node5:2181,node6:2181,node7:2181</value>

 </property>

a.删除node5 node6 node7 node8 etc/hadoop/masters文件(这里已经不需要standry了)

b.删除node5 node6 node7 node8 上的hadoop.tmp.dir 目录

$ rm -rf /opt/hadoop

c.将node5 配置好的文件，覆盖到node6 node7 node8

$ scp -r etc/hadoop/* root@node6:/usr/local/hadoop/etc/hadoop

$ scp -r etc/hadoop/* root@node7:/usr/local/hadoop/etc/hadoop

$ scp -r etc/hadoop/* root@node8:/usr/local/hadoop/etc/hadoop

2.覆盖并启动

a.启动三台JournalNode node6 node7 node8

# 前提是要先把zookeeper启动起来

$ sbin/hadoop-daemon.sh start journalnode

b.在其中一个NameNode上格式化hadoop.tmp.dir 并初始化

Node5:
$ bin/hdfs namenode -format

c.把格式化后的元数据拷备到另一台NameNode节点上

$ scp -r /opt/hadoop root@node8:/opt/hadoop

d.启动NameNode

Node5:

$ sbin/hadoop-daemon.sh start namenode

Node8:

$ bin/hdfs namenode -bootstrapStandby

$ sbin/hadoop-daemon.sh start namenode

e.初始化zkfc

Node5:

$ bin/hdfs zkfc -formatZK

f.全面停止并全面启动

Node5:

$ sbin/stop-dfs.sh

$ sbin/start-dfs.sh

注：在启动JournalNode和其他项时，没有其他好的方法较验是否启动成功，只能查看日志文件，如果日志文件没有报错，则表示启动成功；

3.访问NameNode

访问两台NameNode node5和node8的50070端口，会显示一个端口是Active 另一个端口是Standby 如下图：

http://node5:50070 http://node8:50070

注：如果Node5突然挂掉了，那么node8备用的NameNode会自动的补上，替换为Active，测试方法：Kill node5 的nameNode进程，然后再刷新Node8：

$ jps #ps是显示当前系统进程 ，jps就是显示当前系统的java 进程

$ kill -9 进程ID  #杀掉进程

四、使用Yarn来调度HDFS

#先所有的Hadoop相关进程

$ stop-dfs.sh

1.配置yarn-site.xml

$ cd /usr/local/hadoop/

$ vim etc/hadoop/yarn-site.xml

<property>

   <name>yarn.resourcemanager.ha.enabled</name>

   <value>true</value>

 </property>

# 该cluster-id不能与nameService相同

 <property>

   <name>yarn.resourcemanager.cluster-id</name>

   <value>raphael521</value>

 </property>

#指定2台Resource Manager (即Name Node )节点

 <property>

   <name>yarn.resourcemanager.ha.rm-ids</name>

   <value>rm1,rm2</value>

 </property>

 <property>

   <name>yarn.resourcemanager.hostname.rm1</name>

   <value>node5</value>

 </property>

 <property>

   <name>yarn.resourcemanager.hostname.rm2</name>

   <value>node8</value>

 </property>

#指定zookeeper 节点

 <property>

   <name>yarn.resourcemanager.zk-address</name>

   <value>node6:2181,node7:2181,node8:2181</value>

 </property>

  <property>

        <name>yarn.nodemanager.aux-services</name>

        <value>mapreduce_shuffle</value>

    </property>

 </configuration>

2.配置etc/hadoop/mapred-site.xml

$ vim etc/hadoop/mapred-site.xml

<configuration>

    <property>

        <name>mapreduce.framework.name</name>

        <value>yarn</value>

    </property>

</configuration>

3.将mapred-site.xml yarn-site.xml 覆盖到其他的节点上

4.启动 yarn

#单独启动yarn使用命令：
 $ sbin/start-yarn.sh

 $ sbin/stop-yarn.sh
#启动所有Hadoop相关进程使用命令
$ start-all.sh
#启动完成以后，另一台NameNode需要手动启动yarn
$ start-yarn.sh

5.访问

访问yarn的端口 http://node5:8088 http://node8:8088 可以看到：

说明：当访问Node5的时候能够正常的显示界面，并且在Nodes下还能加载出集群的所有节点，但是访问node8的时候，则不会显示，而是提示页面将跳到Active的Resource Manager (RM)节点上,然后页面就跳了；

当node5突然挂掉了，zookeeper会立刻将RM切换到node8上，将node8做为Active的RM，然后在Nodes下会在几十秒内加载出所有节点；

Hadoop 2、配置HDFS HA (高可用)的更多相关文章

Hadoop集群搭建-HA高可用（手动切换模式）（四）
步骤和集群规划 1)保存完全分布式模式配置 2)在full配置的基础上修改为高可用HA 3)第一次启动HA 4)常规启动HA 5)运行wordcount 集群规划: centos虚拟机:node-00 ...
大数据技术之HA 高可用
HDFS HA高可用 1.1 HA概述 1)所谓HA(High Available),即高可用(7*24小时不中断服务). 2)实现高可用最关键的策略是消除单点故障.HA严格来说应该分成各个组件的HA ...
Hadoop 5、HDFS HA 和 YARN
Hadoop 2.0 产生的背景Hadoop 1.0 中HDFS和MapReduce存在高可用和扩展方面的问题 HDFS存在的问题 NameNode单点故障,难以用于在线场景 NameNode压力过大 ...
Hadoop HA高可用集群搭建（Hadoop+Zookeeper+HBase）
声明:作者原创,转载注明出处. 作者:帅气陈吃苹果一.服务器环境主机名 IP 用户名密码安装目录 master188 192.168.29.188 hadoop hadoop /home/ha ...
Hadoop 3.1.2(HA)+Zookeeper3.4.13+Hbase1.4.9(HA)+Hive2.3.4+Spark2.4.0(HA)高可用集群搭建
目录目录 1.前言 1.1.什么是 Hadoop? 1.1.1.什么是 YARN? 1.2.什么是 Zookeeper? 1.3.什么是 Hbase? 1.4.什么是 Hive 1.5.什么是 Sp ...
hadoop在zookeeper上的高可用HA
(参考文章:https://www.linuxprobe.com/hadoop-high-available.html) 一.技术背景影响HDFS集群不可用主要包括以下两种情况:一是NameNode ...
hadoop 集群HA高可用搭建以及问题解决方案
hadoop 集群HA高可用搭建目录大纲 1. hadoop HA原理 2. hadoop HA特点 3. Zookeeper 配置 4. 安装Hadoop集群 5. Hadoop HA配置搭建环 ...
大数据Hadoop的HA高可用架构集群部署
1 概述在Hadoop 2.0.0之前,一个Hadoop集群只有一个NameNode,那么NameNode就会存在单点故障的问题,幸运的是Hadoop 2.0.0之后解决了这个问题,即支持N ...
Hdfs的HA高可用
1.Hdfs的HA高可用:保证Hdfs高可用,其实就是保证namenode的高可用,保证namenode的高可用的机制有两个,editlog共享机制+ZKFC.ZKFC就是ZookeeperFailO ...

随机推荐

oracle中 connect by prior 递归算法
Oracle中start with...connect by prior子句用法 connect by 是结构化查询中用到的,其基本语法是: select ... from tablename sta ...
Using HttpClient properly to avoid CLOSE_WAIT TCP connections
Apache的HttpComponent组件,用的人不在少数.但是能用好的人,却微乎其微,为什么?很简单,TCP里面的细节实现不是每个人都能捕获到的(细节是魔鬼),像并发请求控制&资源释放,N ...
Android 开发对话框Dialog dismiss和hide方法的区别
http://ningtukun.blog.163.com/blog/static/186541445201310151539697/ dismiss和hide方法都可以隐藏对话框,在需要的时候也可以 ...
数据库存储过程 — Sql Server
Mysql.Oracle等主流关系型数据库基本都支持存储过程,这里使用Sql Server为例进行说明. 存储过程的概念: Sql Server存储过程 SQL Server 中的存储过程是由一个或多 ...
Android开发编码规范（自用）
转载请注明本文出自Cym的博客(http://blog.csdn.net/cym492224103),谢谢支持! Android开发编码规范目的及指导原则目的统一规范 Eclipse编辑环境 ...
JavaScripts学习日记——DOM
DOM Document Object Model 文档对象模型整合js和html css.控制html文档行为.DOM就是把页面当中所有内容全部封装成对象.HTML文档中万物皆对象.1.对象的分 ...
C#调用cmd 脚本实例
1.实例1 public static void TestOne() { Process p = new Process(); p.StartInfo.FileName = "cmd.exe ...
回顾：Linq To SQL语法 - 实体类
第一篇博客,还望各位大神勿喷小弟在此代码奉上........ 借用NorthWind数据库,实现一个商品展示的小功能.上代码: 添加对Linq的引用 using System.Data.Linq;/ ...
QQ 国际版(International version) - 关闭弹出资讯
1,打开QQ面板,点击左下角的 "企鹅"图标.选择 "Setting". 2,在弹出的 "Setting"面板中,选择 "Priv ...
使用CSS3+jquery.js 实现微信抽奖转盘效果
上次发表了一篇微信抽奖转盘活动-效果源码分析最近想起了刚接到这个项目时第一时间脑海里迸出的解决方法 “CSS3”! 为什么不能用CSS3来实现呢? 所以我打算用CSS3来实现这个效果.并不需要依赖 ...

Hadoop 2、配置HDFS HA (高可用)

Hadoop 2、配置HDFS HA (高可用)的更多相关文章

随机推荐

热门专题