hadoop 2.x 完全分布式搭建

HDFS HA 集群搭建：

　　DN（DataNode）：3个；NN（NameNode）：2；ZK(ZooKeeper)：3（大于1的奇数个）；ZKFC:和NN在同一台机器；JN：3；RM(ResourceManager):1；DM(DataManager):3个；与DN在同一台，就近原则

　　√表示在该机器上有该进程。

	NN	DN	ZK	ZKFC	JN	RM	DM
Node1	√		√	√		√
Node2	√	√	√	√	√		√
Node3		√	√		√		√
Node4		√			√		√

1.解压 hadoop-2.5.2.tar.gz

[hadoop@node1 software]$ tar -zxvf hadoop-2.5..tar.gz

其中 -zxvf 含义如下：

-z, gzip : 对归档文件使用 gzip 压缩

-x, --extract, --get : 释放归档文件中文件及目录

-v, --verbose : 显示命令整个执行过程

-f, --file=ARCHIVE : 指定 (将要创建或已存在的) 归档文件名

这里注意，我们的环境为CentOS7 64位系统，这里的tar包也需要为64位，可以使用如下方法查看hadoop tar包是32位还是64位：

/hadoop-2.5./lib/native

[hadoop@node1 native]$ ls

libhadoop.a       libhadoop.so        libhadooputils.a  libhdfs.so

libhadooppipes.a  libhadoop.so.1.0.  libhdfs.a         libhdfs.so.0.0.

[hadoop@node1 native]$ file libhadoop.so.1.0.

libhadoop.so.1.0.: ELF -bit LSB shared object, x86-, version  (SYSV), dynamically linked, BuildID[sha1]=29e15e4c9d9840a7b96b5af3e5732e5935d91847, not stripped

2.进入hadoop解压后的目录修改hadoop-env.sh，主要修改JAVA_HOME

[hadoop@node1 hadoop]$ echo $JAVA_HOME

/usr/java/jdk1..0_75

[hadoop@node1 hadoop]$ vim hadoop-env.sh

export JAVA_HOME=/usr/java/jdk1..0_75

2. 修改hdfs-site.xml,可以参照官档 http://hadoop.apache.org/docs/r2.5.2/hadoop-project-dist/hadoop-hdfs/HDFSHighAvailabilityWithQJM.html

<configuration>

<!--配置服务名称，名称可以随意-->

<property>

  <name>dfs.nameservices</name>

  <value>mycluster</value>

</property>

<!--配置所有NameNode名称,这里名称随意-->

<property>

  <name>dfs.ha.namenodes.mycluster</name>

  <value>nn1,nn2</value>

</property>

<!--配置所有NameNode的RPC协议端口-->

<property>

  <name>dfs.namenode.rpc-address.mycluster.nn1</name>

  <value>node1.example.com:</value>

</property>

<property>

  <name>dfs.namenode.rpc-address.mycluster.nn2</name>

  <value>node2.example.com:i8020</value>

</property>

<!--配置Http协议端口和主机-->

<property>

  <name>dfs.namenode.http-address.mycluster.nn1</name>

  <value>node1.example.com:</value>

</property>

<property>

  <name>dfs.namenode.http-address.mycluster.nn2</name>

  <value>node2.example.com:</value>

</property>

<!--配置JournalNodes 的地址-->

<property>

  <name>dfs.namenode.shared.edits.dir</name>

  <value>qjournal://node2:8485;node3:8485;node4:8485/mycluster</value>

</property>

<!--配置客户端要使用的类，客户端使用这个类找到Active NodeName-->

<property>

  <name>dfs.client.failover.proxy.provider.mycluster</name>

  <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>

</property>

<!--配置sshfence-->

<property>

  <name>dfs.ha.fencing.methods</name>

  <value>sshfence</value>

</property>

<property>

  <name>dfs.ha.fencing.ssh.private-key-files</name>

  <value>/home/hadoop/.ssh/id_dsa</value>

</property>

<!--配置JournalNodes的工作目录-->

<property>

  <name>dfs.journalnode.edits.dir</name>

  <value>/opt/jn/data</value>

</property>

<!--开启自动切换,当然手动切换也是可用用的-->

<property>

   <name>dfs.ha.automatic-failover.enabled</name>

   <value>true</value>

</property>

</configuration>

3.配置core-site.xml

<configuration>

<!--配置NameNode入口,这里配置集群名称，不能配置具体的ip-->

<property>

  <name>fs.defaultFS</name>

  <value>hdfs://mycluster</value>

</property>

<!--配置zk，表明zk在哪些机器上有-->

<property>

  <name>ha.zookeeper.quorum</name>

  <value>node1:,node2:,node3:</value>

</property>

<!--修改hadoop的临时目录，默认目录在系统的tmp目录下-->

<property>

  <name>hadoop.tmp.dir</name>

  <value>/opt/hadoop</value>

</property>

</configuration>

4.配置zk

initLimit=

syncLimit=

dataDir=/opt/zookeeper

clientPort=

server.=node1::

server.=node2::

server.=node3::

在配置的dataDir目录下创建myid文件，在node1上配置，稍后还要在node2，node3做相应配置

[hadoop@node1 zookeeper]$ cat /opt/zookeeper/myid

将node1上的zookeeper目录拷贝的node2，及node3上

[root@node1 opt]# scp -r zookeeper/ root@node2:/opt/

[root@node1 opt]# scp -r zookeeper/ root@node3:/opt/

并在node2及node3上分别修改myid文件，node2修改为2，node3修改为3

将node1上的zk的目录拷贝到node2，node3上

[hadoop@node1 software]$ scp -r zookeeper-3.4. hadoop@node2:/home/hadoop/software/

[hadoop@node1 software]$ scp -r zookeeper-3.4. hadoop@node3:/home/hadoop/software/

配置3台节点的ZK_HOME的环境变量：

[root@node1 bin]# vim /etc/profile

export ZK_HOME=/home/hadoop/software/zookeeper-3.4.

export PATH=$PATH:$ZK_HOME/bin

关闭防火墙，并在3台机器上分别启动zk

# zkServer.sh start

ZooKeeper JMX enabled by default

Using config: /home/hadoop/software/zookeeper-3.4./bin/../conf/zoo.cfg

Starting zookeeper ... STARTED

# jps

 Jps

 QuorumPeerMain

5.配置slaves

[root@node1 hadoop]# vim slaves 

node2

node3

node4

6，将配置好的hadoop目录拷贝到其他节点

[hadoop@node1 hadoop]$ scp * hadoop@node2:/home/hadoop/software/hadoop-2.5./etc/hadoop/

[hadoop@node1 hadoop]$ scp * hadoop@node3:/home/hadoop/software/hadoop-2.5./etc/hadoop/

[hadoop@node1 hadoop]$ scp * hadoop@node4:/home/hadoop/software/hadoop-2.5./etc/hadoop/

7. 启动JournalNode

分别在node2，node3，node4机器上上启动JournalNode

[hadoop@node2 sbin]$ ./hadoop-daemon.sh start journalnode

starting journalnode, logging to /home/hadoop/software/hadoop-2.5./logs/hadoop-hadoop-journalnode-node2.out

[hadoop@node2 sbin]$ jps

 JournalNode

 Jps

 QuorumPeerMain

[hadoop@node2 sbin]$

8.在其中一台含有Namenode的机器上进行格式化

[hadoop@node1 bin]$ ./hdfs namenode -format

9.将刚才格式化好的元数据文件拷贝到其他的namenode节点上

　　9.1 先启动刚才格式化后的Namenode节点(只启动NameNode)

[hadoop@node1 sbin]$ ./hadoop-daemon.sh start namenode

[hadoop@node1 sbin]$ jps

 QuorumPeerMain

 NameNode

 Jps

　　9.2 再在未格式化的节点上执行以下命令：

[hadoop@node2 bin]$ ./hdfs namenode -bootstrapStandby

　　检查是否有相应目录生成

10.先停止所有的服务，除了ZK

[hadoop@node1 sbin]$ ./stop-dfs.sh

Stopping namenodes on [node1 node2]

node2: no namenode to stop

node1: stopping namenode

node2: no datanode to stop

node4: no datanode to stop

node3: no datanode to stop

Stopping journal nodes [node2 node3 node4]

node3: stopping journalnode

node2: stopping journalnode

node4: stopping journalnode

Stopping ZK Failover Controllers on NN hosts [node1 node2]

node2: no zkfc to stop

node1: no zkfc to stop

[hadoop@node1 sbin]$

11.格式化zkfc ，在任意一台有Namenode机器上进行格式化

[hadoop@node1 bin]$ ./hdfs zkfc -formatZK

12.启动hdfs

[hadoop@node1 sbin]$ ./start-dfs.sh

Starting namenodes on [node1 node2]

node1: starting namenode, logging to /home/hadoop/software/hadoop-2.5./logs/hadoop-hadoop-namenode-node1.out

node2: starting namenode, logging to /home/hadoop/software/hadoop-2.5./logs/hadoop-hadoop-namenode-node2.out

node4: starting datanode, logging to /home/hadoop/software/hadoop-2.5./logs/hadoop-hadoop-datanode-node4.out

node2: starting datanode, logging to /home/hadoop/software/hadoop-2.5./logs/hadoop-hadoop-datanode-node2.out

node3: starting datanode, logging to /home/hadoop/software/hadoop-2.5./logs/hadoop-hadoop-datanode-node3.out

Starting journal nodes [node2 node3 node4]

node3: starting journalnode, logging to /home/hadoop/software/hadoop-2.5./logs/hadoop-hadoop-journalnode-node3.out

node2: starting journalnode, logging to /home/hadoop/software/hadoop-2.5./logs/hadoop-hadoop-journalnode-node2.out

node4: starting journalnode, logging to /home/hadoop/software/hadoop-2.5./logs/hadoop-hadoop-journalnode-node4.out

Starting ZK Failover Controllers on NN hosts [node1 node2]

node1: starting zkfc, logging to /home/hadoop/software/hadoop-2.5./logs/hadoop-hadoop-zkfc-node1.out

node2: starting zkfc, logging to /home/hadoop/software/hadoop-2.5./logs/hadoop-hadoop-zkfc-node2.out

[hadoop@node1 sbin]$ jps

 Jps

 QuorumPeerMain

 NameNode

 DFSZKFailoverController

[hadoop@node1 sbin]$

通过jps查看需要的节点是否启动成功

[hadoop@node2 opt]$  jps

 JournalNode

 DataNode

 DFSZKFailoverController

 NameNode

 Jps

 QuorumPeerMain

[hadoop@node2 opt]$

[hadoop@node3 opt]$ jps

 JournalNode

 QuorumPeerMain

 DataNode

 Jps

[hadoop@node3 opt]$

[hadoop@node4 sbin]$ jps

 Jps

 DataNode

 JournalNode

[hadoop@node4 sbin]$

13，通过浏览器访问

哪个节点为 Standby，哪个为active是通过CPU竞争机制。　　

测试创建目录和上传文件：

[hadoop@node1 bin]$ ./hdfs dfs -mkdir -p /usr/file

[hadoop@node1 bin]$ ./hdfs dfs -put /home/hadoop/software/jdk-7u75-linux-x64.rpm /usr/file/

到此 Hadoop2.x HA 就搭建完成。

hadoop 2.x 完全分布式搭建的更多相关文章

Hadoop简介与伪分布式搭建—DAY01
一. Hadoop的一些相关概念及思想 1.hadoop的核心组成: (1)hdfs分布式文件系统 (2)mapreduce 分布式批处理运算框架 (3)yarn 分布式资源调度系统 2.hadoo ...
hadoop集群完全分布式搭建
Hadoop环境搭建:完全分布式集群规划: ip hostname 192.168.204.154 master namenode resour ...
hadoop集群为分布式搭建
1.准备Linux环境设置虚拟机网络 1.0点击VMware快捷方式,右键打开文件所在位置 -> 双击vmnetcfg.exe -> VMnet1 host-only ->修改 ...
大数据系列（3）——Hadoop集群完全分布式坏境搭建
前言上一篇我们讲解了Hadoop单节点的安装,并且已经通过VMware安装了一台CentOS 6.8的Linux系统,咱们本篇的目标就是要配置一个真正的完全分布式的Hadoop集群,闲言少叙,进入本 ...
Hadoop学习笔记(3)——分布式环境搭建
Hadoop学习笔记(3) ——分布式环境搭建前面,我们已经在单机上把Hadoop运行起来了,但我们知道Hadoop支持分布式的,而它的优点就是在分布上突出的,所以我们得搭个环境模拟一下. 在这里, ...
hadoop分布式搭建
1.新建三台机器,分别为: hadoop分布式搭建至少需要三台机器: master extension1 extension2 本文利用在VMware Workstation下安装Linux cent ...
hadoop完全分布式搭建HA（高可用）
2018年03月25日 16:25:26 D调的Stanley 阅读数:2725 标签: hadoop HAssh免密登录hdfs HA配置hadoop完全分布式搭建zookeeper 配置更多个 ...
Hadoop生态圈-hbase介绍-完全分布式搭建
Hadoop生态圈-hbase介绍-完全分布式搭建作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任.
超详细解说Hadoop伪分布式搭建--实战验证【转】
超详细解说Hadoop伪分布式搭建原文http://www.tuicool.com/articles/NBvMv2原原文 http://wojiaobaoshanyinong.iteye.com/b ...

随机推荐

后缀自动机&序列自动机综合
好像序列自动机还没有写过- 串长为n的串共有n+1个节点,除了串中的n个节点,还有一个空的根节点放在串首.每个节点至多有26条出边,每条边连向它之后的第一个字符. 串中的任意一个子序列对应了一条根到某 ...
python魔法函数的一些疑问
看了魔法函数,有一点疑问.1中需要用self.word才能执行,而2直接用self就可以执行.而1中Word继承了int基本类型,但在__new__时并没有什么卵用.当用 Word(“123”)来实例 ...
vpn+路由表，最大限度提高上网速度
Linux使用pptpclient连接VPN后并无自动更改路由,所以需要自己添加一条规则,可以ip这个命令(ppp设备名称可以通过ifconfig查看),执行以下命令即可: root@alexknig ...
BZOJ 3669 【NOI2014】魔法森林
Description 为了得到书法大家的真传,小E同学下定决心去拜访住在魔法森林中的隐士.魔法森林可以被看成一个包含个N节点M条边的无向图,节点标号为1..N,边标号为1..M.初始时小E同学在号节 ...
UML类图归纳
作为一个程序员,掌握UML类图是开发和阅读程序的基础. 转载请注明地址http://www.cnblogs.com/zrtqsk/p/3739288.html,谢谢! 一.基本介绍 UML是一种标准的 ...
眼保Guide
1.睡前不要玩手机,特别是关灯玩手机!否则第二天早上你就会感到眼睛模糊了.长久下去就会形成近视或者近视加深. 2.早上起床半小时内不要戴眼镜,不要看手机.电脑等一切电子屏幕,甚至不要看书.这段时间是眼 ...
我的微型工作流引擎-功能解析及API设计
一.前言上一篇我给大家介绍了我的工作流的模型和基本的设计,这篇我想详细说明下我这款工作流的功能及使用示例.这款工作流主要是面向开发者设计的,为了先让大家有个全局的认识,局部功能的设计实现就不细说了, ...
ASP.NET 小白从零开始建站简易教程 (一)域名、虚拟主机、FTP上传文件
只考虑性价比,纯新手实验无备案.跟着步骤走半小时即可收获独立的个人网站一枚! 我的实验站 http://www.bearlab.site/ ⁄(⁄ ⁄•⁄ω⁄•⁄ ⁄)⁄ 目前总价花费86元(域名加虚 ...
WPF 异步加载高清大图
不管什么东西,但凡太大了,总是让人又爱又恨啊!(很有道理的样子,大家鼓掌└(￣￣└)(┘￣￣)┘) 猿:老板,现在这社会啊,真是浮躁啊,之前还是什么1080P,然后就到了2K,现在又到了4K……他 ...
IIS安装与MVC程序部署
最近在做访客系统,虽然说不是什么多大的项目,但麻雀虽小五脏俱全,使用EF Code First+Mysql+Frozenui响应式布局,感觉通过这个项目学到好多东西,Mysql的使用.EF映射Mysq ...

hadoop 2.x 完全分布式搭建

hadoop 2.x 完全分布式搭建的更多相关文章

随机推荐

热门专题