Ha-Federation-hdfs +Yarn集群部署方式

经过一下午的尝试，终于把这个集群的搭建好了，搭完感觉也没有太大的必要，就当是学习了吧，为之后搭建真实环境做基础。

以下搭建的是一个Ha-Federation-hdfs+Yarn的集群部署。

　　首先讲一下我的配置：

　　四个节点上的启动的分别是：

　　1.qiang117:active namenode,

　　2.qiang118 standby namenode ，journalnode，datanode

　　3.qiang119 active namenode ，journalnode，datanode

　　4.qiang120 standby namenode ，journalnode，datanode

　　这样做纯粹是因为电脑hold不住那么虚拟机了，其实这里所有的节点都应该在不同的服务器上。简单的说，就是117和119做active namenode，118和120做standby namenode，在118.119.120上分别放datanode和journalnode。

此处省略一万字，各种配置好之后。。遇到的问题和记录如下：

1.启动 journalnode，这个journalnode话说我也不是太明白他是干嘛的~~，后续研究吧。在各个节点上启动journalnode:

[qiang@qiang118 hadoop-2.6.]$ sbin/hadoop-daemon.sh start journalnode

starting journalnode, logging to /home/qiang/hadoop-2.6./logs/hadoop-qiang-journalnode-qiang118.qiang.out

[qiang@qiang118 hadoop-2.6.]$ jps

 JournalNode

 Jps

2. 格式化namenode时报错：（最后查出来是没有关防火墙。。。免密码登陆不代表不用关防火墙）

// :: INFO ipc.Client: Retrying connect to server: qiang119/192.168.75.119:. Already tried  time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=, sleepTime= MILLISECONDS)

// :: INFO ipc.Client: Retrying connect to server: qiang118/192.168.75.118:. Already tried  time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=, sleepTime= MILLISECONDS)

// :: INFO ipc.Client: Retrying connect to server: qiang120/192.168.75.120:. Already tried  time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=, sleepTime= MILLISECONDS)

// :: INFO ipc.Client: Retrying connect to server: qiang119/192.168.75.119:. Already tried  time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=, sleepTime= MILLISECONDS)

// :: WARN namenode.NameNode: Encountered exception during format:

org.apache.hadoop.hdfs.qjournal.client.QuorumException: Unable to check if JNs are ready for formatting.  exceptions thrown:

192.168.75.120:: No Route to Host from  43.49.49.59.broad.ty.sx.dynamic.163data.com.cn/59.49.49.43 to qiang120: failed on socket timeout exception: java.net.NoRouteToHostException: No route to host; For more details see:  http://wiki.apache.org/hadoop/NoRouteToHost

192.168.75.119:: No Route to Host from  43.49.49.59.broad.ty.sx.dynamic.163data.com.cn/59.49.49.43 to qiang119: failed on socket timeout exception: java.net.NoRouteToHostException: No route to host; For more details see:  http://wiki.apache.org/hadoop/NoRouteToHost

    at org.apache.hadoop.hdfs.qjournal.client.QuorumException.create(QuorumException.java:)

    at org.apache.hadoop.hdfs.qjournal.client.QuorumCall.rethrowException(QuorumCall.java:)

    at org.apache.hadoop.hdfs.qjournal.client.QuorumJournalManager.hasSomeData(QuorumJournalManager.java:)

    at org.apache.hadoop.hdfs.server.common.Storage.confirmFormat(Storage.java:)

    at org.apache.hadoop.hdfs.server.namenode.FSImage.confirmFormat(FSImage.java:)

    at org.apache.hadoop.hdfs.server.namenode.NameNode.format(NameNode.java:)

    at org.apache.hadoop.hdfs.server.namenode.NameNode.createNameNode(NameNode.java:)

    at org.apache.hadoop.hdfs.server.namenode.NameNode.main(NameNode.java:)

// :: INFO ipc.Client: Retrying connect to server: qiang118/192.168.75.118:. Already tried  time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=, sleepTime= MILLISECONDS)

// :: FATAL namenode.NameNode: Failed to start namenode.

org.apache.hadoop.hdfs.qjournal.client.QuorumException: Unable to check if JNs are ready for formatting.  exceptions thrown:

192.168.75.120:: No Route to Host from  43.49.49.59.broad.ty.sx.dynamic.163data.com.cn/59.49.49.43 to qiang120: failed on socket timeout exception: java.net.NoRouteToHostException: No route to host; For more details see:  http://wiki.apache.org/hadoop/NoRouteToHost

192.168.75.119:: No Route to Host from  43.49.49.59.broad.ty.sx.dynamic.163data.com.cn/59.49.49.43 to qiang119: failed on socket timeout exception: java.net.NoRouteToHostException: No route to host; For more details see:  http://wiki.apache.org/hadoop/NoRouteToHost

    at org.apache.hadoop.hdfs.qjournal.client.QuorumException.create(QuorumException.java:)

    at org.apache.hadoop.hdfs.qjournal.client.QuorumCall.rethrowException(QuorumCall.java:)

    at org.apache.hadoop.hdfs.qjournal.client.QuorumJournalManager.hasSomeData(QuorumJournalManager.java:)

    at org.apache.hadoop.hdfs.server.common.Storage.confirmFormat(Storage.java:)

    at org.apache.hadoop.hdfs.server.namenode.FSImage.confirmFormat(FSImage.java:)

    at org.apache.hadoop.hdfs.server.namenode.NameNode.format(NameNode.java:)

    at org.apache.hadoop.hdfs.server.namenode.NameNode.createNameNode(NameNode.java:)

    at org.apache.hadoop.hdfs.server.namenode.NameNode.main(NameNode.java:)

// :: INFO util.ExitUtil: Exiting with status

// :: INFO namenode.NameNode: SHUTDOWN_MSG:

/************************************************************

SHUTDOWN_MSG: Shutting down NameNode at 43.49.49.59.broad.ty.sx.dynamic.163data.com.cn/59.49.49.43

格式化成功！

[qiang@qiang117 hadoop-2.6.]$ bin/hdfs namenode -format -clusterId hadoop-cluster

// :: INFO namenode.FSNamesystem: Append Enabled: true

// :: INFO util.GSet: Computing capacity for map INodeMap

// :: INFO util.GSet: VM type       = -bit

// :: INFO util.GSet: 1.0% max memory  MB = 8.9 MB

// :: INFO util.GSet: capacity      = ^ =  entries

// :: INFO namenode.NameNode: Caching file names occuring more than  times

// :: INFO util.GSet: Computing capacity for map cachedBlocks

// :: INFO util.GSet: VM type       = -bit

// :: INFO util.GSet: 0.25% max memory  MB = 2.2 MB

// :: INFO util.GSet: capacity      = ^ =  entries

// :: INFO namenode.FSNamesystem: dfs.namenode.safemode.threshold-pct = 0.9990000128746033

// :: INFO namenode.FSNamesystem: dfs.namenode.safemode.min.datanodes =

// :: INFO namenode.FSNamesystem: dfs.namenode.safemode.extension     =

// :: INFO namenode.FSNamesystem: Retry cache on namenode is enabled

// :: INFO namenode.FSNamesystem: Retry cache will use 0.03 of total heap and retry cache entry expiry time is  millis

// :: INFO util.GSet: Computing capacity for map NameNodeRetryCache

// :: INFO util.GSet: VM type       = -bit

// :: INFO util.GSet: 0.029999999329447746% max memory  MB = 273.1 KB

// :: INFO util.GSet: capacity      = ^ =  entries

// :: INFO namenode.NNConf: ACLs enabled? false

// :: INFO namenode.NNConf: XAttrs enabled? true

// :: INFO namenode.NNConf: Maximum size of an xattr:

// :: INFO namenode.FSImage: Allocated new BlockPoolId: BP--192.168.75.117-

// :: INFO common.Storage: Storage directory /home/qiang/hadoop/hdfs/name has been successfully formatted.

// :: INFO namenode.NNStorageRetentionManager: Going to retain  images with txid >=

// :: INFO util.ExitUtil: Exiting with status

// :: INFO namenode.NameNode: SHUTDOWN_MSG:

/************************************************************

SHUTDOWN_MSG: Shutting down NameNode at qiang117/192.168.75.117

************************************************************/

3.开启namenode：

[qiang@qiang117 hadoop-2.6.]$ sbin/hadoop-daemon.sh start namenode

starting namenode, logging to /home/qiang/hadoop-2.6./logs/hadoop-qiang-namenode-qiang117.out

[qiang@qiang117 hadoop-2.6.]$ jps

 NameNode

 Jps

4.格式化standby namenode

[qiang@qiang119 hadoop-2.6.]$ bin/hdfs namenode -bootstrapStandby

// :: INFO namenode.NameNode: STARTUP_MSG:

/************************************************************

STARTUP_MSG: Starting NameNode

STARTUP_MSG:   host = qiang119/192.168.75.119

STARTUP_MSG:   args = [-bootstrapStandby]

STARTUP_MSG:   version = 2.6.0

.....

.....

STARTUP_MSG:   build = https://git-wip-us.apache.org/repos/asf/hadoop.git -r e3496499ecb8d220fba99dc5ed4c99c8f9e33bb1; compiled by 'jenkins' on 2014-11-13T21:10Z

STARTUP_MSG:   java = 1.8.0_51

************************************************************/

// :: INFO namenode.NameNode: registered UNIX signal handlers for [TERM, HUP, INT]

// :: INFO namenode.NameNode: createNameNode [-bootstrapStandby]

=====================================================

About to bootstrap Standby ID nn2 from:

           Nameservice ID: hadoop-cluster1

        Other Namenode ID: nn1

  Other NN's HTTP address: http://qiang117:50070

  Other NN's IPC  address: qiang117/192.168.75.117:8020

             Namespace ID:

            Block pool ID: BP--192.168.75.117-

               Cluster ID: hadoop-cluster

           Layout version: -

=====================================================

// :: INFO common.Storage: Storage directory /home/qiang/hadoop/hdfs/name has been successfully formatted.

// :: INFO namenode.TransferFsImage: Opening connection to http://qiang117:50070/imagetransfer?getimage=1&txid=0&storageInfo=-60:1244139539:0:hadoop-cluster

// :: INFO namenode.TransferFsImage: Image Transfer timeout configured to  milliseconds

// :: INFO namenode.TransferFsImage: Transfer took .01s at 0.00 KB/s

// :: INFO namenode.TransferFsImage: Downloaded file fsimage.ckpt_0000000000000000000 size  bytes.

// :: INFO util.ExitUtil: Exiting with status

// :: INFO namenode.NameNode: SHUTDOWN_MSG:

/************************************************************

SHUTDOWN_MSG: Shutting down NameNode at qiang119/192.168.75.119

************************************************************/

5.开启standby namenode

[qiang@qiang119 hadoop-2.6.]$ sbin/hadoop-daemon.sh start namenode

starting namenode, logging to /home/qiang/hadoop-2.6./logs/hadoop-qiang-namenode-qiang119.out

[qiang@qiang119 hadoop-2.6.]$ jps

 JournalNode

 NameNode

 Jps

在web上打开以后二个显示都是standy状态：

使用这个命令将nn1切换为active状态：

bin/hdfs haadmin -ns hadoop-cluster1 -transitionToActive nn1

另外两个一样的道理：

开启所有的datanode，这里是在只有配置好ssh免密码登录的情况下才能使用。可以参考：http://www.cnblogs.com/qiangweikang/p/4740936.html

[qiang@qiang117 hadoop-2.6.]$ sbin/hadoop-daemons.sh start datanode

开了仨，就是之前预设好的192.168.1.118，192.168.1.119和192.168.1.120

启动yarn

[qiang@qiang117 hadoop-2.6.]$ sbin/start-yarn.sh 

starting yarn daemons

starting resourcemanager, logging to /home/qiang/hadoop-2.6./logs/yarn-qiang-resourcemanager-qiang117.out

qiang118: nodemanager running as process . Stop it first.

qiang120: nodemanager running as process . Stop it first.

qiang119: nodemanager running as process . Stop it first.

[qiang@qiang117 hadoop-2.6.]$ jps

 NameNode

 Jps

 ResourceManager

也是可以看到有三个datanode

最后总结一下吧...... 自学大数据的话，有一个简单的部署就足够了，能够让你写好的程序放入hdfs中跑就可以了，这样的集群应该是在最后，或者需要的时候再去详细的做研究，抓紧进入之后的阶段吧~~

Ha-Federation-hdfs +Yarn集群部署方式的更多相关文章

Kubernetes 企业级集群部署方式
一.Kubernetes介绍与特性 1.1.kubernetes是什么官方网站:http://www.kubernetes.io • Kubernetes是Google在2014年开源的一个容器集群 ...
大数据【三】YARN集群部署
一概述 YARN是一个资源管理.任务调度的框架,采用master/slave架构,主要包含三大模块:ResourceManager(RM).NodeManager(NM).ApplicationMa ...
MinIO分布式集群部署方式
文章转载自:https://blog.51cto.com/u_10950710/4843738 关于分布式集群MinIo 单机Minio服务存在单点故障,如果是一个有N块硬盘的分布式Minio,只要有 ...
大数据Hadoop的HA高可用架构集群部署
1 概述在Hadoop 2.0.0之前,一个Hadoop集群只有一个NameNode,那么NameNode就会存在单点故障的问题,幸运的是Hadoop 2.0.0之后解决了这个问题,即支持N ...
activeMQ主要的几类集群部署方式
官方主从实现的文档:http://activemq.apache.org/masterslave.html 一.activeMQ主要的几类部署方式比较 1.默认的单机部署(kahadb) acti ...
yarn 集群部署，遇到的问题小结
版本号信息: hadoop 2.3.0 hive 0.11.0 1. Application Master 无法訪问点击application mater 链接,出现 http 500 错 ...
（转）yarn 集群部署，遇到的问题小结
link:http://blog.csdn.net/uniquechao/article/details/26449761 版本信息: hadoop 2.3.0 hive 0.11.0 1. ...
spark on yarn 集群部署
概述 hadoop2.7.1 spark 1.5.1 192.168.31.62 resourcemanager, namenode, master 192.168.31.63 nodeman ...
Flink集群部署
部署方式一般来讲有三种方式: Local Standalone Flink On Yarn/Mesos/K8s… 单机模式参考上一篇Flink从入门到放弃(入门篇2)-本地环境搭建&构建第 ...

随机推荐

STL所有算法简介（转） http://www.cnblogs.com/yuehui/archive/2012/06/19/2554300.html
STL所有算法简介 STL中的所有算法(70个) 参考自:http://www.cppblog.com/mzty/archive/2007/03/14/19819.htmlhttp://hi.baid ...
保证service不被杀死的方法
Service设置成START_STICKY kill 后会被重启(等待5秒左右),重传Intent,保持与重启前一样提升service优先级在AndroidManifest.xml文件中对于in ...
bzoj2184: 任意图的匹配
Description 每天都要考,每天都要讲,大家注意力都集中不起来了,每天听解题报告时都有人交头接耳(也包括我,呵呵).这样做大大的影响的学习效率(可能吧).于是,有些好奇心重的同学就开始研究,怎 ...
【BZOJ】1007: [HNOI2008]水平可见直线（凸包）
题目传送门:QWQ 分析在下面维护一个凸壳好久没写博客了...... 代码 #include <bits/stdc++.h> using namespace std; ; ,INF= ...
阶段性总结(PHP-Session)
PHP Session PHP session 变量用于存储关于用户会话(session)的信息,或者更改用户会话(session)的设置.Session 变量存储单一用户的信息,并且对于应用程序中的 ...
Python Twisted系列教程18：Deferreds 全貌
作者:dave@http://krondo.com/deferreds-en-masse/ 译者: Cheng Luo 你可以从”第一部分 Twist理论基础“开始阅读:也可以从”Twisted 入 ...
PHP5缓存插件
1.1操作码介绍及缓存原理当客户端请求一个PHP程序时,服务器的PHP引擎会解析到该PHP程序,并将其变异为特定的操作码文件(OperateCode opcode),这是要执行的PHP代码的一种二进 ...
Android Studio里面配置Tesseract
网上大多是eclipse的项目,因为我用的是AS,所以说一下怎么配置. 身份证图片资料来自百度. 一.导入相关文件其实我们不用自己编译,可以把别人项目编译好的jar包和so库直接拿来用.因为识别的效 ...
python拷贝目录下的文件
#!/usr/bin/env python # Version = 3.5.2 import shutil base_dir = '/data/media/' file = '/backup/temp ...
directshow 虚拟摄像头实例代码解读
directshow 虚拟摄像头实例代码解读本文只介绍这个源码的大致构成以及怎么修改,因为其他的我也不会啊哈哈哈,我就是用QQ调用虚拟摄像头读取我自己的视频或者图片播放给别人让别人以为这就是实时 ...

Ha-Federation-hdfs +Yarn集群部署方式

Ha-Federation-hdfs +Yarn集群部署方式的更多相关文章

随机推荐

热门专题