hadoop格式化：java.io.IOException: Incompatible clusterIDs in /home/lxh/hadoop/hdfs/data: namenode clusterID

1 概述
解决hadoop启动hdfs时，datanode无法启动的问题。错误为：

java.io.IOException: Incompatible clusterIDs in /home/lxh/hadoop/hdfs/data: namenode clusterID = CID-a3938a0b-57b5-458d-841c-d096e2b7a71c; datanode clusterID = CID-200e6206-98b5-44b2-9e48-262871884eeb

2 问题描述
执行start-dfs.sh后，根据打印日志，可以看到分别执行了NameNode、DataNode的操作。

Starting namenodes on [localhost]

localhost: starting namenode, logging to /home/lxh/hadoop/hadoop-2.4.1/logs/hadoop-lxh-namenode-ubuntu.out

localhost: starting datanode, logging to /home/lxh/hadoop/hadoop-2.4.1/logs/hadoop-lxh-datanode-ubuntu.out

但是执行jps查看启动结果时，返现DataNode并没有启动。

10256 ResourceManager

29634 NameNode

29939 SecondaryNameNode

30054 Jps

10399 NodeManager

3 查找问题
很是费解，刚刚还能够正常运行，并且执行了wordcount的测试程序。于是回想了一下刚才的操作，执行了dfs格式化(hdfs namenode -format和hdfs datanode -format)，然后重新启动就出现了这个情况。难道与格式化有关？于是查看日志：

2014-08-08 00:32:08,787 FATAL org.apache.hadoop.hdfs.server.datanode.DataNode: Initialization failed for Block pool <registering> (Datanode Uuid unassigned) service to localhost/127.0.0.1:9000. Exiting.

java.io.IOException: Incompatible clusterIDs in /home/lxh/hadoop/hdfs/data: namenode clusterID = CID-a3938a0b-57b5-458d-841c-d096e2b7a71c; datanode clusterID = CID-200e6206-98b5-44b2-9e48-262871884eeb

at org.apache.hadoop.hdfs.server.datanode.DataStorage.doTransition(DataStorage.java:477)

at org.apache.hadoop.hdfs.server.datanode.DataStorage.recoverTransitionRead(DataStorage.java:226)

at org.apache.hadoop.hdfs.server.datanode.DataStorage.recoverTransitionRead(DataStorage.java:254)

at org.apache.hadoop.hdfs.server.datanode.DataNode.initStorage(DataNode.java:974)

at org.apache.hadoop.hdfs.server.datanode.DataNode.initBlockPool(DataNode.java:945)

at org.apache.hadoop.hdfs.server.datanode.BPOfferService.verifyAndSetNamespaceInfo(BPOfferService.java:278)

at org.apache.hadoop.hdfs.server.datanode.BPServiceActor.connectToNNAndHandshake(BPServiceActor.java:220)

at org.apache.hadoop.hdfs.server.datanode.BPServiceActor.run(BPServiceActor.java:816)

at java.lang.Thread.run(Thread.java:745)

2014-08-08 00:32:08,790 WARN org.apache.hadoop.hdfs.server.datanode.DataNode: Ending block pool service for: Block pool <registering> (Datanode Uuid unassigned) service to localhost/127.0.0.1:9000

2014-08-08 00:32:08,791 INFO org.apache.hadoop.hdfs.server.datanode.DataNode: Removed Block pool <registering> (Datanode Uuid unassigned)

根据日志描述，原因是datanode的clusterID 和 namenode的clusterID 不匹配。

原因找到，看看是否如日志描述的这样。

打开hdfs-site.xml中关于datanode和namenode对应的目录，分别打开其中的current/VERSION文件，进行对比。

${datanode}/current/VERSION:

storageID=DS-be8dfa2b-17b1-4c9f-bbfe-4898956a39ed

clusterID=CID-200e6206-98b5-44b2-9e48-262871884eeb

cTime=0

datanodeUuid=406b6d6a-0cb1-453d-b689-9ee62433b15d

storageType=DATA_NODE

layoutVersion=-55

${namenode}/current/VERSION:

namespaceID=670379

clusterID=CID-a3938a0b-57b5-458d-841c-d096e2b7a71c

cTime=0

storageType=NAME_NODE

blockpoolID=BP-325596647-127.0.1.1-1407429078192

layoutVersion=-56

果然如日志中记录的一样，于是修改datanode的VERSION文件中的clusterID，使与namenode保持一致，然后启动dfs（执行start-dfs.sh），在执行jps查看启动情况，发现全部正常启动。

10256 ResourceManager

30614 NameNode

30759 DataNode

30935 SecondaryNameNode

31038 Jps

10399 NodeManager

4 分析问题原因
执行hdfs namenode -format后，current目录会删除并重新生成，其中VERSION文件中的clusterID也会随之变化，而datanode的VERSION文件中的clusterID保持不变，造成两个clusterID不一致。

所以为了避免这种情况，可以再执行的namenode格式化之后，删除datanode的current文件夹，或者修改datanode的VERSION文件中出clusterID与namenode的VERSION文件中的clusterID一样，然后重新启动dfs。

hadoop格式化：java.io.IOException: Incompatible clusterIDs in /home/lxh/hadoop/hdfs/data: namenode clusterID的更多相关文章

hadoop异常：到目前为止解决的最牛逼的一个异常（java.io.IOException: Incompatible clusterIDs）
(注意: 本人用的版本为hadoop2.2.0, 旧的版本和此版本的解决方法不同) 异常为: 9 (storage id DS-2102177634-172.16.102.203-50010-1384 ...
hadoop集群启动报错： java.io.IOException: Incompatible clusterIDs
java.io.IOException: Incompatible clusterIDs in /export/hadoop-2.7.5/hadoopDatas/datanodeDatas2: nam ...
重新格式化namenode后，出现java.io.IOException Incompatible clusterIDs
错误: java.io.IOException: Incompatible clusterIDs in /data/dfs/data: namenode clusterID = CID-d1448b9 ...
Hadoop错误：java.io.IOException: Incompatible clusterIDs
问题: 配置Hadoop集群时,一个节点的DataNode无法启动排查: 查看hadoop-root-datanode-bigdata114.log文件,错误信息如下: java.io.IOExce ...
hadoop中集群节点ID不一致（ java.io.IOException: Incompatible clusterIDs ）
java.io.IOException: Incompatible namespaceIDs
问题描述: 在实验的时候,需要往以前的集群中添加一台datanode,在添加之前,由于在调式namenode的时候,格式化了dfs,这就导致了namenode上的namespaceID和以前集群上 ...
hadoop错误java.io.IOException Failed to replace a bad datanode on the existing pipeline due to no more good datanodes being available to try
错误: java.io.IOException: Failed to replace a bad datanode on the existing pipeline due to no more go ...
org.apache.hadoop.ipc.RemoteException(java.io.IOException)
昨晚突然之间mr跑步起来了 jps查看进程都在的,但是在reduce任务跑了85%的时候会抛异常异常情况如下: 2016-09-21 21:32:28,538 INFO [org.apache.h ...
运行基准测试hadoop集群中的问题：org.apache.hadoop.ipc.RemoteException: java.io.IOException: File /benchmarks/TestDFSIO/io_data/test_
在master(即:host2)中执行 hadoop jar hadoop-test-1.1.2.jar DFSCIOTest -write -nrFiles 12 -fileSize 10240 - ...

随机推荐

深入理解--VUE组件中数据的存放以及为什么组件中的data必需是函数
1.组件中数据的存放 ***(重点)组件是一个单独模块的封装:这个模块有自己的HTML模板,也有data属性. 只是这个data属性必需是一个函数,而这个函数返回一个对象,这个对象里面存放着组件的数据 ...
【AI测试】也许这有你想知道的人工智能 (AI) 测试--第二篇
概述此为人工智能 (AI) 测试第二篇第一篇主要介绍了人工智能测试.测试什么.测试数据等.第二篇主要介绍测试用例和测试报告.之后的文章可能具体介绍如何开展各项测试,以及具体项目举例如何测试.测试用 ...
Scrum冲刺第三篇
一.每日例会会议照片成员昨日已完成的工作今日计划完成的工作工作中遇到的困难陈嘉欣撰写博客,管理成员提交代码每日博客,根据队员代码问题更改规范文档安排后续工作队员提交的代码管理困难邓 ...
静态文件 static
一.常见的形式前面初步搭建Django开局时候就在项目路径下建立了statics 文件夹,然后在 settings.py 文件的末尾添加了 statics 文件夹的绝对路径. # 这个可以给 ...
Python语言基础04-构造程序逻辑
本文收录在Python从入门到精通系列文章系列学完前面的几个章节后,博主觉得有必要在这里带大家做一些练习来巩固之前所学的知识,虽然迄今为止我们学习的内容只是Python的冰山一角,但是这些内容已经足 ...
基于VLC库C#开发可播放摄像头及任意格式视频的播放器
前言本文主要讲述,在WPF中,借助Vlc.DotNet调用VLC类库,实现视频播功能,下面我们先来做开发前的准备工作. 准备工作首先,我们创建一个项目WpfVLC,然后,进入Neget搜索Vlc. ...
[LeetCode] 912. Sort an Array 数组排序
Given an array of integers nums, sort the array in ascending order. Example 1: Input: [5,2,3,1] Outp ...
[LeetCode] 525. Contiguous Array 相连的数组
Given a binary array, find the maximum length of a contiguous subarray with equal number of 0 and 1. ...
[LeetCode] 90. Subsets II 子集合之二
Given a collection of integers that might contain duplicates, S, return all possible subsets. Note: ...
python 编码（encode）解码（decode）问题
s = '匆匆'print(s)s1 = s.decode("utf-8") # utf-8 转成 Unicode,decode(解码)需要注明当前编码格式print(s1,typ ...

hadoop格式化：java.io.IOException: Incompatible clusterIDs in /home/lxh/hadoop/hdfs/data: namenode clusterID

hadoop格式化：java.io.IOException: Incompatible clusterIDs in /home/lxh/hadoop/hdfs/data: namenode clusterID的更多相关文章

随机推荐

热门专题