背景：（测试环境）只有两台机器一台namenode一台namenode,但集群只有一个结点感觉不出来效果，在namenode上挂一个datanode就有两个节点，弊端见最后

操作非常简单（添加独立节点参照：http://www.cnblogs.com/pu20065226/p/8493316.html）

1.修改namenode节点的slave文件,增加新节点信息

[hadoop@hadoop-master hadoop]$ pwd

/usr/hadoop/hadoop-2.7./etc/hadoop

[hadoop@hadoop-master hadoop]$ cat slaves

slave1

hadoop-master

[hadoop@hadoop-master hadoop]$

2.启动新datanode的datanode和nodemanger进程

先确认namenode和当前的datanode中，etc/hoadoop/excludes文件中无待加入的主机，再进行下面操作

[hadoop@slave2 hadoop-2.7.]$ sbin/hadoop-daemon.sh start datanode

starting datanode, logging to /usr/hadoop/hadoop-2.7./logs/hadoop-hadoop-datanode-slave2.out

[hadoop@slave2 hadoop-2.7.]$ sbin/yarn-daemon.sh start nodemanager

starting datanode, logging to /usr/hadoop/hadoop-2.7./logs/yarn-hadoop-datanode-slave2.out

[hadoop@slave2 hadoop-2.7.]$

91284 SecondaryNameNode
90979 NameNode
91519 ResourceManager
41768 DataNode
41899 NodeManager
41999 Jps

[hadoop@slave2 ~]$

3.在NameNode上刷新节点

[hadoop@hadoop-master ~]$ hdfs dfsadmin -refreshNodes

Refresh nodes successful

[hadoop@hadoop-master ~]$sbin/start-balancer.sh

4.在namenode查看当前集群情况,

确认节点已经正常加入

[hadoop@hadoop-master hadoop-2.7.]$ hdfs dfsadmin -report

Configured Capacity:  (54.63 GB)

Present Capacity:  (33.52 GB)

DFS Remaining:  (33.52 GB)

DFS Used:  (508.47 KB)

DFS Used%: 0.00%

Under replicated blocks:

Blocks with corrupt replicas:

Missing blocks:

Missing blocks (with replication factor ): 

-------------------------------------------------

Live datanodes ():

Name: 192.168.48.129:50010 (hadoop-master)

Hostname: hadoop-master

Decommission Status : Normal

Configured Capacity: 38588669952 (35.94 GB)

DFS Used: 213476 (208.47 KB)

Non DFS Used: 16331292188 (15.21 GB)

DFS Remaining: 22257164288 (20.73 GB)

DFS Used%: 0.00%

DFS Remaining%: 57.68%

Configured Cache Capacity: 0 (0 B)

Cache Used: 0 (0 B)

Cache Remaining: 0 (0 B)

Cache Used%: 100.00%

Cache Remaining%: 0.00%

Xceivers: 1

Last contact: Mon Mar 19 19:54:45 PDT 2018

Name: 192.168.48.132: (slave1)

Hostname: slave1

Decommission Status : Normal

Configured Capacity:  (18.70 GB)

DFS Used:  ( KB)

Non DFS Used:  (5.91 GB)

DFS Remaining:  (12.79 GB)

DFS Used%: 0.00%

DFS Remaining%: 68.41%

Configured Cache Capacity:  ( B)

Cache Used:  ( B)

Cache Remaining:  ( B)

Cache Used%: 100.00%

Cache Remaining%: 0.00%

Xceivers:

Last contact: Mon Mar  :: PDT

网页查看

弊端(来源网络)：首先NameNode将文件命名空间的状态保存在状态中，比如哪个文件块在哪个datanode上，由于在较大的hadoop集群中，会存在很多文件块，这样就会占用NameNode很大的内存，所以不会浪费NameNode的计算资源其次，对于长时间运行的集群来说，NameNode一致将命名空间的状态变化写入edits日志文件，时间久了该文件也会很大，只要将NameNode的存储规划的合理，是不会浪费存储的

hadoop集群重要的是保证namdenode的长期稳定运行，把datanode放在namenode上，增加了namenode的负担，datanode占用大量的磁盘io，网络流量可能导致hdfs响应慢，错误率增加，要进行大量错误恢复，这影响集群的稳定性。

至于namenode是否浪费资源，namenode要维护整个集群的（一，二级关系）一、目录树，文件元信息，二、块到数据节点的映射。对于一定规模的集群要消耗大量的内存，cpu资源。namenode还会把一级关系持久化到镜像文件中，并且用编辑日志保证数据被持久化。这也会占用大量的存储资源，同事，有大量的datanode节点，可能还有大量的客户端同namenode进行网络通信。综上，namenode资源并没浪费！

hadoop集群namenode同时挂datanode的更多相关文章

解决Hadoop集群hdfs无法启动DataNode的问题
问题描述: 在hadoop启动hdfs的之后,使用jps命令查看运行情况时发现hdfs的DataNode并没有打开. 笔者出现此情况前曾使用hdfs namenode -format格式化了hdfs ...
hadoop 集群 master datanode 没有启动
2018-02-07 02:47:50,377 WARN org.apache.hadoop.hdfs.server.common.Storage: java.io.IOException: Inco ...
Hadoop集群搭建（完全分布式版本） VMWARE虚拟机
Hadoop集群搭建(完全分布式版本) VMWARE虚拟机一.准备工作三台虚拟机:master.node1.node2 时间同步 ntpdate ntp.aliyun.com 调整时区 cp /u ...
关于hadoop集群下Datanode和Namenode无法访问的解决方案
HDFS架构 HDFS也是按照Master和Slave的结构,分namenode,secondarynamenode,datanode这几个角色. Namenode:是maseter节点,是大领导.管 ...
Hadoop集群datanode磁盘不均衡的解决方案
一.引言: Hadoop的HDFS集群非常容易出现机器与机器之间磁盘利用率不平衡的情况,比如集群中添加新的数据节点,节点与节点之间磁盘大小不一样等等.当hdfs出现不平衡状况的时候,将引发很多问题,比 ...
hadoop集群无法找到datanode节点问题解决
问题:在配置hadoop集群时,master的50070后台中找不到slave的datanode节点怎么办? 解决: 方法一:首先确认下master和slave的hdfs-site.xml配置中的df ...
Hadoop集群datanode磁盘不均衡的解决方案【转】
一.引言: Hadoop的HDFS集群非常容易出现机器与机器之间磁盘利用率不平衡的情况,比如集群中添加新的数据节点,节点与节点之间磁盘大小不一样等等.当hdfs出现不平衡状况的时候,将引发很多问题,比 ...
Apache Hadoop集群安装（NameNode HA + SPARK + 机架感知）
1.主机规划序号主机名 IP地址角色 1 nn-1 192.168.9.21 NameNode.mr-jobhistory.zookeeper.JournalNode 2 nn-2 ).HA的集 ...
Apache Hadoop集群安装（NameNode HA + YARN HA + SPARK + 机架感知）
1.主机规划序号主机名 IP地址角色 1 nn-1 192.168.9.21 NameNode.mr-jobhistory.zookeeper.JournalNode 2 nn-2 192.16 ...

随机推荐

python中pip和pygame的安装
1.安装pip和pygame都很简单.首先咱们来安装pip,官网https://pypi.python.org/pypi/pip#download,下载pip的压缩文件,并将其解压. 我们在cmd的p ...
nginx简单学习(tomcat)
一.负载均衡的简单配置 1.下载nginx 2.tomcat*2 配置不同的端口用于正常启动,在jsp中<%= session.getId()%>可以查看jSessionId,tomcat ...
ALGO-11_蓝桥杯_算法训练_瓷砖铺放(递归)
问题描述有一长度为N(<=N<=)的地板,给定两种不同瓷砖:一种长度为1,另一种长度为2,数目不限.要将这个长度为N的地板铺满,一共有多少种不同的铺法? 例如,长度为4的地面一共有如下5 ...
bzoj4183: tree
Description 自底向上模拟,原地操作以节省空间 #include<bits/stdc++.h> unsigned n,a,b,c,v[],mx,ans=; int main(){ ...
java高并发编程（五）线程池
摘自马士兵java并发编程一.认识Executor.ExecutorService.Callable.Executors /** * 认识Executor */ package yxxy.c_026 ...
HiveQL详解
Hive 是基于Hadoop 构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据,可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询 ...
Python写的链接数据库存取数据
Python写的链接数据库存取数据 #!/usr/bin/python # -*- coding: UTF-8 -*- from __future__ import print_function im ...
C语言强化——链表（2）
目录链表的应用: 栈循环队列 C语言实现动态数组数组实现定长元素个数层次建树队列实现不定元素个数层次建树 (*) 栈栈(链表应用) "stack.h" #include ...
Ubuntu14.04 下软件安装和卸载命令备记
一.Ubuntu中软件安装方法 1.APT方式 ()普通安装:apt-get install softname1 softname2 …; ()修复安装:apt-get -f install soft ...
STM32 f407 温湿度采集报警
软件 keil5 实现 1.使用stm32f407中的DS18B20传感器采集空气温度 2.使用stm32f407中的DHT11传感器采集空气的温度和湿度 3.显示到stm32f407的LCD液晶显示 ...