1、背景

当我们的hadoop集群运行了一段时间之后，原有的数据节点的容量已经不能满足我们的存储了，这个时候就需要往集群中增加新的数据节点。此时我们就需要动态的对hdfs集群进行扩容操作(节点服役)。

2、集群黑白名单

在hdfs集群中是存在黑名单和白名单的。

黑名单： 该文件包含不允许连接到namenode的主机列表。必须指定文件的完整路径名。如果该值为空，则表示不排除任何主机。

白名单： 该文件包含允许连接到namenode的主机列表。必须指定文件的完整路径名。如果该值为空，则允许所有主机

黑白名单配置

vim hdfs-site.xml

<!-- 配置黑名单，使用黑名单可以下线集群  -->

<property>

    <name>dfs.hosts.exclude</name>

    <value>/opt/bigdata/hadoop-3.3.4/etc/hadoop/blacklist.hosts</value>

</property>

<!-- 配置白名单，只有白名单中的节点才可以访问namenode  -->

<property>

    <name>dfs.hosts</name>

    <value>/opt/bigdata/hadoop-3.3.4/etc/hadoop/whitelist.hosts</value>

</property>

注意： 第一次配置黑白名单时，需要重启集群才可以生效，之后修改了黑白名单文件，只需要执行 hdfs dfsadmin -refreshNodes命令即可。

3、准备一台新的机器并配置好hadoop环境

3.1 我们现有的集群规划

参考此文章的集群搭建

3.2 准备一台新的机器

ip地址： 192.168.121.143
主机名： hadoop04

3.2.1 查看新机器的ip

3.2.2 修改主机名和host映射

[root@appbasic ~]# vim /etc/hostname

[root@appbasic ~]# cat /etc/hostname

hadoop04

[root@appbasic ~]# vim /etc/hosts

[root@appbasic ~]# cat /etc/hosts

192.168.121.140 hadoop01

192.168.121.141 hadoop02

192.168.121.142 hadoop03

192.168.121.143 hadoop04

[root@appbasic ~]#

3.2.3 配置时间同步

hadoop集群中的各个机器之间的时间最好都保持一致

[root@hadoop04 ~]# ln -sf /usr/share/zoneinfo/Asia/Shanghai /etc/localtime

[root@hadoop04 ~]# yum install ntp

已加载插件：fastestmirror

Loading mirror speeds from cached hostfile

base                                                                                                                                                                                           | 3.6 kB  00:00:00

extras                                                                                                                                                                                         | 2.9 kB  00:00:00

updates                                                                                                                                                                                        | 2.9 kB  00:00:00

(1/2): extras/7/aarch64/primary_db                                                                                                                                                             | 252 kB  00:00:00

(2/2): updates/7/aarch64/primary_db                                                                                                                                                            | 3.5 MB  00:00:03

软件包 ntp-4.2.6p5-29.el7.centos.2.aarch64 已安装并且是最新版本

无须任何处理

[root@hadoop04 ~]# systemctl enable ntpd

[root@hadoop04 ~]# service ntpd restart

Redirecting to /bin/systemctl restart ntpd.service

[root@hadoop04 ~]# ntpdate asia.pool.ntp.org

29 Mar 21:42:52 ntpdate[1697]: the NTP socket is in use, exiting

[root@hadoop04 ~]# /sbin/hwclock --systohc

[root@hadoop04 ~]# timedatectl

      Local time: 三 2023-03-29 21:43:03 CST

  Universal time: 三 2023-03-29 13:43:03 UTC

        RTC time: 三 2023-03-29 13:43:03

       Time zone: Asia/Shanghai (CST, +0800)

     NTP enabled: yes

NTP synchronized: no

 RTC in local TZ: no

      DST active: n/a

[root@hadoop04 ~]# timedatectl set-ntp true

[root@hadoop04 ~]#

3.2.4 关闭防火墙

[root@hadoop04 ~]# systemctl stop firewalld

systemctl stop firewalld

[root@hadoop04 ~]# systemctl disable firewalld.service

Removed symlink /etc/systemd/system/multi-user.target.wants/firewalld.service.

Removed symlink /etc/systemd/system/dbus-org.fedoraproject.FirewallD1.service.

[root@hadoop04 ~]#

3.2.5 新建hadoop部署用户

[root@hadoop04 ~]# useradd hadoopdeploy

[root@hadoop04 ~]# passwd hadoopdeploy

更改用户 hadoopdeploy 的密码 。

新的 密码：

无效的密码： 密码包含用户名在某些地方

重新输入新的 密码：

passwd：所有的身份验证令牌已经成功更新。

[root@hadoop04 ~]# vim /etc/sudoers

[root@hadoop04 ~]# cat /etc/sudoers | grep hadoopdeploy -C 3

## Same thing without a password

# %wheel	ALL=(ALL)	NOPASSWD: ALL

hadoopdeploy    ALL=(ALL)       NOPASSWD: ALL

## Allows members of the users group to mount and unmount the

## cdrom as root

[root@hadoop04 ~]#

3.2.6 复制hadoop04机器上的/etc/hosts文件到集群的另外3台机器上

[root@hadoop04 ~]# scp /etc/hosts root@hadoop01:/etc/hosts

[root@hadoop04 ~]# scp /etc/hosts root@hadoop02:/etc/hosts

[root@hadoop04 ~]# scp /etc/hosts root@hadoop03:/etc/hosts

3.2.7 配置集群间的免密登录

此处配置 namenode(hadoop01)与hadoop04之间的免密登录。

[hadoopdeploy@hadoop01 ~]$ ssh-copy-id hadoop04

/usr/bin/ssh-copy-id: INFO: Source of key(s) to be installed: "/home/hadoopdeploy/.ssh/id_rsa.pub"

The authenticity of host 'hadoop04 (192.168.121.143)' can't be established.

ECDSA key fingerprint is SHA256:4GL0zHVCdSl3czA0wqcuLT60lUljyEq3DqwPFxNwYsE.

ECDSA key fingerprint is MD5:3e:42:a6:50:0d:fb:f0:41:a8:0d:fb:cc:fd:20:2c:c8.

Are you sure you want to continue connecting (yes/no)? yes

/usr/bin/ssh-copy-id: INFO: attempting to log in with the new key(s), to filter out any that are already installed

/usr/bin/ssh-copy-id: INFO: 1 key(s) remain to be installed -- if you are prompted now it is to install the new keys

hadoopdeploy@hadoop04's password:

Number of key(s) added: 1

Now try logging into the machine, with:   "ssh 'hadoop04'"

and check to make sure that only the key(s) you wanted were added.

[hadoopdeploy@hadoop01 ~]$

3.2.8将 namenode上的hadoop复制到hadoop04上

[root@hadoop04 ~]# sudo mkdir /opt/bigdata

mkdir: cannot create directory ‘/opt/bigdata’: No such file or directory

[root@hadoop04 ~]# sudo mkdir -p /opt/bigdata

[root@hadoop04 ~]# sudo chown -R hadoopdeploy:hadoopdeploy /opt/bigdata/

[root@hadoop04 ~]# su - hadoopdeploy

Last login: Wed Mar 29 22:19:54 CST 2023 on pts/0

[hadoopdeploy@hadoop04 ~]$ scp -r  hadoopdeploy@hadoop01:/opt/bigdata/hadoop-3.3.4/ /opt/bigdata/

[hadoopdeploy@hadoop04 hadoop]$ rm -rvf /opt/bigdata/hadoop-3.3.4/data/* rm -rvf /opt/bigdata/hadoop-3.3.4/logs/*

注意 目录的创建用户、执行scp命令的用户

注意： 如果hadoop-3.3.4目录下存在我们之前配置的数据目录，则需要删除，否则启动这个节点的时候会有问题。日志目录也相应的删除

3.2.9 配置 workers文件

配置这个文件是为了方便集群的一键启动。

[hadoopdeploy@hadoop04 hadoop]$ vim /opt/bigdata/hadoop-3.3.4/etc/hadoop/workers

[hadoopdeploy@hadoop04 hadoop]$ cat /opt/bigdata/hadoop-3.3.4/etc/hadoop/workers

hadoop01

hadoop02

hadoop03

hadoop04

[hadoopdeploy@hadoop04 hadoop]$

注意： 将这个workers文件分发到集群的各个机器上。

[hadoopdeploy@hadoop04 hadoop]$ scp /opt/bigdata/hadoop-3.3.4/etc/hadoop/workers hadoopdeploy@hadoop01:/opt/bigdata/hadoop-3.3.4/etc/hadoop/workers

[hadoopdeploy@hadoop04 hadoop]$ scp /opt/bigdata/hadoop-3.3.4/etc/hadoop/workers hadoopdeploy@hadoop02:/opt/bigdata/hadoop-3.3.4/etc/hadoop/workers

[hadoopdeploy@hadoop04 hadoop]$ scp /opt/bigdata/hadoop-3.3.4/etc/hadoop/workers hadoopdeploy@hadoop03:/opt/bigdata/hadoop-3.3.4/etc/hadoop/workers

3.2.10 配置环境变量

[hadoopdeploy@hadoop04 hadoop]$ source /etc/profile

3.2.11 查看之前集群的节点

3.3 启动新加入的namenode

[hadoopdeploy@hadoop04 logs]$ hdfs --daemon start datanode

[hadoopdeploy@hadoop04 logs]$ jps

2278 DataNode

2349 Jps

[hadoopdeploy@hadoop04 logs]$

注意： 如果我们不想让任意一台机器随便就加入到了我们的集群中，那么我们通过白名单来控制。

3.3.1 节点之间的数据平衡

新加入的节点磁盘空间比较大，这个时候我们就可以将别的节点的数据均衡到这个节点中来。

# 设置数据传输带宽

[hadoopdeploy@hadoop04 logs]$ hdfs dfsadmin  -setBalancerBandwidth 10485760

Balancer bandwidth is set to 10485760

# 执行banalce

[hadoopdeploy@hadoop04 logs]$ hdfs balancer -policy datanode -threshold 5

3.4 集群节点下线

3.4.1 编辑dfs.hosts.exclude配置指定的文件

注意： 只需要在NameNode或者ResourceManager上执行即可。

vim hdfs-site.xml

<!-- 配置黑名单，使用黑名单可以下线集群  -->

<property>

    <name>dfs.hosts.exclude</name>

    <value>/opt/bigdata/hadoop-3.3.4/etc/hadoop/blacklist.hosts</value>

</property>

注意： 这个配置文件如果之间没有配置过，则需要重启集群才生效，如果之前配置过，则在NameNode或ResourceManager节点上执行hdfs dfsadmin -refreshNodes命令即可。

3.4.2 下线节点

编辑blacklist.hosts文件，加入需要下线的节点。（NameNode或ResourceManager上操作 ）

[hadoopdeploy@hadoop01 ~]$ cd /opt/bigdata/hadoop-3.3.4/etc/hadoop/

[hadoopdeploy@hadoop01 hadoop]$ vim blacklist.hosts

[hadoopdeploy@hadoop01 hadoop]$ cat blacklist.hosts

hadoop04

[hadoopdeploy@hadoop01 hadoop]$ hdfs dfsadmin -refreshNodes

Refresh nodes successful

[hadoopdeploy@hadoop01 hadoop]$

在hdfs集群上可以看到hadoop04已经下线了.

节点移除后，可以考虑再次均衡集群中的数据。

注意： 此时可以看到我们的集群中有4台机器，假设我们集群的副本设置为4，那么此时是不可下线节点的，需要修改集群的副本<4。

3.4.3 关闭下线的datanode节点

[hadoopdeploy@hadoop04 logs]$ hdfs --daemon stop datanode

[hadoopdeploy@hadoop04 logs]$

3.4.4 清空黑名单里的内容

hdfs集群的扩容和缩容的更多相关文章

Redis Cluster 自动化安装，扩容和缩容
Redis Cluster 自动化安装,扩容和缩容之前写过一篇基于python的redis集群自动化安装的实现,基于纯命令的集群实现还是相当繁琐的,因此官方提供了redis-trib.rb这个工具虽 ...
生产调优4 HDFS-集群扩容及缩容(含服务器间数据均衡)
目录 HDFS-集群扩容及缩容添加白名单配置白名单的步骤二次配置白名单增加新服务器需求环境准备服役新节点具体步骤问题1 服务器间数据均衡问题2 105是怎么关联到集群的服务器间数据 ...
Kubernetes 笔记 012 Pod 的自动扩容与缩容
本文首发于我的公众号 Linux云计算网络(id: cloud_dev),专注于干货分享,号内有 10T 书籍和视频资源,后台回复「1024」即可领取,欢迎大家关注,二维码文末可以扫. Hi,大家好, ...
Kubernetes 笔记 11 Pod 扩容与缩容双十一前后的忙碌
本文首发于我的公众号 Linux云计算网络(id: cloud_dev),专注于干货分享,号内有 10T 书籍和视频资源,后台回复「1024」即可领取,欢迎大家关注,二维码文末可以扫. Hi,大家好, ...
HDFS集群balance（2）-- 架构概览
转载请注明博客地址:http://blog.csdn.net/suileisl HDFS集群balance,对应版本balance design 6 如需word版本,请QQ522173163联系索要 ...
HDFS集群balance（3）-- 架构细节
转载请注明博客地址:http://blog.csdn.net/suileisl HDFS集群balance,对应版本balance design 6 如需word版本,请QQ522173163联系索要 ...
HDFS集群balance（4）-- 测试计划
转载请注明博客地址:http://blog.csdn.net/suileisl HDFS集群balance,对应版本balance design 6 如需word版本,请QQ522173163联系索要 ...
在不同版本号hdfs集群之间转移数据
在不同版本号hdfs集群之间转移数据最简单的办法就是把src集群的数据导到本地,然后起还有一个进程将本地数据传到des集群上去. 只是这有几个问题: 效率减少占用本地磁盘空间不能应付实时 ...
Hadoop（四）HDFS集群详解
前言前面几篇简单介绍了什么是大数据和Hadoop,也说了怎么搭建最简单的伪分布式和全分布式的hadoop集群.接下来这篇我详细的分享一下HDFS. HDFS前言: 设计思想:(分而治之)将大文件.大 ...
Hadoop（五）搭建Hadoop与Java访问HDFS集群
前言上一篇详细介绍了HDFS集群,还有操作HDFS集群的一些命令,常用的命令: hdfs dfs -ls xxx hdfs dfs -mkdir -p /xxx/xxx hdfs dfs -cat ...

随机推荐

bquote
在Linux环境下,按"·"(1左边的按钮)会进入bquote模式退出方法按 Ctrl + C 其它(待补充)
C#实现统一登录（SSO）
SSO的基本概念 SSO英文全称Single Sign On(单点登录).SSO是在多个应用系统中,用户只需要登录一次就可以访问所有相互信任的应用系统.它包括可以将这次主要的登录映射到其他应用中用于同 ...
面向对象ooDay9
精华笔记: 多态:多种形态同一个对象被造型为不同的类型时,有不同的功能-------所有对象都是多态的(明天总结详细讲) 对象的多态:水.我.你...... 同一类型的引用在指向不同的对象时,有不同 ...
Mac Idea2018.1.6版利用脚本激活安装详解
下载安装包:链接: https://pan.baidu.com/s/1W4alLXUeQ6xazkNEtB8I9w 提取码: w6rg 下载脚本:链接: https://pan.baidu.com/s ...
Android 自定义View (二)
一.前言上节通过一个简单的旋转环对自定义view作了一个基本的认识,本文将大致讲解下实现的思路以及对该view的一些可能的改进. 二.思路主要通过重写 view 中的 onDraw() 方法,利 ...
复杂数据类型(signal)的解读-C语言基础
这一篇文章要探讨的是C语言中复杂数据类型的解读.涉及到signal()函数数据类型的解读(并不解释signal()的作用)以及对于数据类型的理解,属于C语言基础篇. 在开始解读signal()这种复杂 ...
2020/03/23--Diary
各位好! 我是R0ther,一位初学编程的学生.目前所学习到的有Java,C#,Winform,SQL-Server,H5,CSS3的一些基础知识,掌握一些Ae,Pr,Ps的基础应用. 虽然是大专文凭 ...
一、Basic CSS 知识整理
一.编写CSS的几种方式 <style> /* id选择器 */ #id_test { color: red; } /* 标签选择器 */ h2 { color: blue !import ...
持续集成环境(2)-Jenkins插件管理
Jenkins本身不提供很多功能,我们可以通过使用插件来满足我们的使用.例如从Gitlab拉取代码,使用 Maven构建项目等功能需要依靠插件完成.接下来演示如何下载插件. 修改Jenkins插件下载 ...
使用ASP.NET Core开发信息采集系统将用户数据添加至企业微信
一.启动Visual Studio 2019,创建ASP.NET Core Web应用程序二.在Models文件夹添加新项 Person.cs using System.ComponentModel ...

hdfs集群的扩容和缩容