一、datanode添加新节点

1.在dfs.include文件中包含新节点名称,该文件在名称节点的本地目录下

[白名单] [/app/hadoop/etc/hadoop/dfs.include]

2.在hdfs-site.xml文件中添加属性

<property>
    <name>dfs.hosts</name>
    <value>/app/hadoop/etc/dfs.include.txt</value>
</property>

3.在nn上刷新节点

hdfs dfsadmin -refreshNodes

4.在slaves文件中添加新节点ip(主机名)

5.单独启动新节点中的datanode

hadoop-daemon.sh start datanode

二、datanode退役旧节点

1.添加退役节点的ip到黑名单 dfs.hosts.exclude,不要更新白名单

[/app/hadoop/etc/dfs.hosts.exclude]

2.配置hdfs-site.xml

<property>
  <name>dfs.hosts.exclude</name>
  <value>/app/hadoop/etc/dfs.hosts.exclude.txt</value>
</property>

3.刷新nn的节点

hdfs dfsadmin -refreshNodes

4.查看WEBUI,节点状态在Decommission  In Progress

5.当所有的要退役的节点都报告为Decommissioned,数据转移工作已经完成

6.从白名单删除节点,并刷新节点

hdfs dfsadmin -refreshNodes

yarn rmadmin -refreshNodes

7.从slaves文件中删除退役的节点

8.hdfs-site.xml文件内容

<property>
   <name>dfs.hosts.exclude</name>
   <value>/soft/hadoop/etc/dfs.hosts.exclude.txt</value>
</property>
三、yarn添加新节点

1.在dfs.include文件中包含新节点名称,该文件在名称节点的本地目录下

[白名单]

[/app/hadoop/etc/hadoop/dfs.include]

2.在yarn-site.xml文件中添加属性

<property>
  <name>yarn.resourcemanager.nodes.include-path</name>
  <value>/soft/hadoop/etc/dfs.include.txt</value>
</property>

3.在rm上刷新节点

yarn rmadmin-refreshNodes

4.在slaves文件中添加新节点ip(主机名)

5.单独启动新节点中的资源管理器

yarn-daemon.sh start nodemanager

六、yarn退役新节点

1.添加退役节点的ip到黑名单 dfs.hosts.exclude,不要更新白名单

[/soft/hadoop/etc/dfs.hosts.exclude]

2.配置yarn-site.xml

<property>

<name>yarn-resourcemanager.nodes.exclude-path</name>

<value>/soft/hadoop/etc/dfs.hosts.exclude.txt</value>

</property>

3.刷新rm的节点

yarn rmadmin -refreshNodes

4.查看WEBUI,节点状态在Decommission  In Progress

5.当所有的要退役的节点都报告为Decommissioned,数据转移工作已经完成

6.从白名单删除节点,并刷新节点

yarn rmadmin -refreshNodes

7.从slaves文件中删除退役的节点

 

Hadoop记录-退役的更多相关文章

  1. hadoop记录-Hadoop参数汇总

    Hadoop参数汇总 linux参数 以下参数最好优化一下: 文件描述符ulimit -n 用户最大进程 nproc (hbase需要 hbse book) 关闭swap分区 设置合理的预读取缓冲区 ...

  2. Hadoop记录-hdfs转载

    Hadoop 存档 每个文件均按块存储,每个块的元数据存储在namenode的内存中,因此hadoop存储小文件会非常低效.因为大量的小文件会耗尽namenode中的大部分内存.但注意,存储小文件所需 ...

  3. hadoop记录-hive常见设置

    分区表 set hive.exec.dynamic.partition=true; set hive.exec.dynamic.partition.mode=nonstrict;create tabl ...

  4. Hadoop记录-日常运维操作

    1.Active NameNode hang死,未自动切换 #登录当前hang死 Active namenode主机,停止Namenode,触发自动切换.hadoop-daemon.sh stop n ...

  5. Hadoop记录-hadoop2.x常用端口及定义方法

    Hadoop集群的各部分一般都会使用到多个端口,有些是daemon之间进行交互之用,有些是用于RPC访问以及HTTP访问.而随着Hadoop周边组件的增多,完全记不住哪个端口对应哪个应用,特收集记录如 ...

  6. Hadoop记录-Hadoop NameNode 高可用 (High Availability) 实现解析

    Hadoop NameNode 高可用 (High Availability) 实现解析   NameNode 高可用整体架构概述 在 Hadoop 1.0 时代,Hadoop 的两大核心组件 HDF ...

  7. Hadoop记录-MRv2(Yarn)运行机制

    1.MRv2结构—Yarn模式运行机制 Client---客户端提交任务 ResourceManager---资源管理 ---Scheduler调度器-资源分配Containers ----在Yarn ...

  8. Hadoop记录-hadoop介绍

    1.hadoop是什么? Hadoop 是Apache基金会下一个开源的大数据分布式计算平台,它以分布式文件系统HDFS和MapReduce算法为核心,为用户提供了系统底层细节透明的分布式基础架构. ...

  9. hadoop在线退役datanode

    退役dn2echo "dn2" >>excludes echo "dn2" >>yarn-excludes sh refresh-nam ...

随机推荐

  1. jQuery中 对标签元素操作(2)

    一.属性操作 1.获取属性和设置属性 例如下jQuery代码: var $para=$("p");           //获取<p>节点 var p_txt=$par ...

  2. Java之IO流进阶篇:内存流,打印流,对象流

    Java中的IO流,即为输入输出流.所谓输入输出流,都是相对于程序而言,程序就是这个参照物.一张图看懂输入输出流: 输入流抽象基类:InputStream,Reader 输出流抽象基类:OutputS ...

  3. Scrapy案例02-腾讯招聘信息爬取

    目录 1. 目标 2. 网站结构分析 3. 编写爬虫程序 3.1. 配置需要爬取的目标变量 3.2. 写爬虫文件scrapy 3.3. 编写yield需要的管道文件 3.4. setting中配置请求 ...

  4. Python开发【第五篇】内置函数

    abs() 函数返回数字的绝对值 __author__ = "Tang" a = -30 all() 函数用于判断给定的可迭代参数iterable中的所有元素是否都为True,如果 ...

  5. SQL UCASE() 函数

    UCASE() 函数 UCASE 函数把字段的值转换为大写. SQL UCASE() 语法 SELECT UCASE(column_name) FROM table_name SQL UCASE() ...

  6. CentOS 7 软件安装简记

    Install SW Record ================= $ sudo yum install vim-X11.x86_64 $ sudo yum install clang.x86_6 ...

  7. MySQL数据库事务及其特性

    一.事务概念 事务就是一个程序执行单元,里面的操作要么都做,要么都不做. 二.事务特性 事务有四个非常重要的特性(ACID): 原子性(Atomicity):事务是不可分割的整体,所有操作要么全做,要 ...

  8. Windows安装Git

    一.安装Git for Windows(又名msysgit)  下载地址: https://git-for-windows.github.io/  在官方下载完后,安装到Windows Explore ...

  9. 理解MySQL数据库事务

    1. 什么是事务处理? 事务处理是一种机制,它是用来管理必须成批执行的mysql操作.来保证数据库不完整的操作结果. 2. 为什么要使用事务处理? 在使用mysql操作数据的过程中,如果只是简单的中小 ...

  10. 移动端无限滚动 TScroll.vue组件

    // 先看使用TScroll.vue的几个demo 1.https://sorrowx.github.io/TScroll/#/ 2. https://sorrowx.github.io/TScrol ...