记录一次深夜救火：datanode.data.dir

火灾背景：

Hadoop集群，4个节点，每一台配置都不一样

火灾现场：

1.突然发现DN4硬盘报警，检查硬盘，发现挂载如下：

/home 200GB

/home/data 3TB

然后发现datanode.data.dir=/home/data1，/home/data2，/home/data3，/home/data4，/home/data5

所以问题出来了：硬盘挂载和DataNode.dir不一致，空间浪费了，反而把/home撑爆了。

2.还有个现象：DN4数据盘挂载点是/home/data，DN2和DN3的挂载点是/home/data1

这个还不一致，为了datanode.data.dir配置一致，这个也需要解决

解决问题的考量：

1.如何保证HDFS现有数据不丢失？

想了好几种方法，都有一定概率造成datanode需要重装，那么数据如何保留？

因此第一步开始备份数据，找了个硬盘大的目录，直接将全部数据get到本地。（超慢，300GB数据用了近2小时）

2.如何保证DN2，DN3，DN4的硬盘挂载都用上，不浪费？

DN2的挂载：

/home 600GB

/home/data1 4TB

/home/data2 11TB

/home/data3 11TB

DN3的挂载：

/home 600GB

/home/data1 6TB

DN4的挂载：

/home 200GB

/home/data 2TB

存在几个问题：

1）DN4的挂载点是/home/data，和其他的/home/data1不一致

2）DN2的/home/data2，/home/data3如何不浪费？

因此使用了下面的方法：

DN2：在/home/data2中:

\cp -rp /home/data4 /home/data2/data4，rm -rf /home/data4，ln -s /home/data2/data4 /home/data4

\cp -rp /home/data5 /home/data3/data5，rm -rf /home/data5，ln -s /home/data3/data5 /home/data5

在DN3中：

\cp -rp /home/data2 /home/data1/data2，rm -rf /home/data2，ln -s /home/data1/data2 /home/data2

\cp -rp /home/data3 /home/data1/data3，rm -rf /home/data3，ln -s /home/data1/data3 /home/data3

\cp -rp /home/data4 /home/data1/data4，rm -rf /home/data4，ln -s /home/data1/data4 /home/data4

\cp -rp /home/data5 /home/data1/data5，rm -rf /home/data4，ln -s /home/data1/data5 /home/data5

在DN4中：

\cp -rp /home/data1 /home/data/data1，rm -rf /home/data1，ln -s /home/data/data1 /home/data1

\cp -rp /home/data2 /home/data/data2，rm -rf /home/data2，ln -s /home/data/data2 /home/data2

\cp -rp /home/data3 /home/data/data3，rm -rf /home/data3，ln -s /home/data/data3 /home/data3

\cp -rp /home/data4 /home/data/data4，rm -rf /home/data4，ln -s /home/data/data4 /home/data4

\cp -rp /home/data5 /home/data/data5，rm -rf /home/data5，ln -s /home/data/data5 /home/data5

3.datanode.data.dir配置到底应该怎么配？

目前datanode.data.dir=/home/data1，/home/data2，/home/data3，/home/data4，/home/data5

在完成了上面的软链接后，其实能发现这里已经不需要改了

总结注意事项：

1.进行本地目录软链接前，关闭集群服务，否则会出现找不到目录引起各种报错

2.拷贝目录其实可以换成mv，反而更方便。cp命令使用时，必须带p参数，保存属性，避免权限出错。

3.胆大心细，有了数据备份，最差就重装，有想法先实践

记录一次深夜救火：datanode.data.dir的更多相关文章

Hadoop Datanode节点无法启动（All directories in dfs.data.dir are invalid）
Hadoop Datanode节点无法启动(All directories in dfs.data.dir are invalid) java.io.IOException: All director ...
hadoop datanode启动失败（All directories in dfs.data.dir are invalid）
由于hadoop节点的磁盘满了,导致节点死掉,今天对其进行扩容.首先,将原节点的数据拷贝到目标节点下,从而避免数据的丢失,但是在执行hadoop_daemon.sh start datanode后没有 ...
HDFS读写数据块--${dfs.data.dir}选择策略
最近工作需要,看了HDFS读写数据块这部分.不过可能跟网上大部分帖子不一样,本文主要写了${dfs.data.dir}的选择策略,也就是block在DataNode上的放置策略.我主要是从我们工作需要 ...
How to change data dir of mysql?
# 1 copy orgin data dir of mysql to new one cp -R /var/lib/mysql /mysqldata chown mysql:mysql -R /my ...
cassandra删除所有数据，重置为初始状态——删除<data dir>/data/* <data dir>/commitlog/* <data dir>/saved_caches/* 重启cassandra即可
Are you looking for a method other than drop keyspace? Okay based on your clarification... I would s ...
记录一下我做Udacity 的Data Scientist Nano Degree Project
做项目的时候看了别人的blog,决定自己也随手记录下在做项目中遇到的好的小知识点. 最近在做Udacity的Data Scientist Nano Degree Project的Customer_Se ...
hbase centOS生产环境配置笔记 (1 NameNode, 1 ResourceManager, 3 DataNode)
本次是第一次在生产环境部署HBase,本文若有配置上的不妥之处还请高手指正. hadoop版本:hadoop-2.4.1 HBase版本:hbase-0.98.6.1-hadoop2 Zookeepe ...
懒人记录 Hadoop2.7.1 集群搭建过程
懒人记录 Hadoop2.7.1 集群搭建过程 2016-07-02 13:15:45 总结除了配置hosts ,和免密码互连之外,先在一台机器上装好所有东西配置好之后,拷贝虚拟机,配置hosts ...
hadoop中datanode无法启动
一.问题描述当我多次格式化文件系统时,如 [hadoop@xsh hadoop]$ ./bin/hdfs namenode -format 会出现datanode无法启动,查看日志(/usr/loc ...

随机推荐

网速测试脚本speedtest_cli的安装与使用
speedtest_cli的安装与使用 1.下载 wget https://raw.github.com/sivel/speedtest-cli/master/speedtest.py 图 1 2.授 ...
信用评分卡 (part 2of 7)
python信用评分卡(附代码,博主录制) https://study.163.com/course/introduction.htm?courseId=1005214003&utm_camp ...
【.net】The source was not found, but some or all event logs could not be searched
1.案发现场: 注册服务的时候 2.解决方案: 用管理员身份运行CMD,再注册服务: I had to run Command Prompt with Administrator Rights.
Mark标记功能的实现（像手工标记的一样）
今天看到一个网站的标记功能,觉得很不错,先记录一下,emm <!DOCTYPE html> <html lang="en"> <head> &l ...
Hadoop记录-Hadoop集群添加节点和删除节点
1.添加节点 A:新节点中添加账户,设置无密码登陆 B:Name节点中设置到新节点的无密码登陆 C:在Name节点slaves文件中添加新节点 D:在所有节点/etc/hosts文件中增加新节点(所有 ...
TPS和QPS的区别和理解【转】
QPS:Queries Per Second意思是“每秒查询率”,是一台服务器每秒能够相应的查询次数,是对一个特定的查询服务器在规定时间内所处理流量多少的衡量标准. TPS:是Transactions ...
idea整合SVN以及SVN的使用
idea整合SVN以及SVN的使用: 1:下载插件: 运行并安装: 安装后的目录: 2-1 打开bin目录 :复制svn.exe的文件路径: 2:打开IDEA的File-->setting: o ...
U盘中毒后变为快捷方式的解决方法
今天神奇地发现,如果U盘中毒后,变为快捷方式,那么你可以有三种解决方法: (1)在网上下一个脚本程序,将文件恢复: (2)使用U盘查杀的工具,一般的工具应该有U盘文件恢复这一项,比如金山的杀毒软件: ...
vue中element-ui树形控件自定义节点，注意一下
在项目中用到菜单项编辑删除,在 element-ui自定义节点内容时, 有说明:使用render-content指定渲染函数, 得环境支持 JSX 语法,只要正确地配置了相关依赖,就可以正常运行. 一 ...
linux关闭防火墙及开放端口
1) 重启后生效开启: chkconfig iptables on 关闭: chkconfig iptables off 2) 即时生效,重启后失效开启: service iptables sta ...

记录 一次深夜救火：datanode.data.dir

记录 一次深夜救火：datanode.data.dir的更多相关文章

随机推荐

热门专题

记录一次深夜救火：datanode.data.dir

记录一次深夜救火：datanode.data.dir的更多相关文章