spark work目录处理 And HDFS空间都去哪了？

1、说在前面

过完今天就放假回家了（挺高兴），于是提前检查了下个服务集群的状况，一切良好。正在我想着回家的时候突然发现手机上一连串的告警，spark任务执行失败，spark空间不足。我的心突然颤抖了一下，于是赶紧去看服务器的磁盘容量：

#df -h

确实，还剩下6.8G，赶紧排查是什么占用了空间。发现hadoop、spark站的空间比较大，一个50多G（data）、一个30多G（spark-events）。不对啊，这也没占多少啊，于是登录到hadoop的webui去看资源的使用情况：

发现Non DFS Used的值很大，接下来就是名词解释时间：

Capacity：可用的总空间

Used：已用的空间

Non DFS Used：非hdfs文件占用dfs的空间（侵占）

Remaining：剩余可用空间

发现Non DFS Used的值都很大，证明有很多的非hdfs文件侵占了大量的dfs空间。可以看到其中有一个加点只剩6.03G了。这个总空间的大小默认就是磁盘的大小，不过hadoop有个磁盘的配置项dfs.datanode.du.reserved，这个配置是设置hadoop保留一部分不用于hdfs存储的空间默认是0。

2、好了，明白这个后，开始去排查到底是什么文件侵占了dfs的空间。看了一下服务器上面部署的服务，有spark、hadoop（hdfs）、presto，如果是对大数据相对熟悉的人第一判断应该是spark，首先想到的是spark work和spark-events，检查是否运行了history。简单科普一下，spark work存放的是一个spark work任务运行的依赖环境和日志输出，集群其他的节点都来这个地方拉取，spark-events存放的是运行日志，history web就是去的这里的数据。经检查发现是work，已经201G了。

使用spark standalone模式执行任务，每提交一次任务，在每个节点work目录下都会生成一个文件夹，命名规则app-20180212191730-0249。该文件夹下是任务提交时，各节点从主节点下载的程序所需要的资源文件。这些目录每次执行都会生成，且不会自动清理，执行任务过多会将内存撑爆。将历史没用的work目录下面的app目录删除：

3、解决方案

需要添加定时清理策略，只针对于standalong模式：

在spark-env.sh里面添加如下配置

export SPARK_WORKER_OPTS="

-Dspark.worker.cleanup.enabled=true

-Dspark.worker.cleanup.interval=1800

-Dspark.worker.cleanup.appDataTtl=3600"

注：

-Dspark.worker.cleanup.enabled=true：是否开启自动清理
-Dspark.worker.cleanup.interval=1800：清理周期，每隔多长时间清理一次，单位秒
-Dspark.worker.cleanup.appDataTtl=3600：保留最近多长时间的数据

参考：

https://spark.apache.org/docs/latest/spark-standalone.html

spark work目录处理 And HDFS空间都去哪了？的更多相关文章

du 命令，对文件和目录磁盘使用的空间的查看
Linux du命令也是查看使用空间的,但是与df命令不同的是Linux du命令是对文件和目录磁盘使用的空间的查看,还是和df命令有一些区别的. 1．命令格式: du [选项][文件] 2．命令功能 ...
hadoop进阶---hadoop性能优化(一)---hdfs空间不足的管理优化
Hadoop 空间不足,hive首先就会没法跑了,进度始终是0%. 将HDFS备份数降低将默认的备份数3设置为2. 步骤:CDH–>HDFS–>配置–>搜索dfs.replicat ...
Flume实时监控目录sink到hdfs，再用sparkStreaming监控hdfs的这个目录，对数据进行计算
目标:Flume实时监控目录sink到hdfs,再用sparkStreaming监控hdfs的这个目录,对数据进行计算 1.flume的配置,配置spoolDirSource_hdfsSink.pro ...
泛函p121可分Hilbert空间都同构于l^2
如何理解最后面两句话, L^2与l^2同构 L^2里面有理系数多项式是可数稠密子集所以L^2可分可分Hilbert空间都同构于 l^2 傅里叶级数是一个稠密的子集
du---是对文件和目录磁盘使用的空间查看
du命令也是查看使用空间的,但是与df命令不同的是Linux du命令是对文件和目录磁盘使用的空间的查看,还是和df命令有一些区别的. 语法 du [选项][文件] 选项 -a或-all 显示目录中个 ...
linux中root目录下下指定磁盘空间扩容
1 查看当前磁盘情况 fdisk -l /dev/sda1 2048 6143 2048 83 Linux /dev/sda2 * 6144 1054719 524288 83 Linux /dev/ ...
Redis内存——内存消耗(内存都去哪了？)
最新:Redis内存--三个重要的缓冲区最新:Redis内存--内存消耗(内存都去哪了?) 最新:Redis持久化--如何选择合适的持久化方式最新:Redis持久化--AOF日志更多文章... ...
MySQL 中删除的数据都去哪儿了？
不知道大家有没有想过下面这件事? 我们平时调用 DELETE 在 MySQL 中删除的数据都去哪儿了? 这还用问吗?当然是被删除了啊那么这里又有个新的问题了,如果在 InnoDB 下,多事务并发的情 ...
from表单上提交的数据都去了哪里呢？
from表单上提交的数据都去了哪里呢? 一个简单的from案例如下: <form> 姓名:<br> <input type="text" name=& ...

随机推荐

python常用算法题
一: #计算平均数,中位数和众数 #coding:utf-8 #计算平均数,中位数和众数 import random lst = [random.randint(0,10) for i in rang ...
3、利用GDB进行程序调试
本文将用一个实际例子讲解如何通过GDB进行程序调试. 首先,我们需要理解的是GDB是GNU开源组织发布的一个强大的UNIX下的程序调试工具,其产生和调试的目的是让调试者知道,程序在执行时内部发生了什么 ...
hdu 1541
因为y的输入是从小到大,所以不用考虑y坐标的问题只考虑x坐标就行还有个小细节就是0<=x,y,<=32000 x和y取0的时候树状数组处理不到 x++就行了 #include < ...
MySQL表名大小写设置
1 简介在MySQL中,数据库对应数据目录中的目录.数据库中的每个表至少对应数据库目录中的一个文件(也可能是多个,取决于存储引擎).因此,所使用操作系统的大小写敏感性决定了数据库名和表名的大小 ...
MVVM Light 新手入门（1）：准备阶段
1.新建WPF空白项目. 2.NuGet 程序包中安装 3.根据MVVM分层结构,建立包含Model.View.ViewModel三层文件夹如图: 1.View负责前端展示,与ViewModel进行 ...
appium精简教程
环境配置 package appium; import io.appium.java_client.android.*; import java.io.File; import java.io.IOE ...
MariaDB 用户与权限管理(12)
MariaDB数据库管理系统是MySQL的一个分支,主要由开源社区在维护,采用GPL授权许可MariaDB的目的是完全兼容MySQL,包括API和命令行,MySQL由于现在闭源了,而能轻松成为MySQ ...
[Ynoi2015]此时此刻的光辉（莫队）
一道神题...自己写出来以后被卡常了...荣获洛谷最差解... 思路还是比较好想,对于每个数 \(\sqrt{n}\) 分块,对于 \(\sqrt{n}\) 以内的数,我们可以直接求出来.对于 \(\ ...
BitArray源码解析
BitArray是C# System.Collections内置的集合,用于帮助进行位运算. BitArray的使用示例 // 创建两个大小为 8 的点阵列 BitArray ba1 = new Bi ...
【Anaconda】：科学计算的Python发行版
[背景] Python易用,但包管理和Python不同版本的问题比较头疼,特别是当你使用Windows的时候.为了解决这些问题,有不少发行版的Python,比如WinPython.Anaconda等, ...

spark work目录处理 And HDFS空间都去哪了？

spark work目录处理 And HDFS空间都去哪了？的更多相关文章

随机推荐

热门专题