近期集群空间有点紧张,总是操心空间不足而崩溃,近期扩容又不太现实,经与集群用户沟通发现:集群上存储了非常多没用的历史数据,能够删除,这样就能够通过一个crontab脚本每天生成集群空间使用报告,当使用量超过70%、80%是分别报警,并通知那些用户占用空间较大,预留当机冗余空间,这样就不须要时刻操心集群空间爆满了。

[hdfs@hanagios48 root]$ more  /home/hdfs/dfsadmin_report.sh 

#!/bin/bash

source ~/.bash_profile



today=$(date +%Y%m%d)

#report=`hadoop dfsadmin -report|head -n 11`



report=/tmp/report

echo "Hi,各位集群用户

   当Hadoop集群空间使用量达到70%时,各位将会收到Warning邮件,提示清理空间;

   当Hadoop集群空间使用量到达80%时,各位将会收到Critical邮件,   提示清理空间;

为保证集群数据安全,预留down机冗余空间,请各位务必清理,如因数据量确实巨大,集群无法容纳,请及时告知运维进行扩容,谢谢!">$report

echo >>$report

hadoop dfsadmin -report|head -n 11 >>$report



echo ----------------------       >>$report

echo dfs used details:      >>$report

hadoop fs -du /                  >>$report

echo                                    >>$report

hadoop fs -du /user         >>$report





dfs_used_percent=`cat $report|grep "DFS Used%"|awk -F: '{print $2}'`

dfs_used=`echo ${dfs_used_percent}|awk -F% '{print $1}'`





# 百分百小数比較

#expr ${dfs_used} \>\= 80



user=laijingli2006@126.com

title=`echo "${today}[${dfs_used_percent}] WBY Hadoop Cluster Hdfs Useage Report: dfs_used ${dfs_used_percent}"`

echo $title





if [ $(expr ${dfs_used} \>\= 80) = 1 ];then

 echo dfs_used  80

 #cat $report|mail -s "Critical: $title" $user

  cat $report|/usr/bin/mutt  -s  "Critical: $title" $user



elif [ $(expr ${dfs_used} \>\= 70) = 1 ];then

 echo 70

 #cat $report|mail -s "Warning: $title" $user

 cat $report|/usr/bin/mutt  -s "Warning: $title" $user



else

 echo 60

 #cat $report|mail -s "Normal: $title" $user

 #cat $report|/usr/bin/mutt  -s "Normal: $title" $user

fi



#cat $report|mail -s $today DfsReport: dfs_used ${dfs_used_percent}  362560701@qq.com

crontab运行效果还不错:

[hdfs@hanagios48 root]$ crontab -l

05 8 * * * /home/hdfs/dfsadmin_report.sh

[hdfs@hanagios48 root]$ more /tmp/report                                      

Hi,各位集群用户

   当Hadoop集群空间使用量达到70%时,各位将会收到Warning邮件,提示清理空间;

   当Hadoop集群空间使用量到达80%时,各位将会收到Critical邮件,提示清理空间;

为保证集群数据安全,预留down机冗余空间,请各位务必清理,如因数据量确实巨大,集群无法容纳,请及时告知运维进行扩容,谢谢!





Configured Capacity: 124854950621184 (113.55 TB)

Present Capacity: 118317151626783 (107.61 TB)

DFS Remaining: 38704545865728 (35.2 TB)

DFS Used: 79612605761055 (72.41 TB)

DFS Used%: 67.29%

Under replicated blocks: 0

Blocks with corrupt replicas: 0

Missing blocks: 0





-------------------------------------------------

Datanodes available: 15 (15 total, 0 dead)

----------------------

dfs used details:

Found 6 items

0               hdfs://hamaster140:9000/benchmarks

125752          hdfs://hamaster140:9000/data0

0               hdfs://hamaster140:9000/system

13721821810608  hdfs://hamaster140:9000/tech

1803375805154   hdfs://hamaster140:9000/tmp

6411197575455   hdfs://hamaster140:9000/user



Found 14 items

33222938       hdfs://hamaster140:9000/user/azk

4072247213805  hdfs://hamaster140:9000/user/cla

40705761240    hdfs://hamaster140:9000/user/din

0              hdfs://hamaster140:9000/user/fea

0              hdfs://hamaster140:9000/user/gao

36454169547    hdfs://hamaster140:9000/user/gmz

1877816487439  hdfs://hamaster140:9000/user/hdf

148965233376   hdfs://hamaster140:9000/user/imp

2416017438     hdfs://hamaster140:9000/user/in

0              hdfs://hamaster140:9000/user/lin

0              hdfs://hamaster140:9000/user/luo

149973222708   hdfs://hamaster140:9000/user/shi

82586246964    hdfs://hamaster140:9000/user/wuy

0              hdfs://hamaster140:9000/user/zho



[hdfs@hanagios48 root]$

hadoop集群空间使用情况报告脚本的更多相关文章

  1. 如何在不重启或重新格式化hadoop集群的情况下删除集群节点

    在master节点上的hadoop安装目录下 进入conf目录 配置hdfs-site.xml文件 添加节点如下: <property> <name>dfs.hosts.exc ...

  2. eclipse 远程链接访问hadoop 集群日志信息没有输出的问题l

    Eclipse插件Run on Hadoop没有用到hadoop集群节点的问题参考来源 http://f.dataguru.cn/thread-250980-1-1.html http://f.dat ...

  3. 吴裕雄--天生自然HADOOP学习笔记:hadoop集群实现PageRank算法实验报告

    实验课程名称:大数据处理技术 实验项目名称:hadoop集群实现PageRank算法 实验类型:综合性 实验日期:2018年 6 月4日-6月14日 学生姓名 吴裕雄 学号 15210120331 班 ...

  4. 精确报告Linux内存使用情况实用脚本:ps_mem

    精确报告Linux内存使用情况实用脚本:ps_mem 2019-09-06 12:45 ps_mem内存工具 ps_mem 是一个可以帮助我们精确获取 Linux 中各个程序核心内存使用情况的简单 p ...

  5. 基于OGG的Oracle与Hadoop集群准实时同步介绍

    版权声明:本文由王亮原创文章,转载请注明出处: 文章原文链接:https://www.qcloud.com/community/article/220 来源:腾云阁 https://www.qclou ...

  6. 【大数据系列】hadoop集群设置官方文档翻译

    Hadoop Cluster Setup Purpose Prerequisites Installation Configuring Hadoop in Non-Secure Mode Config ...

  7. 构建高可靠hadoop集群之3- Quorum Journal Manager

    在正式环境中,搭建高可靠(ha)的系统是必须的. 例如oralce的rac,apache集群,windows服务器集群 本文不再赘言ha的重要性. 本文主要是对 http://hadoop.apach ...

  8. 大数据初级笔记二:Hadoop入门之Hadoop集群搭建

    Hadoop集群搭建 把环境全部准备好,包括编程环境. JDK安装 版本要求: 强烈建议使用64位的JDK版本,这样的优势在于JVM的能够访问到的最大内存就不受限制,基于后期可能会学习到Spark技术 ...

  9. 保姆级教程,带你认识大数据,从0到1搭建 Hadoop 集群

    大数据简介,概念部分 概念部分,建议之前没有任何大数据相关知识的朋友阅读 大数据概论 什么是大数据 大数据(Big Data)是指无法在一定时间范围内用常规软件工具进行捕捉.管理和处理的数据集合,是需 ...

随机推荐

  1. 关于caffe-windows中 compute_image_mean.exe出现的问题

    这两天有兴致装了下caffe.感受下这个框架. 可是在这个过程中遇到非常多问题.我把碰到的问题和解决方式写下,便于后人高速上手. compute_image_mean.exe 编译出来后.运行数据变换 ...

  2. textarea内容有换行时存入数据库丢失问题的解决 (转载)

    http://blog.csdn.net/zhang_j_h/article/details/44563167 存入: function GetInputData(id, cmd) { var pos ...

  3. itextSharp 对pdf的每个页面添加footer/header

    static void SetAllHeaderFooter(string inputPath) { PdfReader reader=new PdfReader(inputPath); PdfSta ...

  4. NProxy——Mac和Linux平台下的Fiddler

    Fiddler 相信大家,尤其是前端工程师们都知道. 用它的文件替换功能,将线上的静态资源文件(JS.CSS.图片)替换为本地相应的文件,来调试线上(代码都被压缩过)UI的问题.的确是一神器.(相比, ...

  5. 阿根廷探戈(Argentine Tango)舞步

    阿根廷探戈(Argentine Tango)舞步 阿根廷探戈(Argentine Tango)舞步 2011-11-22 13:05:11   不像其它大部分的社交舞,阿根廷探戈没有固定的舞步,它是一 ...

  6. SRM589 DV1 250 回文字符串

    其实这道题挺简单的,不过刚开始我钻了一个错误的死胡同.想明白之后才发现. 题目要求用最少的时间来将一个字符串变成回文字符串.(具体题目参看topcoder srm589 DV1 250分值的题目,不便 ...

  7. Android应用公布的准备——渠道注冊与认证

    今天早上申请了一个早上的渠道账号,这工作真是太繁琐,申请的是企业账号,须要营业执照等相关资料,假设申请个人的话预计须要身份证相关信息.以下贴出国内主流的几个渠道.不全然,可是基本上涵盖了大部分. 36 ...

  8. 在jsp页面下, 让eclipse完全支持HTML/JS/CSS智能提示(转)

      我们平时用eclipse开发jsp页面时智能提示效果不太理想,今天用了两个小时发现了eclipse也可以像Visual Studio 2008那样完全智能提示HTML/JS/CSS代码,使用ecl ...

  9. Spring MVC 多选框 绑定 Entity 中的 list 属性

    问题描述: 有两个类:Record.java 和 User.java,Record中有个attenders属性,是List<User>类型. 我想绑定Record中的attenders.网 ...

  10. linux shell中的单引号与双引号的区别(看完就不会有引号的疑问了)(转)

    tips: ============================= IFS - LINUX字段分隔符,内部字段分隔符 IFS(Internal Field Seperator)在Linux的she ...