用shell实现linux系统应用文件清理工具
用shell实现linux系统文件清理工具
1:原始需求
在系统运维中,会产生大量应用备份文件、落地文件等,这些文件需要定时清理。一般来说,都是使用crontab 拉起一个脚本来清理。类似这样:
30 0,12 * * * find /data02/rating_bak/loading -type f -name "gprs_ol*gz" -atime +1 -exec rm {} \;
但是如果机器很多,目录多,这种方式非常不利于管理,而且也没有一个清晰的配置,来知道什么机器上哪个目录的文件留存时间。这个工具用于在数据库中存一个配置,然后在每台机器上,配置一个定时脚本执行即可。
实现的基本方式为:用一个shell从数据库中读取配置,根据文件的最后修改时间,大于X的mv到带日期的子目录中,大于Y的压缩,大于Z的删除。用crontab拉起这个脚本。
2:数据库表配置
create table WH_BAKFILE_CFG
(
BAKID NUMBER, --主键ID
IP VARCHAR2(30), --IP地址
SCANPWD VARCHAR2(300), --扫描目录
BAKPWD VARCHAR2(300), --备份目录
FILECH VARCHAR2(100), --文件特征
MVTIME NUMBER, --文件移动时间 单位分
ZIPTIME NUMBER, --文件压缩时间 单位分
DELTIME number, --文件删除时间 单位分
Needcheck number --是否需要校验文件被占用 1需要校验
)
配置举例:
|
BAKID |
IP |
SCANPWD |
BAKPWD |
FILECH |
MVTIME |
ZIPTIME |
DELTIME |
NEEDCHECK |
|
91 |
172.20.31.24 |
/data02/rating_bak/upcheck/migrate_sd |
|
* |
1440 |
2880 |
46080 |
|
|
10 |
172.20.31.24 |
/app/billapp/user/wxk/mybak |
|
* |
1440 |
2880 |
8640 |
|
|
11 |
172.20.31.24 |
/data02/rating_bak/upfile/d |
|
* |
1440 |
5760 |
46080 |
|
|
13 |
172.20.31.24 |
/data02/rating_bak/upfile/q |
|
* |
1440 |
5760 |
46080 |
|
|
14 |
172.20.31.24 |
/data02/rating_bak/upfile/vpmn |
|
* |
1440 |
5760 |
46080 |
|
3:相关代码
A:读取配置,拉起处理shell。
从数据库中获取配置,写入${IP}.cfg,生成$(bakid).lock,避免处理shell被多次拉起,然后拉起处理shell。
#!/bin/sh
CONNSTR="conn dz/dz_xxxxx@nbilldb"
LOGFILE=./getbakinfo.log
##得到本机IP
IP=""
getip()
{
if [[ x"${IP}" = x ]];then
IP=`/sbin/ifconfig |grep "inet addr"| cut -f 2 -d ":" |sed -n '1p' |awk '{print $1}'`
fi
}
##记录日志
writelog()
{
echo `date +%Y-%m-%d" "%X` "$1" >>${LOGFILE}
}
##SQL
selectsql()
{
sqlplus -S /nolog <<EOF
set heading off feedback off pagesize 0 verify off echo off linesize 3000
${CONNSTR}
${1};
commit;
exit
EOF
}
MYWORKSHELL=$0
if [[ ${MYWORKSHELL} = "getbakinfo.sh" ]] ; then
MYWORKPATH=.
else
MYWORKPATH=${MYWORKSHELL%\/*}
fi
cd $MYWORKPATH
##判断连接
sql="select 'HELLOSMK' from dual"
selectresult=`selectsql "${sql}"`
if [[ ! "${selectresult}" = "HELLOSMK" ]] ; then
writelog "error 连接数据库失败!:${selectresult}"
else
##写配置文件
getip
rm ${IP}.cfg
sql="select trim(bakid)||'##'||trim(t.scanpwd)||'##'||trim(t.bakpwd)||'##'||trim(t.filech)||'##'||t.mvtime||'##'||t.ziptime||'##'||t.deltime||'##'||nvl(t.needcheck,0) \
from wh_bakfile_cfg t where t.ip ='${IP}' "
#selectsql "${sql}"
#IFS=$'\x0A'
selectresult=`selectsql "${sql}"`
##逐条处理
for result in ${selectresult}
do
bakid=`echo ${result} |awk -F "##" '{print $1}'`
scanpwd=`echo ${result} |awk -F "##" '{print $2}'`
bakpwd=`echo ${result} |awk -F "##" '{print $3}'`
filech=`echo ${result} |awk -F "##" '{print $4}'`
mvtime=`echo ${result} |awk -F "##" '{print $5}'`
ziptime=`echo ${result} |awk -F "##" '{print $6}'`
deltime=`echo ${result} |awk -F "##" '{print $7}'`
needcheck=`echo ${result} |awk -F "##" '{print $8}'`
echo ${bakid},${scanpwd},${bakpwd},${filech},${mvtime},${ziptime},${deltime},${needcheck}>>${IP}.cfg
done
fi
cat ${IP}.cfg |while read filestr
do
bakid=`echo ${filestr} |awk -F "," '{print $1}'`
scanpwd=`echo ${filestr} |awk -F "," '{print $2}'`
bakpwd=`echo ${filestr} |awk -F "," '{print $3}'`
filech=`echo ${filestr} |awk -F "," '{print $4}'`
mvtime=`echo ${filestr} |awk -F "," '{print $5}'`
ziptime=`echo ${filestr} |awk -F "," '{print $6}'`
deltime=`echo ${filestr} |awk -F "," '{print $7}'`
needcheck=`echo ${filestr} |awk -F "," '{print $8}'`
##目录检查
if [ -d "${scanpwd}" ] ; then
##锁检查
if [ ! -f "${bakid}.lock" ]; then
touch "${bakid}.lock"
nohup ${MYWORKPATH}/whbakfile.sh "${bakid}" "${scanpwd}" "${bakpwd}" "${filech}" "${mvtime}" "${ziptime}" "${needcheck}" "${MYWORKPATH}" "${deltime}" >> ${LOGFILE} 2>&1 &
fi
else
writelog "error目录不存在!:${scanpwd}"
fi
done
B:文件处理shell
#!/bin/sh
ddtime=`date +%Y%m%d`
LOGFILE=$HOME/log/bakfile/bakfile${ddtime}.log
bakid=$1
scanpwd=$2
bakpwd=$3
filech=$4
mvtime=$5
ziptime=$6
needcheck=$7
MYWORKPATH=$8
deltime=$9
cd $MYWORKPATH
##记录日志
writelog()
{
echo `date +%Y-%m-%d\ %H:%M:%S` "$1" >>${LOGFILE}
}
cd $MYWORKPATH
if [[ x"${bakpwd}" = x ]];then
bakpwd=${scanpwd}
fi
if [[ x"${deltime}" = x ]];then
deltime=9999999
fi
if [[ x"${ziptime}" = x ]];then
ziptime=9999999
fi
if [[ x"${filech}" = x ]];then
filech="*"
fi
###mv
find ${scanpwd} -maxdepth 1 -type f -name "${filech}" -mmin +${mvtime} |while read filename
do
filetime=`ls -l ${filename} --time-style '+%Y%m%d'|awk '{print $6}'`
if [ ! -d "${bakpwd}/${filetime}" ]; then
mkdir -p ${bakpwd}/${filetime}
fi
##check
checkstat=0
if [[ ${needcheck} -eq 1 ]] ; then
checkstat=`lsof|grep filename |wc -l`
fi
if [[ ${checkstat} -eq 0 ]] ; then
mv ${filename} ${bakpwd}/${filetime}
writelog "mv ${filename} ${bakpwd}/${filetime}"
fi
done
###gzip
if [[ ! ${ziptime} -eq 9999999 ]] ; then
find ${bakpwd} -type f -name "${filech}" -mmin +${ziptime}|grep -v .gz|grep ${bakpwd}/20|while read filename
do
gzip ${filename}
writelog "gzip ${filename}"
done
fi
###rm
if [[ ! ${deltime} -eq 9999999 ]] ; then
find ${bakpwd} -type f -name "${filech}" -mmin +${deltime}|grep ${bakpwd}/20|while read filename
do
rm ${filename}
writelog "rm ${filename}"
done
fi
##rmdir
if [[ ! ${deltime} -eq 9999999 ]] ; then
find ${bakpwd} -type d |grep ${bakpwd}/20|while read pathname
do
pathnum=`ls ${pathname} | wc -l`
if [[ ${pathnum} -eq 0 ]] ; then
rmdir ${pathname}
writelog "rmdir ${pathname}"
fi
done
fi
rm ${bakid}.lock
用shell实现linux系统应用文件清理工具的更多相关文章
- Linux centosVMware运行告警系统、分发系统-expect讲解、自动远程登录后,执行命令并退出、expect脚本传递参数、expect脚本同步文件、指定host和要同步的文件、shell项目-分发系统-构建文件分发系统、分发系统-命令批量执行
一运行告警系统 创建一个任务计划crontab -e 每一分钟都执行一次 调试时把主脚本里边log先注释掉 再次执行 没有发现502文件说明执行成功了,每日有错误,本机IP 负载不高 二.分发系统-e ...
- Linux系统重要文件(二)
Linux系统重要文件概述 一系统自动挂载文件 文件路径信息:/etc/fstab文件作用说明:实现存储设备自动挂载 [root@centos7 ~]# cat /etc/fstab # # /etc ...
- Linux系统重要文件
Linux系统重要文件介绍与配置 一网卡配置文件 (一)网卡配置文件参数介绍 文件路径信息:/ec/sysconfig/network-scripts/ifcfg-eth0 文件作用说明:配置网卡地址 ...
- Linux系统中文件定位与查找
Linux系统中文件查找 关键词 文件查找 | find | locate 本文主要介绍有关文件查找的两个命令——find和locate,以及压缩打包的命令——compress, gzip,bzip2 ...
- 在 Linux 系统下使用 PhotoRec 工具来恢复已删除或丢失的文件
PhotoRec – Recover Deleted or Lost Files in Linux 在 Linux 系统下使用 PhotoRec 工具来恢复已删除或丢失的文件 当你在系统中有意或无意地 ...
- shell项目-分发系统-构建文件分发系统
shell项目-分发系统-构建文件分发系统 需求背景对于大公司而言,肯定时不时会有网站或者配置文件更新,而且使用的机器肯定也是好多台,少则几台,多则几十甚至上百台.所以,自动同步文件是至关重要的. 实 ...
- Linux系统下文件压缩与打包命令
Linux系统下文件压缩与打包命令 常用的压缩文件拓展名 * .Z * .zip * .gz * .bz2 * .xz * .tar * .tar.gz * .tar.bz2 * .tar.xz 压缩 ...
- 实验二:Linux系统简单文件操作命令
項目 内容 这个作业属于哪个课程() 课程链接 这个作业的要求在哪里 实验要求 学号-姓名 17043133-木腾飞 作业学习目标 学习在Linux系统终端下进行命令行操作: 学习掌握常用命令行操作并 ...
- [转]linux 系统监控、诊断工具之 IO wait
1.问题: 最近在做日志的实时同步,上线之前是做过单份线上日志压力测试的,消息队列和客户端.本机都没问题,但是没想到上了第二份日志之后,问题来了: 集群中的某台机器 top 看到负载巨高,集群中的机器 ...
随机推荐
- bootstropt-table 大量字段整体表单上传之时间处理
js 中用$('#addUserForm').serialize(),//获取表单中所有数据 传送到前台 (controller) $.ajax({ type : "POST", ...
- jstree获取整棵树的json数据
$("#树ID").jstree(true).get_json();
- MyBatis 源码分析——SqlSession接口和Executor类
mybatis框架在操作数据的时候,离不开SqlSession接口实例类的作用.可以说SqlSession接口实例是开发过程中打交道最多的一个类.即是DefaultSqlSession类.如果笔者记得 ...
- [css]《css揭秘》学习(三)-灵活的背景定位
一.background-position属性 使用该属性,在不确定容器大小的情况下,也可以指定图案距离容器边缘的位置:但是需要为不支持该属性的浏览器指定回退方案,否则,图案会默认放在左上角. < ...
- iterator的实现原理
1.iterator遍历linkedlist集合 Iterator li = list.iterator(); while(li.hasNext()){ System.out.println(li.n ...
- C语言 extern学习1
没有头文件时,通过本文件内的函数声明来确定定义域,实现功能: //单文件测试 #include <stdio.h> /* 经测试,C语言环境下子函数默认是void型:所以可省略不写 为严谨 ...
- AngularJS2环境配置
所使用到的文件目录结构如下所示: 1. 创建配置文件: 1.1. 创建目录: mkdir angular-quickstart cd angular-quickstart 1.2. 载入 ...
- springMVC整合Junit4进行单元测试
springMVC整合Junit4进行单元测试 标签: springMVC整合Junit4junit单元测试教程springMVC入门教程 spring(10) 版权声明:本文为博主原创文章,未 ...
- C# 类型和变量
C# 中的类型有两种:值类型 (value type) 和引用类型 (reference type).值类型的变量直接包含它们的数据,而引用类型的变量存储对它们的数据的引用,后者称为对象.对于引用类型 ...
- Java 练习(多态,instanceof)
题目:*(封装.继承)设计如下的继承树: Accout 表示银行账户,id 属性表示账户id,balance 表示账户余额,password 表示账户密码: SavingAccount 表示储蓄账户, ...