Linux备份-删除指定日期内文件

#!/usr/bin/env bash

source /etc/profile

echo " *************** start filter *************** "

# get befor six month last day

#m0=$(date -d "$(date -d 'month' +%Y%m01) -1 day" +%Y%m%d)

#echo ${m0}

#m1=$(date -d "$(date -d '0 month' +%Y%m01) -1 day" +%Y%m%d)

#echo ${m1}

#m2=$(date -d "$(date -d last-month +%Y%m01) -1 day" +%Y%m%d)

#echo ${m2}

#m3=$(date -d "$(date -d ${m2} +%Y%m01) -1 day" +%Y%m%d)

#echo ${m3}

#m4=$(date -d "$(date -d ${m3} +%Y%m01) -1 day" +%Y%m%d)

#echo ${m4}

#m5=$(date -d "$(date -d ${m4} +%Y%m01) -1 day" +%Y%m%d)

#echo ${m5}

#m6=$(date -d "$(date -d ${m5} +%Y%m01) -1 day" +%Y%m%d)

#echo ${m6}

# 取得当前月的最后一天，访问数组长度：${#m[*]} + ${#m[@]}

m[0]=$(date -d "$(date -d 'month' +%Y%m01) -1 day" +%Y%m%d)

echo m0 : ${m[0]} ' month : ' ${#m[@]}

for n in $(seq 0 11); do

m[$n+1]=$(date -d "$(date -d ${m[$n]} +%Y%m01) -1 day" +%Y%m%d)

echo m$[$n+1] : ${m[$n+1]} ' month : ' ${#m[*]};

done

echo " ****** time : " $(date '+%Y-%m-%d %H:%M:%S') " ****** "

max_date=0

# get the latest file and copy to hdfs

cd /home/hadoop/streaming_run_center/tmp/checkpoint/filter

for dir in $(ls -l ./ | awk '/^d/{print $NF}')

if [[ -d $dir && $dir == *\_* ]]; then

f_d=$(echo $dir | cut -d \_ -f 3 | cut -d \. -f 1)

if [[ $max_date < $f_d ]]; then

max_date=$f_d

max_filter=$dir

done

echo " max date is : "$max_date

echo " max filter is : "$max_filter

pwd

# 复制最近日期的filter文件到hdfs

hadoop fs -test -e /data/datacenter/run_center_spark_stream/bloom_filters/$max_filter

if [[ $? == 0 ]]; then

echo " filter is already exist : "$max_filter

else

echo " start hdfs copy "

echo " ****** start time : " $(date '+%Y-%m-%d %H:%M:%S') " ****** "

hadoop fs -put $max_filter /data/datacenter/run_center_spark_stream/bloom_filters

echo " ****** end time : " $(date '+%Y-%m-%d %H:%M:%S') " ****** "

remove_week=$(date -d "$max_date 7 days ago" +%Y%m%d)

echo " 删除本地序列化文件的日期界限："$remove_week

remove_date=$(date -d "$max_date 30 days ago" +%Y%m%d)

echo " 删除文件和 Hadoop filter 的日期界限："$remove_date

echo " *************** start remove filter *************** "

for r_dir in $(ls -l ./ | awk '/^d/{print $NF}')

if [[ -d $r_dir && $r_dir == *\_* ]]; then

r_d=$(echo $r_dir | cut -d \_ -f 3 | cut -d \. -f 1)

if [[ $r_d < $remove_date ]]; then

if [[ ${m[*]} == *$r_d* ]]; then

cd /home/hadoop/streaming_run_center/tmp/checkpoint/filter/$r_dir

pwd

for f_dir in $(ls *)

if [[ "$f_dir" == "mau_device_all.FILTER.SER" ]]; then

echo " ------ keep mau_filter is: " $f_dir;

else

echo " remove file is: " $f_dir;

rm -r $f_dir

done

cd /home/hadoop/streaming_run_center/tmp/checkpoint/filter

pwd

else

echo " remove filter_dir is: "$r_dir

rm -r $r_dir

elif [[ $r_d < $remove_week ]]; then

if [[ $r_d == $m0 || $r_d == $m1 || $r_d == $m2 ]]; then

cd /home/hadoop/streaming_run_center/tmp/checkpoint/filter/$r_dir

pwd

for f_dir in $(ls *)

if [[ "$f_dir" == "mau_device_all.FILTER.SER" ]]; then

echo " ------ week keep mau_filter is: " $f_dir;

else

if [[ "$f_dir" == *.FILTER.SER ]]; then

echo " - last day of month - week remove file is: " $f_dir;

rm -r $f_dir

done

cd /home/hadoop/streaming_run_center/tmp/checkpoint/filter

pwd

else

echo "week remove filter is: "$r_dir

rm -r $r_dir/*.FILTER.SER

done

echo " =============== start remove hdfs filter =============== "

# 删除hdfs上指定日期外的tdid

for h_filter in $(hadoop fs -ls /data/datacenter/run_center_spark_stream/bloom_filters | awk '{print $8}')

if [[ $h_filter == *\_* ]]; then

h_date=$(echo $h_filter | cut -d \/ -f 6 | cut -d \_ -f 3 | cut -d \. -f 1)

# echo " hdfs date : "$h_date

# echo " hdfs filter : "$h_filter

if [[ ${m[*]} == *$h_date* ]]; then

echo " remain hdfs filter is : "$h_filter

elif [[ $h_date < $remove_date ]]; then

echo "not remain date is : "$h_date

echo "remove hdfs filter is : "$h_filter

hadoop fs -rmr $h_filter

done

echo " -------------- start tdid --------------- "

# 删除小于30天的tdid

cd /home/hadoop/streaming_run_center/tmp/checkpoint/tdidinfo

for tdid in $(ls *)

if [[ $tdid == *\_* ]]; then

t_d=$(echo $tdid | cut -d \_ -f 2 | cut -d \. -f 1)

if [[ $t_d == $max_date || $t_d > $max_date ]]; then

echo " need copy date : "$t_d

echo " need copy tdid : "$tdid

# 检查tdid是否存在

# hadoop fs -test -e jiaojiao/tdid/$tdid

# if [[ $? == 0 ]]; then

# echo " tdid is already exist,remove it first "

# hadoop fs -rm jiaojiao/tdid/$tdid

# hadoop fs -put $tdid jiaojiao/tdid

# else

# echo " start copy "

# hadoop fs -put $tdid jiaojiao/tdid

# fi

elif [[ $t_d < $remove_date ]]; then

echo " remove tdid : "$tdid

rm $tdid

done

#echo " =============== start remove hdfs tdid =============== "

#for h_tdid in $(hadoop fs -ls jiaojiao/tdid | awk '{print $8}')

#do

# if [[ $h_tdid == *\_* ]]; then

# h_date=$(echo $h_tdid | cut -d \_ -f 2 | cut -d \. -f 1)

# echo $h_date

# echo $h_tdid

# fi

#done

Linux备份-删除指定日期内文件的更多相关文章

Window Linux下实现指定目录内文件变更的监控方法
转自:http://qbaok.blog.163.com/blog/static/10129265201112302014782/ 对于监控指定目录内文件变更,window 系统提供了两个未公开API ...
Linux下查找指定日期的文件
一.背景 Linux服务器的一个目录里,每天产生海量的文件.为了防止磁盘被写满. 决定每天删除部分老文件.OK,问题来了,如何过滤出指定日期的文件? 二.强大的Linux 一行代码搞定: ls --f ...
【Linux】linux中删除指定日期之前的文件
要删除系统中就的备份文件,就需要使用命令了: #find /tmp -mtime +30 -type f -name *.sh[ab] -exec rm -f {} \; 假如在一个目录中保留最近30 ...
centos6.5下oracle自动备份删除指定天数的文件
第一步先做一个备份 #!/bin/sh export ORACLE_BASE=/home/oracle/app export ORACLE_HOME=/dbhome_1 export ORACLE_S ...
Debian下自动备份文件并上传到远程FTP服务器且删除指定日期前的备份Shell脚本
说明: 1.备份目录/home/osyunwei下面所有的文件到/home/osyunweibak里面,并且保存为osyunwei20120701.tar.gz的压缩文件格式(2012_07_01是 ...
python 指定日期图片文件删除
手机使用python操作图片文件起因前几天去国图拍了一本书,一本心理学方面的书,也许你问我为什么不去买一本,或者去网上找pdf. 其实吧,关于心理学方面的书可以说在市面上一抓就是一堆,至于拍这本书 ...
Linux下删除空文件，删除指定大小的文件
Linux下批量删除空文件(大小等于0的文件)的方法: find . -name "*" -type f -size 0c | xargs -n 1 rm -f 用这个还可以删除指 ...
利用任务计划自动删除指定日期的SQLServer备份文件
利用任务计划自动删除指定日期的SQLServer备份文件命令FORFILES [/P pathname] [/M searchmask] [/S] [/C command] [/D ...
linux下查找指定后缀的文件
1.linux下查找指定后缀的文件例如查找当前目录下的所有后缀名时.c或.h的文件 find . -type f -regex ".*\.$c\|h$"

随机推荐

Median Value
Problem A: Median Value Time Limit: 1 Sec Memory Limit: 128 MB Submit: 874 Solved: 307 [Submit][Stat ...
WebSphere中配置的数据源在Web应用中引用的写法
WebSphere中配置的数据源在Web应用中引用时名称一定要和数据源的JNDI名称保持一致,否则会出现无法找到数据源的错误. 引用WAS的数据源时只需要与JNDI名称保持一致即可. 引用Tomcat ...
Oracle查看所有表空间的数据使用情况
-- 查看所有表空间的数据使用情况 SELECT Upper(F.TABLESPACE_NAME) "表空间名", D.TOT_GROOTTE_MB "表空间大小(M)& ...
sdut1283Five in a Row, Again
一简单的状压题比赛时跑偏了 ,脑子最近乱的跟浆糊似得呢.. #include <iostream> #include<cstdio> #include<cstring& ...
JAVA一些错误代码
//算术异常 ArithmeticExecption //空指针异常类 NullPointerException //类型强制转换异常 ClassCastException //数组负下标异常 Neg ...
[小记]Android缓存问题
今天晚上,产品经理打电话说我们的Android App除了问题,问题很简单就是一个缓存问题,由于这个程序是前同事写的,我也只能呵呵一笑,有些事你就得扛.还是回到正题吧,这个缓存问题,实在有点奇葩,所以 ...
iOS----创建静态库
静态库 1.什么是库? 库是程序代码的集合,是共享程序代码的一种方式 2.根据源代码的公开情况,库可以分为2种类型开源库公开源代码,能看到具体实现比如SDWebImage.AFNetworkin ...
js基础盲点
var myarray= new Array(8); //创建数组,存储8个数据. 注意:1.创建的新数组是空数组,没有值,如输出,则显示undefined.2.虽然创建数组时,指定了长度,但实际上数 ...
iTOP-4412开发板-实战教程-ssh服务器移植到arm开发板
本文转自迅为开发板:http://www.topeetboard.com 在前面实战教程中,移植了“串口文件传输工具”,整个移植过程是比较简单的,而且我们没有做任何协议方面的了解,只是“配置”+“编 ...
Android（java）学习笔记190：ContentProvider使用之学习ContentProvider（内容提供者）的目的
1. 使用ContentProvider,把应用程序私有的数据暴露给别的应用程序,让别的应用程序完成对自己私有的数据库数据的增删改查的操作. 2. ContentProvider的应用场景: 获取手机 ...

Linux备份-删除指定日期内文件

Linux备份-删除指定日期内文件的更多相关文章

随机推荐

热门专题