如何解决 shell 脚本重复执行的问题

在开发过程中，经常会使用shell脚本去完成定时备份的任务，普遍的做法是通过系统的定时任务定时执行备份脚本

设想这样一种场景，本次备份时间到了，自动执行备份脚本，如果备份比较耗时的话，会一直持续到下一次备份时间到了还未结束，下次备份又会自动调用备份脚本，相当于同一时间有两个进程在执行备份脚本，这可能会导致备份数据错乱或其他不可预知的问题

更进一步，假如执行备份脚本消耗的时间远大于设置的备份间隔的话，系统会出现多个同时在执行脚本的Bash实例，会占用大量的系统资源，进而影响正常业务程序的运行

那如何解决上述shell脚本重复执行的问题呢，本文将要介绍的 flock 命令可以解决这个问题

简介

flock 是文件锁命令，它可以保证Linux系统上进程之间安全的访问临界资源，在shell脚本中，可以用来控制逻辑的互斥性

实例1

现有脚本 a.sh, 内容如下

#!/bin/bash

echo "[`date +'%Y-%m-%d %H:%M:%S'`] begin pid:$$..."

sleep 10

echo "[`date +'%Y-%m-%d %H:%M:%S'`] end pid:$$..."

在终端(记为终端1)中执行 flock -xn ./f.lock -c ./a.sh 命令，结果如下

[tt@ecs-centos-7 lock_test]$ flock -xn ./f.lock -c ./a.sh

[2020-12-10 10:10:45] begin pid:5359...

[2020-12-10 10:10:55] end pid:5359...

在上述命令执行期间，打开另一个终端(记为终端2)，执行同样的命令，结果如下

[tt@ecs-centos-7 lock_test]$ flock -xn ./f.lock -c ./a.sh

[tt@ecs-centos-7 lock_test]$

上面的命令 flock -xn ./f.lock -c ./a.sh 中

-x 选项是排他锁，有时候也称为写锁，这是默认选项

-n 选项是非阻塞，如果无法获取锁，立即返回失败，而不是一直等待锁的释放

-c 选项后面是待执行的命令

终端1 中执行 flock -xn ./f.lock -c ./a.sh 命令，对 f.lock 文件加锁，同时执行 ./a.sh 命令，执行过程会持续10秒左右( sleep 10 语句 )

由于终端2 中 flock -xn ./f.lock -c ./a.sh 命令是在终端1 命令执行期间执行的，此时终端1 还未释放 f.lock文件锁，再加上 -n选项是非阻塞的，所以终端2 不会阻塞等待 f.lock 文件锁，而是立即返回

终端2 如果执行 flock -x ./f.lock -c ./a.sh 命令，会一直阻塞等待，直到终端1 释放 f.lock 文件锁，它才会获取到 f.lock 文件锁并开始执 ./a.sh 命令

实例2

实例1 中每次都需要执行 flock -xn 文件锁 -c ./a.sh 命令，而且每个不能重复执行的脚本都要分配一个文件锁，还得保证不同的脚本得使用不同名字的文件锁

有没有办法做到只要执行 ./a.sh 命令就可以实现实例1 中的功能呢？

答案：有的

我们把 a.sh 稍微修改下，修改之后的内容如下

  1 #!/bin/bash

  2

  3

  4 echo "[`date +'%Y-%m-%d %H:%M:%S'`] 1111 pid:$$...MY_LOCK:${MY_LOCK}"

  5

  6 [ "${MY_LOCK}" != "$0" ] && exec env MY_LOCK="$0" flock -xn "$0" "$0" "$@"

  7

  8 echo "[`date +'%Y-%m-%d %H:%M:%S'`] begin pid:$$...MY_LOCK:${MY_LOCK}"

  9

 10 sleep 10

 11

 12 echo "[`date +'%Y-%m-%d %H:%M:%S'`] end pid:$$..."

终端1 执行 ./a.sh 命令，输出如下

[tt@ecs-centos-7 lock_test]$ ./a.sh

[2020-12-10 14:11:35] 1111 pid:5944...MY_LOCK:

[2020-12-10 14:11:35] 1111 pid:5946...MY_LOCK:./a.sh

[2020-12-10 14:11:35] begin pid:5946...MY_LOCK:./a.sh

[2020-12-10 14:11:45] end pid:5946...

在终端1 命令执行期间，终端2 执行 ./a.sh 命令，输出如下

[tt@ecs-centos-7 lock_test]$ ./a.sh

[2020-12-10 14:11:44] 1111 pid:5976...MY_LOCK:

[2020-12-10 14:11:44]

新的 a.sh 脚本相比原来新增了第 4、6 两行

第 4 行是日志打印

第 6 行说明

$0 是脚本名字,这里的值是 ./a.sh

$@ 是传入 a.sh 脚本的所有参数

exec 会在当前进程执行它后面紧接着的命令，当前脚本进程原来还未执行完的命令不会执行了

[ "${MY_LOCK}" != "$0" ] 是判断 MY_LOCK 环境变量是否和脚本名字( a.sh )

相同

如果不同，就执行 env MY_LOCK="$0" 命令和 flock -xn "$0" "$0" "$@" 命令

env MY_LOCK="$0" 设置环境变量 MY_LOCK 的值为脚本名字

flock -xn "$0" "$0" "$@" 其实就是 flock -xn ./a.sh ./a.sh，它使用当前脚本名字作为文件锁

实例2 中，执行 ./a.sh 命令之后，当运行到第 6 行时，MY_LOCK 变量是空值，所以 [ "${MY_LOCK}" != "$0" ] 的结果为 true

exec 命令会忽略掉后面未执行的命令，也即在当前shell进程中第 6 行之后的命令都不会执行了

紧接着, exec env MY_LOCK="$0" flock -xn "$0" "$0" "$@" 命令，把 MY_LOCK 变量的值设置为当前脚本名字 ./a.sh ，同时执行 flock -xn "$0" "$0" "$@" 命令，此命令会在一个新的子shell中执行 ./a.sh ，所以脚本后续的输出中打印的进程ID和开始时不一样

同时，由于在 flock -xn "$0" "$0" "$@" 之前执行过 env MY_LOCK="$0"，MY_LOCK 变量的值被设置为了 ./a.sh, 所以 flock -xn "$0" "$0" "$@" 命令重新执行 ./a.sh 命令时，

脚本第 6 行的 [ "${MY_LOCK}" != "$0" ] 的结果为 false, 第 6 行 exec 后面的命令不会执行，脚本接着从第 7 行一直执行到最后，结果输出 8 和 12 行的日志也说明脚本执行完了

总结

实例1 和实例2 提供了两种解决脚本重复执行的方式，主要都是利用 flock 命令设置文件锁来实现的，实例2 的方式更简单，只需要在脚本开头加上 [ "${MY_LOCK}" != "$0" ] && exec env MY_LOCK="$0" flock -xn "$0" "$0" "$@" 语句，调用脚本的命令保持不变

更多关于 flock 命令的选项及用法可以通过 man flock 自行查看

如何解决 shell 脚本重复执行的问题的更多相关文章

shell脚本中执行source命令不生效的解决办法
一个shell脚本文件中有一个source命令,使用bash a.sh命令执行后source命令进行验证没有生效. 这是因为在shell脚本中执行source会看到效果,但是shell脚本执行完后再次 ...
shell脚本循环执行mysql语句
参考资料:Shell脚本中执行mysql语句需求:数据库里有张数据表存储的是用户对电影的评价(user_id movie_id rating time),但是我现在要每部电影的总评分. 解决方法: ...
shell脚本实现监控shell脚本的执行流程及变量的值
这篇文章主要介绍了shell脚本实现监控shell脚本的执行流程及变量的值本文使用shell完成对执行过程中条件语句中的变量的变化的监控和整个程序的执行流程的观察功能,需要的朋友可以参考下很多时候, ...
Shell脚本中执行mysql的几种方式（转）
Shell脚本中执行mysql的几种方式(转) 对于自动化运维,诸如备份恢复之类的,DBA经常需要将SQL语句封装到shell脚本.本文描述了在Linux环境下mysql数据库中,shell脚本下调用 ...
shell脚本中执行另一个shell脚本
分类: 可以在一个shell脚本中执行另一个shell脚本(或非可执行文件,主要用于取得一些变量的值),方法是: . 文件名(包括路径) 或变量=文件名(包括路径) . $变量注意,圆点后面有 ...
Shell脚本中执行sql语句操作mysql的5种方法【转】
对于自动化运维,诸如备份恢复之类的,DBA经常需要将SQL语句封装到shell脚本.本文描述了在Linux环境下mysql数据库中,shell脚本下调用sql语句的几种方法,供大家参考.对于脚本输出的 ...
shell脚本中执行sql的例子
这个例子演示了如何在shell脚本中执行多个sql来操作数据库表. #! /bin/sh USER_HOME=/home/`whoami` . /etc/profile if [ -f ${USER_ ...
使用shell脚本定时执行备份mysql数据库
使用shell脚本定时执行备份mysql数据库 #!/bin/bash ############### common file ################ #本机备份文件存放目录 MYSQLBA ...
shell脚本批量执行命令----必需判断上一步执行结果--没有捷径
# 注意:shell脚本批量执行命令,不能只写一个函数,然后把所有命令复制进去,之前试过这样是不行的.必须要有一个判断命令执行成功与否的语句 # 简单的命令可以不加结果判断符号,但是遇到解压包.sed ...

随机推荐

css实现一个电影卡片
1 <!DOCTYPE html> 2 <html lang="en"> 3 <head> 4 <meta charset="U ...
Hznu_0j 1557
题目链接:http://acm.hznu.edu.cn/OJ/problem.php?id=1557 题解:将两个数组分别升序和降序排序后,累加差的绝对值. Ac代码: #include<std ...
PTA 线性表元素的区间删除
6-8 线性表元素的区间删除 (20 分) 给定一个顺序存储的线性表,请设计一个函数删除所有值大于min而且小于max的元素.删除后表中剩余元素保持顺序存储,并且相对位置不能改变. 函数接口定义: ...
使用 Velero 跨云平台迁移集群资源到 TKE
概述 Velero 是一个非常强大的开源工具,可以安全地备份和还原,执行灾难恢复以及迁移Kubernetes群集资源和持久卷,可以在 TKE 平台上使用 Velero 备份.还原和迁移集群资源,关于如 ...
Qt信号槽源码剖析(一)
大家好,我是IT文艺男,来自一线大厂的一线程序员大家在使用Qt开发程序时,都知道怎么使用Qt的信号槽,但是Qt信号槽是怎么工作的? 大部分人仍然不知道:也就是说大家只知道怎么使用,却不知道基于什么原 ...
HCL实验8：NAT搭建私有网络
NAT 通过NAT技术,进行私有网络的搭建拓扑图先对路由器的端口进行配置 R1 [H3C]sys R1 [R1]INT G0/0 [R1-GigabitEthernet0/0]ip address ...
--系统编程-网络-tcp客户端服务器编程模型、socket、htons、inet_ntop等各API详解、使用telnet测试基本服务器功能
PART1 基础知识 1. 字节序网络字节序是大端字节序(低地址存放更高位的字节), 所以,对于字节序为小端的机器需要收发网络数据的场景,要对这些数据进行字节序转换. 字节序转换函数,常用的有四个: ...
【ProLog - 3.0 进阶：递归】
[ProLog中的递归] 如果递归中的一个或多个规则引用谓词本身,则对该谓词使用"递归"定义在使用时,这往往像一条食物链或者族谱的构成(A的爸爸的爸爸,即A的爷爷,是A的长辈) ...
hahahah JavaScript 小小小细节
nice~!
C# Linq 延迟查询的执行
在定义linq查询表达式时,查询是不会执行,查询会在迭代数据项时运行.它使用yield return 语句返回谓词为true的元素. var names = new List<string> ...

如何解决 shell 脚本重复执行的问题

简介

实例1

实例2

总结

如何解决 shell 脚本重复执行的问题的更多相关文章

随机推荐

热门专题