记一次线上bug:crontab 被意外清空
记一次线上bug:crontab 被意外清空
问题概述
同事反馈,某台服务器的crontab
被清空了.
看了cron
运行日志来看,问题出在这里:
Jul 3 10:01:24 10-10-65-235 crontab[19333]: (root) REPLACE (root)
这一时刻被替换掉了,后续就没有任务执行了。
然后紧急恢复备份,并从日志中检查遗漏项。
问题排查
定位出问题后,就从history
中找执行的操作。
可从history
中没有看到 crontab -r
的操作被执行。
后在Google
搜索问题找到一些类似的情况,是由于远程登录、加空格之类的导致的(https://cloud.tencent.com/developer/article/2222953
)。
我看了后,就发现这一定是我的锅了,并且受影响的还有其他两台设备。
问题复现
我的操作是从远程服务器通过 ssh
直接执行的命令,卡住之后 ctrl
+C
中断了操作,于是任务被清空。
复现流程:
创建任务(保证任务列表中有内容,不为空)。
╭─ ~/cmd ▓▒░·······························································░▒▓ 10:29:52 ─╮
╰─ crontab -l ─╯
# Minute Hour Day of Month Month Day of Week who Command
# (0-59) (0-23) (1-31) (1-12 or Jan-Dec) (0-6 or Sun-Sat) 20 17 * * 1-5 open "https://tengyun.qianxin-inc.cn/home/workspace/worklog" ╭─ ~/cmd ▓▒░·······························································░▒▓ 10:29:54 ─╮
╰─ ─╯
使用
ssh
命令执行能卡住的命令,如crontab
或crontab -
╭─ ~/cmd ▓▒░·······························································░▒▓ 10:29:54 ─╮
╰─ ssh nanshao@127.0.0.1 crontab ─╯
命令卡住,此刻查看
crontab -l
还是有的。╭─ ~/cmd ▓▒░·······························································░▒▓ 10:30:59 ─╮
╰─ crontab -l ─╯
# Minute Hour Day of Month Month Day of Week who Command
# (0-59) (0-23) (1-31) (1-12 or Jan-Dec) (0-6 or Sun-Sat) 20 17 * * 1-5 open "https://tengyun.qianxin-inc.cn/home/workspace/worklog" ╭─ ~/cmd ▓▒░·······························································░▒▓ 10:31:02 ─╮
╰─ ─╯
使用
ctrl
+C
结束掉后检查任务列表。╭─ ~/cmd ▓▒░·······························································░▒▓ 10:29:54 ─╮
╰─ ssh nanshao@127.0.0.1 crontab ─╯
^C%
╭─ ~/cmd ▓▒░··························································░▒▓ 55s 10:31:30 ─╮
╰─ crontab -l ─╯ ╭─ ~/cmd ▓▒░·······························································░▒▓ 10:31:33 ─╮
╰─ ─╯
问题复现成功。
其他测试
- 后又分别在本机直接测试了这些指令,均没有清空任务列表。只有在
ssh
操作时,会被清空。 ssh
操作中ssh XXX@XXX bash -c "crontab -l"
该命令也会被卡住。
总结
产生的操作,弄明白了,但是原理还是没搞明白。
避坑方法:
- 定时备份。
- 在卡住时,不要中断,先备份,在停止掉。
又是一次难忘的经历。
记一次线上bug:crontab 被意外清空的更多相关文章
- 记一次线上bug排查-quartz线程调度相关
记一次线上bug排查,与各位共同探讨. 概述:使用quartz做的定时任务,正式生产环境有个任务延迟了1小时之久才触发.在这一小时里各种排查找不出问题,直到延迟时间结束了,该任务才珊珊触发.原因主要就 ...
- 解Bug之路-记一次线上请求偶尔变慢的排查
解Bug之路-记一次线上请求偶尔变慢的排查 前言 最近解决了个比较棘手的问题,由于排查过程挺有意思,于是就以此为素材写出了本篇文章. Bug现场 这是一个偶发的性能问题.在每天几百万比交易请求中,平均 ...
- 「日常开发」记一次因使用Date引起的线上BUG处理
生活中,我们需要掌控自己的时间,减少加班,提高效率:日常开发中,我们需要操作时间API,保证效率.安全.稳定.现在都2020年了,了解如何在JDK8及以后的版本中更好地操控时间就很有必要,尤其是一次线 ...
- 线上bug的解决方案--带来的全新架构设计
缘由 本人从事游戏开发很多年一直都是游戏服务器端开发. 因为个人原因吧,一直在小型公司,或者叫创业型团队工作吧.这样的环境下不得不逼迫我需要什么都会,什么做. 但是自我感觉好像什么都不精通..... ...
- 程序员如何描述清楚线上bug
案例 一个管理后台的bug,把操作记录中的操作员姓名,写成了该操作员的id.原因是修改了一个返回操作人姓名的函数,返回了操作人的id.但是还有其他地方也用这个函数,导致其他地方把姓名字段填写成了操作员 ...
- 线上bug分析
昨天下午大神把组内几十号人召集在一起开Online bug分析大会,主要是针对近期线上事故从事故原因和解决方案两个维度来分析. 对金融软件来说,每一次的线上事故都有可能给公司带来重大的损失,少扣了用户 ...
- 听说”双11”是这么解决线上bug的
听说"双11"是这么解决线上bug的 --Android线上热修复的使用与原理 预备知识和开发环境 Android NDK编程 AndFix浅析 Android线上热修复的原理大同 ...
- 线上bug或故障界定及填写规范
[线上故障与线上Bug界定] 一.线上故障: 1. 故障参照公司规范稍做调整: a) 1级故障:资讯首页或主App首页无法打开:多条业务线同时不可用:超过15分钟: b) ...
- 关于线上bug
之所以想写下线上bug,因为发觉有些公司对线上bug的处理是比较严格甚至是很苛刻,涉及到的相关人可能会因此而背黑锅. 之所以会存在这样情况,因为公司各部门都有关联,特别是用户.老板的投诉,也给公司会造 ...
- 记录一次线上bug
记录一次线上bug,总的来说就是弱网和重复点击.特殊值校验的问题. 测试场景一: 在3g网络或者使页面加载速度需要两秒左右的时候,输入学号,提交学生的缴费项目,提交完一个 学生的缴费后, ...
随机推荐
- Redis 源码解析之通用双向链表(adlist)
Redis 源码解析之通用双向链表(adlist) 概述 Redis源码中广泛使用 adlist(A generic doubly linked list),作为一种通用的双向链表,用于简单的数据集合 ...
- Mybatis 坑(1)
org.apache.ibatis.executor.ExecutorException: No constructor found in xxxx [Integer,String] 这种情况一般是类 ...
- [双目视差] 立体匹配算法推理 - SGBM算法(二)
文章目录 立体匹配算法推理 - SGBM算法(二) 一.SGM算法 二. 后处理 立体匹配算法推理 - SGBM算法(二) 一.SGM算法 SGM算法的全称为Semi-Global Matching, ...
- 【必知必会的MySQL知识】①初探MySQL
目录 前言 MySQL是什么? MySQL版本 表的概念 表中的列和数据类型 行 主键 什么是SQL 实践操作 小结 前言 周所周知MySQL已成为全世界最受欢迎的数据库之一.无论你用的何种编程语言在 ...
- 从浏览器输入域名开始分析DNS解析过程
摘要:DNS(Domain Name System)是域名系统的英文缩写,是一种组织成域层次结构的计算机和网络服务命名系统,用于 TCP/IP 网络. 本文分享自华为云社区<DNS那些事--从浏 ...
- 2020-08-27:OpenStack与Docker的区别?
福哥答案2020-08-27: 此答案来自qq群巨佬:openstack是个体系一个完整的方案系统 基于虚拟机 docker只是一个内核上特殊模式跑与其他系统进程隔离的进程的软件方案真正与docker ...
- 2020-09-17:arp协议缓存过程是怎样的?
福哥答案2020-09-17:#福大大架构师每日一题# [答案来自此链接](https://www.zhihu.com/question/421513153) ARP(Address Resoluti ...
- 2021-07-12:缺失的第一个正数。给你一个未排序的整数数组 nums ,请你找出其中没有出现的最小的正整数。请你实现时间复杂度为 O(n) 并且只使用常数级别额外空间的解决方案。比如[3,4,5
2021-07-12:缺失的第一个正数.给你一个未排序的整数数组 nums ,请你找出其中没有出现的最小的正整数.请你实现时间复杂度为 O(n) 并且只使用常数级别额外空间的解决方案.比如[3,4,5 ...
- Play to Earn Games
什么是P2E游戏 P2E 游戏(Play to Earn Games)指的是在区块链游戏中,玩家可以通过完成任务.收获资源.挖矿或游戏中的其他活动以获得成就来赚取游戏内的资产(NFT)或代币(Toke ...
- GitLib详细使用手册(windows系统)
Git是一个开源的分布式版本控制系统,可以有效.高速地处理从很小到非常大的项目版本管理. 对gitlab的常见的使用有建立仓库.提交代码.更新代码.回滚代码.显示/修改日志.拉取分支.解决冲突.设置比 ...