事件背景

Redis主从开启AOF,错误操作导致数据被清空。

Redis主要作用:缓存、队列。


事故过程

Redis搭建了主从,持久化方式为RDB,RDB没有定时备份,且AOF都没有开启。

考虑到开启AOF会使Redis安全性更高,所以尝试先在从机做测试,没问题后再上主机。

Redis开启AOF的方式非常简单,打开Redis的conf文件,找到【appendonly】配置项,将【no】改为【yes】重启服务即可。

Redis从机重启后,成功在数据目录生成了百M以上的【appendonly.aof】文件,以该aof文件单独启动Redis实例,生成的数据和单独以RDB文件启动生成的数据一样,因此判断从机AOF配置成功。

接着直接上了主机,Redis主机以同样的方式配置AOF后,结果实例重启的瞬间,Redis主从数据被清空,主从AOF及RDB文件大小接近0M。


问题分析

1、为什么在已经开启RDB持久化的情况下,还打算开启AOF?

解答:同时开启两种持久化,Redis拥有足以媲美PostgreSQL的数据安全性。

RDB 持久化可以在指定的时间间隔内生成数据集的时间点快照,常用做备份。
AOF 持久化记录服务器执行的所有写操作命令,并在服务器启动时,通过重新执行这些命令来还原数据集。 RDB默认的快照保存配置:
save 900 1 #900秒内如果超过1个key被修改,则发起快照保存
save 300 10 #300秒内容如超过10个key被修改,则发起快照保存
save 60 10000 #60秒内容如超过10000个key被修改,则发起快照保存 而AOF默认策略则为每秒钟一次fsync
当然你也可以设置不同的fsync策略,比如无fsync
或者每秒钟一次fsync,或者每次执行写入命令时fsync AOF文件有序地保存了对数据库执行的所有写入操作,
这些写入操作以Redis协议的格式保存。
因此AOF文件的内容非常容易被人读懂,对文件进行分析也很轻松。
导出AOF文件也非常简单:举个例子,如果你不小心执行了 FLUSHALL 命令,
但只要AOF文件未被重写,那么只要停止服务器,
移除AOF文件末尾的FLUSHALL命令,并重启Redis,
就可以将数据集恢复到FLUSHALL执行之前的状态。 有效地利用以上的RDB和AOF特性,能使Redis拥有足以媲美PostgreSQL的数据安全性。

2、为什么在从机AOF配置成功的情况下,主机开启AOF,主从数据瞬间被清空?

解答:首先得明白Redis有这么一个特性,即两种持久化同时开启的情况下,Redis启动默认加载AOF文件恢复数据。

Redis从机由于事先没有开启AOF,配置重启后,从机会生成一个空的AOF文件并默认加载,这时从机数据是空的,但由于配置了主从,从机会同步主机数据,所以你会发现新生成的AOF文件大小在迅速增长。因此Redis从机开启AOF后,数据最终是没有问题的。

这时候Redis主机也配置AOF并重启,主机生成AOF并默认加载,数据瞬间被清空,同时主机RDB发现60秒内有超过10000个key被修改,发起了快照保存,RDB数据也被清空。由于都是内存操作,所以非常快。最后再主从同步,所有数据被删。

3、两种持久化同时开启的情况下,Redis启动为什么默认选择加载AOF而不是RDB文件来恢复数据?

解答:AOF默认策略为每秒钟一次fsync,所以通常情况下,AOF文件所保存的数据相对RDB更完整。

4、AOF 持久化会记录服务器执行的所有写操作命令,那么数据被清空后,为什么不能通过AOF文件的日志记录恢复数据?

解答:Redis会自动地在后台对AOF进行重写,重写后的新AOF文件包含了恢复当前数据集所需的最小命令集合

为什么会重写?

因为AOF记录了服务器执行的所有写操作命令,而RDB本身又是一个非常紧凑的文件
所以对于相同的数据集来说,AOF文件的体积通常要大于RDB文件的体积
而体积大了终究不好,比如Redis重启默认加载AOF文件就要更多的时间

5、面试官如果问你,如何在不用【config set】命令的情况下,将Redis持久化由RDB切换到AOF,你怎么回答?

解答:呵呵,利用主从。。。从机配置AOF重启后,将生成的AOF文件复制至主机Redis数据目录,主机配置AOF后再重启。

注:在 Redis 2.2 或以上版本,通过【config set】可以在不重启的情况下,从 RDB 切换到 AOF。
1)为最新的 dump.rdb 文件创建一个备份。
2)将备份放到一个安全的地方。
3)执行以下两条命令:
redis-cli> CONFIG SET appendonly yes
redis-cli> CONFIG SET save "" 4)确保命令执行之后,数据库的键的数量没有改变。
5)确保写命令会被正确地追加到 AOF 文件的末尾。 步骤 3 执行的第一条命令开启了AOF功能:<font style="color:red">Redis会阻塞直到初始AOF文件创建完成为止</font>,之后Redis会继续处理命令请求, 并开始将写入命令追加到 AOF 文件末尾。
步骤 3 执行的第二条命令用于关闭RDB功能。这一步是可选的,如果你愿意的话,也可以同时使用RDB和AOF这两种持久化功能。 不过别忘了在redis.conf中打开AOF功能!否则的话,服务器重启之后,之前通过【CONFIG SET】设置的配置就会被遗忘,程序会按原来的配置来启动服务器。

Redis开启AOF导致的删库事件的更多相关文章

  1. redis 开启AOF 持久化

    redis 开启AOF 找到redis 安装目录 打开 redis.conf  修改以下参数: appendonly  yes        (默认no,关闭)表示是否开启AOF持久化: append ...

  2. redis 开启AOF

    找到redis 安装目录 例如 cd /usr/local/redis 打开 redis.conf  修改以下参数: # vi /usr/local/redis/etc/redis.conf appe ...

  3. 一个致命的 Redis 命令,导致公司损失 400 万!!

    最近安全事故濒发啊,前几天发生了<顺丰高级运维工程师的删库事件>,今天又看到了 PHP 工程师在线执行了 Redis 危险命令导致某公司损失 400 万.. 什么样的 Redis 命令会有 ...

  4. Redis的KEYS命令引起宕机事件

    摘要: 使用 Redis 的开发者必看,吸取教训啊! 原文:Redis 的 KEYS 命令引起 RDS 数据库雪崩,RDS 发生两次宕机,造成几百万的资金损失 作者:陈浩翔 Fundebug经授权转载 ...

  5. 写了Bug,误执行 rm -fr /*,我删删删删库了,要跑路吗?

    每日英语,每天进步一点点(偷笑): 前言 临近五一节,想到有 5 天假期,小林开始飘了. 写个简单的 Bash 脚本都不上心了,写完连检查都不检查,直接拖到到实体服务器跑. 结果一跑起来,发生不对劲, ...

  6. 【巨杉数据库SequoiaDB】巨杉Tech | “删库跑路”又出现,如何防范数据安全风险?

    最近,又双叕有企业被“删库”了.来自微盟官网的消息,微盟的业务系统数据库(包括主备)遭遇其公司运维人员的删除,系统将停止运营超48小时. 频发的类似事件也让大家对于数据安全的关注不断提高.数据是一个科 ...

  7. [转帖]Redis持久化--Redis宕机或者出现意外删库导致数据丢失--解决方案

    Redis持久化--Redis宕机或者出现意外删库导致数据丢失--解决方案 https://www.cnblogs.com/xlecho/p/11834011.html echo编辑整理,欢迎转载,转 ...

  8. Redis持久化--Redis宕机或者出现意外删库导致数据丢失--解决方案

    echo编辑整理,欢迎转载,转载请声明文章来源.欢迎添加echo微信(微信号:t2421499075)交流学习. 百战不败,依不自称常胜,百败不颓,依能奋力前行.--这才是真正的堪称强大!!! Red ...

  9. 删库到跑路?还得看这篇Redis数据库持久化与企业容灾备份恢复实战指南

    本章目录 0x00 数据持久化 1.RDB 方式 2.AOF 方式 如何抉择 RDB OR AOF? 0x01 备份容灾 一.备份 1.手动备份redis数据库 2.迁移Redis指定db-数据库 3 ...

随机推荐

  1. C#学习-静态

    有提过类的成员,有字段.属性.方法和构造函数等,也可以使用static关键字将其声明为类的静态成员. 静态成员属于类级别的概念,它不属于类的实例. 可以使用static关键字来声明静态字段,静态字段与 ...

  2. 基于Redis的分布式锁到底安全吗

    http://zhangtielei.com/posts/blog-redlock-reasoning.html

  3. Eclipse Memory Analyzer

    先写一段可以制造堆溢出的代码 package com.test.jvm.oom; import java.util.ArrayList; import java.util.List; /** * @d ...

  4. [转] babel-plugin-react-css-modules配置

    自己的react项目用到了css-modules,由于不太想在写className时写style.xxx于是google解决方案,找到了这货->babel-plugin-react-css-mo ...

  5. bzoj3769 spoj 8549 BST again

    题解: 比较水的题目 普通dp其实复杂度还是比较大的 可以任意模数ntt优化.. 但好像没人写.. 代码: #include <bits/stdc++.h> using namespace ...

  6. Python_二维数组

    例1:将数组旋转90度 a = [[i for i in range(4)] for n in range(4)] print(a) # 遍历大序列 for a_index, w in enumera ...

  7. Python_迭代器

    迭代器:迭代器里的元素读一个丢一个,不能回退,不能用下标访问 x.__next__():迭代器里唯一的方法,只读下一个 d = iter(['Presly', 'is', 'lovely', ]) p ...

  8. 大数据-kafka

    1Kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据. 作用:1发布和订阅消息流,这个功能类似于消息队列,这也是kafka归类为消息队列框架的原因 2以容错 ...

  9. php json_encode转换中文乱码

    $arr = ["a"=>'范德萨似懂非懂']; echo json_encode($arr,JSON_UNESCAPED_UNICODE);

  10. 046 SparlSQL中的函数

    一:SparkSQL中的函数 1.说明 2.展示所有的函数 qlContext.sql("show functions").show(300) 3.functions类 所有内置支 ...