RDB 是什么

Redis *.rdb 是内存的二进制文件，通过 *.rdb 能够完全回复 Redis 的运行状态。

![](http://yano.oss-cn-beijing.aliyuncs.com/blog/

20220218175013.png?x-oss-process=style/yano)

RDB 文件格式

Header

RDB 文件的头部占用 9bytes，前 5bytes 为 Magic String, 后 4bytes 为版本号；

52 45 44 49 53 #"REDIS", 就像 java 的 class 文件以 0xCAFEBABE 开头一样

30 30 30 36    #RDB 版本号，30 表示‘0’，版本号为 0006＝6

注意：版本号是字符串而不是整型：

snprintf(magic,sizeof(magic),"REDIS%04d",RDB_VERSION);

RDB_VERSION 详细信息可参考：Redis RDB Version History

Body

DB Selector

FE 开头表示后跟表示 DB Selector，例如：

FE 00   #FE 表明数据库的哪个 db，此处为 db0

注意：DB Selector 长度不固定，具体的编码方式请参见后文的 Length 编码。

AUX Fields

FA 开头表示后跟 AUX Fields, 记录生成 Dump 文件的 Redis 相关信息，例如 redis-ver、redis-bits、used-mem、aof-preamble 和 repl-id 等。这些信息采用 String 编码；

注意：redis3.0 版本的 RDB 版本号为 6，redis3.2 的版本号为 7；

Key-Value

key-value 有三种格式：

expire 为 second

FD $unsigned int    #失效时间（秒），4 个字节

$value-type         #1 个字节，表明数据类型：set,map 等

$string-encoded-key #key 值，字符串类型

$encoded-value      #value, 编码方式和类型有关

expire 为 millisecond

FC $unsigned long    #失效时间（毫秒），8 个字节

$value-type          #数据类型，1 个字节

$string-encoded-key  #key，字符串类型

$encoded-value       #value, 编码方式和类型有关

无 expire

$value-type         #数据类型，1 个字节

$string-encoded-key #key，字符串类型

$encoded-value      #value, 编码方式和类型有关

Footer

FF              #RDB 文件的结束

8byte checksum #循环冗余校验码，Redis 采用 crc-64-jones 算法，初始值为 0

编码算法说明

Length 编码

长度采用 BigEndian 格式存储，为无符号整数

如果以"00"开头，那么接下来的 6 个 bit 表示长度；
如果以“01”开头，那么接下来的 14 个 bit 表示长度；
如果以"10"开头，该 byte 的剩余 6bit 废弃，接着读入 4 个 bytes 表示长度 (BigEndian)；
如果以"11"开头，那么接下来的 6 个 bit 表示特殊的编码格式，一般用来存储数字：

0 表示用接下来的 1byte 表示长度
1 表示用接下来的 2bytes 表示长度；
2 表示用接下来的 4bytes 表示长度；

String 编码

该编码方式首先采用 Length 编码进行解析：

从上面的Length 编码知道，如果以"00","01","10"开头，首先读取长度；然后从接下来的内容中读取指定长度的字符；
如果以"11"开头，而且接下来的 6 个字节为“0”、“1”和“2”, 那么直接读取接下来的 1，2，4bytes 做为字符串的内容（实际上存储的是数字，只不过按照字符串的格式存储）；
如果以“11”开头，而且接下来的 6 个字节为"3", 表明采用 LZF 压缩字符串格式：

LZF 编码的解析步骤为：

首先采用Length 编码读取压缩后字符串的长度 clen;
接着采用Length 编码读取压缩前的字符串长度；
读取 clen 长度的字节，并采用 lzf 算法解压得到原始的字符串

Score 编码

读取 1 个字节，如果为 255，则返回负无穷；
如果为 254，返回正无穷；
如果为 253，返回非数字；
否则，将该字节的值做为长度，读取该长度的字节，将结果做为分值；

Value 编码

Redis 中的 value 编码包括如下类型：

其中 String 编码在前面已经介绍过，接下来逐一介绍其他的 9 种编码方式；

List

首先用 Length 编码读取 List 的长度 lsize；
采用 String 编码读取 lsize 个字符串

Set

同 List

Sorted Set

首先用 Length 编码读取 Sorted Set 的长度 zsize；
采用 String 编码读取字符串，采用 Score 编码读取分值；
循环读取 zsize 次；

Hash

采用 Length 编码读取 Hash 的大小 hsize；
采用 String 编码读取 2*hsize 的字符串，按照 key,value 的方式组装成 Map

Zipmap

用于存储 hashmap,Redis2.6 之后，该编码被废弃，转而采用 Ziplist 编码；

采用 String 编码读取整个 zipmap 字符串，hashmap 字符串的格式为：

<zmlen><len>"foo"<len><free>"bar"<len>"hello"<len><free>"world"<zmend>

zmlen: 一个字节，Zipmap 的大小；如果>=254, 意味着 zipmap 的大小无法直接获取到，必须要遍历整个 zipmap 才能得到大小；
len: 字符串长度，1 或 5 个字节长度；如果第一个字节在 0~252 之间，那么长度为第一个字节；如果为 253, 那么接下来的 4 个字节表示长度；254 和 255 是无效值；
free:1 字节，表明 value 空闲的字节数；
zmend:0xff, 表示 Zipmap 的结尾；

Ziplist

采用 String 编码读取整个 ziplist 字符串，字符串的格式为：

<zlbytes><zltail><zllen><entry><entry><zlend>

zlbytes:4 字节无符号整数，表示 ziplist 占用的总字节数；
zltail:4 字节无符号整数 (little endian), 表示尾元素的偏移量；
zllen:2 字节无符号整数 (little endian), 表示 ziplist 中的元素个数，当元素个数大于 65535 时，无法用 2 字节表示，需要遍历列表获取元素个数；
entry:ziplist 中的元素；
zlend: 常量 (0xff), 表示 ziplist 的结尾；

entry 的格式：

<length-prev-entry><encoding><content>

lenth-prev-entry: 如果第一个字节<254, 则用 1bytes 表示长度；否则则用接下来的 4bytes（无符号整数）表示长度；
encoding

"00"开头：字符串，用接下来的 6bit 表示长度；
"01"开头：字符串，用接下来的 14bit 表示长度；
"10"开头：字符串，忽略本字节的 6bit, 用接下来的 32bit 表示长度；
"11000000"开头：整数，内容为接下来的 16bit；
"11010000"开头：整数，内容为接下来的 32bit；
"11100000"开头：整数，内容为接下来的 64bit；
"11110000"开头：整数，内容为接下来的 24bit；
"11111110"开头：整数，内容为接下来的 8bit；
"1111"开头：整数，内容为接下来的 4bit 的值减去 1；

content

entry 内容，它的长度通过前面的 encoding 确定；

注意：元素长度、内容长度等都是采用 Little Endian 编码；

Intset

Intset 是一个整数组成的二叉树；当 set 的所有元素都是整形的时候，Redis 会采用该编码进行存储；Inset 最大可以支持 64bit 的整数，做为优化，如果整数可以用更少的字节数表示，Redis 可能会用 16~32bit 来表示；注意的是当插入一个长度不一样的整数时，有可能会引起整个存储结构的变化；

由于 Intset 是一个二叉树，因此它的元素都是排序过的；

采用 String 编码读取整个 intset 字符串，字符串的格式为：

<encoding><length-of-contents><contents>

encoding:32bit 的无符号整数；可选值包括 2、4 和 8；表示 inset 中的每个整数占用的字节数；
length-of-contents:32bit 无符号整数，表示 Intset 中包含的整数个数；
contents: 整数数组，长度由 length-of-contents 决定；

Sorted Set in Ziplist Encoding

采用 Ziplist 编码，区别在于用两个 entry 分别表示元素和分值；

Hashmap in Ziplist Encoding

采用 Ziplist 编码，区别在于用两个 entry 分别表示 key 和 value;

实际例子

本篇文章在本地安装并启动 Redis 服务，保存一个 string 类型的字符串，save 之后查看保存的 rdb 文件的二进制。

安装、启动 Redis

下载见：Redis Download

启动 Redis server：

src/redis-server&

启动一个 Redis client：

src/redis-cli

保存字符串

127.0.0.1:6379> set name yano

OK

保存 RDB 文件

127.0.0.1:6379> save

80277:M 15 Feb 2022 10:51:07.308 * DB saved on disk

OK

在刚执行 redis-cli 的目录下，就生成了 rdb 文件，文件名是 dump.rdb。

分析 RDB 文件

使用 hexedit 命令分析 dump.rdb 文件：

hexedit dump.rdb

dump.rdb 文件内容如下：

本篇文章只是分析 rdb 文件的基本结构和格式，只保存了一个最基础的 string。（图画了一个小时）RDB 这块的 Redis 源码就不分析了，基本上都是按照这个结构来的。

参考链接

Redis 源码简洁剖析系列

最简洁的 Redis 源码剖析系列文章

Java 编程思想-最全思维导图-GitHub 下载链接，需要的小伙伴可以自取~

原创不易，希望大家转载时请先联系我，并标注原文链接。

Redis 源码简洁剖析 13 - RDB 文件的更多相关文章

Redis 源码简洁剖析 11 - 主 IO 线程及 Redis 6.0 多 IO 线程
Redis 到底是不是单线程的程序? 多 IO 线程的初始化 IO 线程运行函数 IOThreadMain 如何推迟客户端「读」操作? 如何推迟客户端「写」操作? 如何把待「读」客户端分配给 IO 线 ...
Redis 源码简洁剖析 03 - Dict Hash 基础
Redis Hash 源码 Redis Hash 数据结构 Redis rehash 原理为什么要 rehash? Redis dict 数据结构 Redis rehash 过程什么时候触发 re ...
Redis 源码简洁剖析 06 - quicklist 和 listpack
quicklist 为什么要设计 quicklist 特点数据结构 quicklistCreate quicklistDelIndex quicklistDelEntry quicklistInse ...
Redis 源码简洁剖析 07 - main 函数启动
前言问题阶段 1:基本初始化阶段 2:检查哨兵模式,执行 RDB 或 AOF 检测阶段 3:运行参数解析阶段 4:初始化 server 资源管理初始化数据库创建事件驱动框架阶段 5:执 ...
Redis 源码简洁剖析 16 - 客户端
整体概述客户端属性套接字描述符标志输入缓冲区命名及命令参数命令的实现函数输出缓冲区客户端的创建与关闭创建普通客户端关闭普通客户端参考链接 Redis 源码简洁剖析系列整体概述 ...
Redis 源码简洁剖析 05 - ziplist 压缩列表
ziplist 是什么 Redis 哪些数据结构使用了 ziplist? ziplist 特点优点缺点 ziplist 数据结构 ziplist 节点 pre_entry_length encod ...
Redis 源码简洁剖析 09 - Reactor 模型
Reactor 模型事件驱动框架 Redis 如何实现 Reactor 模型事件的数据结构:aeFileEvent 主循环:aeMain 函数事件捕获与分发:aeProcessEvents 函数 ...
Redis 源码简洁剖析 10 - aeEventLoop 及事件
aeEventLoop IO 事件处理 IO 事件创建读事件处理写事件处理时间事件处理时间事件定义时间事件创建时间事件回调函数时间事件的触发处理参考链接 Redis 源码简洁剖析系列 ...
Redis 源码简洁剖析 12 - 一条命令的处理过程
命令的处理过程 Redis server 和一个客户端建立连接后,会在事件驱动框架中注册可读事件--客户端的命令请求.命令处理对应 4 个阶段: 命令读取:对应 readQueryFromClient ...

随机推荐

Go语言系列之单元测试
go test工具 Go语言中的测试依赖go test命令.编写测试代码和编写普通的Go代码过程是类似的,并不需要学习新的语法.规则或工具. go test命令是一个按照一定约定和组织的测试代码的驱动 ...
前端 vue 等刷新清浏览器缓存的方法
vue开发过程中发现内存一直往上飙,360时不时的提示下清理内存,测试发现每刷新一次页面内存就增加1%. 清掉浏览器的缓存等各种数据以后内存明显变小,刷新页面导致内存爆表. 这种问题着实不应该存在,记 ...
【洛谷】P1067 多项式输出
原题链接:P1067 多项式输出题目分析:学长推荐的OJ网站 --洛谷,发现挺好用的还可以下载提交出错的数据. 废话就不多说了,这道题属于基础题.提交出错主要是因为一些小细节不到位,这里就不一一赘述 ...
Flutter 2022 产品路线图发布
为了提升产品的透明性,每年年初 Flutter 团队都会发布今年度的产品路线图,以帮助使用 Flutter 的团队和开发者们根据这些优先事项制定计划. 2022 年 Flutter 团队将重点通过关注 ...
机器学习&恶意代码静态检测
目录分析工具方法概述二进制灰度图字节(熵)直方图字符串信息 ELF结构信息源码分析与OPcode FCG references: 分析工具 readelf elfparser ninja ...
【JavaWeb】CVE-2016-4437 Shiro反序列化漏洞分析及代码审计
Shiro反序列化漏洞分析及代码审计漏洞简介 Apache Shiro是一个强大且易用的Java安全框架,执行身份验证.授权.密码和会话管理. Apache Shiro默认使用了CookieRe ...
Cesium中级教程2 - 图层
Cesium中文网:http://cesiumcn.org/ | 国内快速访问:http://cesium.coinidea.com/ Cesium支持从几个标准服务绘制和添加高分辨率图像(地图)图层 ...
ManualResetEvent实现线程的暂停与恢复
背景前些天遇到一个需求,在没有第三方源码的情况下,刷新一个第三方UI,并且拦截到其ajax请求的返回结果.当结果为AVALIABLE的时候,停止刷新并语音提示,否则继续刷新. 分析这个需求,发现需要 ...
Mac系统U盘制作教程
您可以将外置驱动器或备用宗卷用作安装 Mac 操作系统的启动磁盘. 以下高级步骤主要适用于系统管理员以及熟悉命令行的其他人员.升级 macOS 或重新安装 macOS 不需要可引导安装器,但如果您要在 ...
【Vulnhub靶场】EMPIRE: BREAKOUT
环境准备下载靶机,导入到vmware里面,这应该不用教了吧开机可以看到,他已经给出了靶机的IP地址,就不用我们自己去探测了攻击机IP地址为:192.168.2.15 靶机IP地址为:192.16 ...

Redis 源码简洁剖析 13 - RDB 文件