继续撸我们的对象和数据类型。

上节我们一起认识了字符串和列表,接下来还有哈希、集合和有序集合。

1 哈希对象

哈希对象的可选编码分别是:ziplist 和 hashtable。

1.1 ziplist 编码的哈希对象

ziplist 编码的哈希对象使用压缩列表作为底层实现。每当有新的键值对要加入到哈希对象时,程序会先将保存了的压缩列表节点推入到表尾,然后再将保存了的压缩列表节点推入到表尾。因此:

  • 保存了键值对的两个节点总是紧挨在一起,保存键的节点在前,保存值的节点在后;
  • 先添加到哈希对象中的键值对会被仿造压缩列表的表头方向,后添加的键值对会被放在压缩列表的表尾方向。

执行以下 HSET 命令,服务器将创建一个如图 9 所示的列表对象作为 profile 键的值:

127.0.0.1:6379> HSET profile name "Tom"
(integer) 1
127.0.0.1:6379> HSET profile age "25"
(integer) 1
127.0.0.1:6379> HSET profile career "Programer"
(integer) 1
127.0.0.1:6379> OBJECT ENCODING profile
"ziplist"

其中对象所使用的压缩列表如图 10 所示:

1.2 hashtable 编码的

hashtable 编码的哈希对象使用字典作为底层实现。哈希对象中的每个键值对都使用一个字典键值对来保存:

  • 字典中的每个键都是一个字符串对象,对象中保存了键值对的键;
  • 字典中的每个值都是一个字符串对象,对象中保存了键值对的值。

如果前面的 profile 键使用的是 hashtable 编码的哈希对象,那么这个哈希对象应该如图 11 所示:

1.3 编码转换

当哈希对象同时符合下面两个条件时,将使用 ziplist 编码:

  1. 哈希对象保存的所有键值对中,键和值的字符串长度都小于 64 个字节;
  2. 哈希对象保存的键值对数量小于 512 个。

上述条件中的临界值对应 redis.conf 文件中的配置:hash-max-ziplist-valuehash-max-ziplist-entries

在 3.2 版本中,新增一个哈希键值对时,实际上总是先创建一个 ziplist 编码的哈希对象,然后再进行转换检查。

关于何时进行编码转换,有两种情况发生:

  1. 更新或新增键值对时,如果值的字节数大于 hash-max-ziplist-value,将从 ziplist 编码转成 hashtable 编码;
  2. 新增键值对时,如果哈希中的键值对数量大于 hash-max-ziplist-entries,将从 ziplist 编码转成 hashtable 编码。

要注意的是,上述发生转换的情况,都不会出现从 hashtable 转成 ziplist 的情况,即使符合条件。

关于哈希编码转换的函数,可以参考 t_hash.c/hashTypeConvert,源码如下:

# o 是原始对象,enc 是目标编码。
void hashTypeConvert(robj *o, int enc) {
if (o->encoding == OBJ_ENCODING_ZIPLIST) { // 原始编码是 OBJ_ENCODING_ZIPLIST 才进行转换
hashTypeConvertZiplist(o, enc);
} else if (o->encoding == OBJ_ENCODING_HT) {
serverPanic("Not implemented");
} else {
serverPanic("Unknown hash encoding");
}
}

2 集合对象

集合对象的可选编码有:intset 和 hashtable。

2.1 intset 编码的集合对象

intset 编码的集合对象使用整数集合作为底层实现,集合对象包含的所有元素都被保存在整数集合里面。

执行以下 SADD 命令,将创建一个如图 12 所示的 intset 编码的集合对象:

127.0.0.1:6379> SADD numbers 1 3 5
(integer) 3
127.0.0.1:6379> OBJECT ENCODING numbers
"intset"

2.2 hashtable 编码的集合对象

hashtable 编码的集合对象使用字典作为底层实现,字典的每个键都是一个字符串对象,每个字符串对象中又包含了一个集合元素,而字典的值则全部设置为 NULL。

执行以下 SADD 命令,将创建一个如图 13 所示的 hashtable 编码的集合对象:

127.0.0.1:6379> SADD fruits "apple" "banana" "cherry"
(integer) 3
127.0.0.1:6379> OBJECT ENCODING fruits
"hashtable"

2.3 编码转换

当集合对象同时满足以下两个条件时,对象使用 intset 编码:

  1. 集合对象保存的所有元素都是可以被 long double 表示整数值;
  2. 集合对象保存的元素数量不超过 512 个。

上述条件中的临界值对应 redis.conf 文件中的配置:set-max-intset-entries

对于集合对象,在新增第一个键值对时,就会对键值对中的值进行检查,如果是符合条件的整数值,就会创建一个 intset 编码的集合对象,否则,则创建 hashtable 编码的集合对象。

关于何时进行编码转换,有两种情况发生:

  1. 更新或新增键值对时,如果不能用 long double 表示,将从 intset 编码转成 hashtable 编码;
  2. 新增键值对时,如果集合中的键值对数量大于 set-max-intset-entries,将从 intset 编码转成 hashtable 编码。

同样,上述发生转换的情况,都不会出现从 hashtable 转成 intset 的情况,即使符合条件。

关于哈希编码转换的函数,可以参考 t_set.c/setTypeConvert,源码如下:

# setobj 是原始对象,enc 是目标编码。
hvoid setTypeConvert(robj *setobj, int enc) {
setTypeIterator *si;
serverAssertWithInfo(NULL,setobj,setobj->type == OBJ_SET && setobj->encoding == OBJ_ENCODING_INTSET);
if (enc == OBJ_ENCODING_HT) { // 只能转成 OBJ_ENCODING_HT 编码
int64_t intele;
dict *d = dictCreate(&setDictType,NULL);
robj *element;
/* Presize the dict to avoid rehashing */
dictExpand(d,intsetLen(setobj->ptr));
/* To add the elements we extract integers and create redis objects */
si = setTypeInitIterator(setobj);
while (setTypeNext(si,&element,&intele) != -1) {
element = createStringObjectFromLongLong(intele);
serverAssertWithInfo(NULL,element,
dictAdd(d,element,NULL) == DICT_OK);
}
setTypeReleaseIterator(si);
setobj->encoding = OBJ_ENCODING_HT;
zfree(setobj->ptr);
setobj->ptr = d;
} else {
serverPanic("Unsupported set conversion");
}
}

3 有序集合对象

有序集合对象的可选编码有:ziplist 和 skiplist。

3.1 ziplist 编码的有序集合对象

intset 编码的集合对象使用压缩列表作为底层实现。每个集合元素使用两个紧挨在一起的压缩列表节点来保存。第一个节点保存元素的成员(member),第二个成员保存元素的分值(score)。

压缩列表内的集合元素按分值从小到大排序,分值较小的元素被放置在表头的方向,而分值较大的元素则被放置在靠近表尾的方向。

执行以下 SADD 命令,将创建一个如图 14 所示的 ziplist 编码的集合对象:

127.0.0.1:6379> ZADD price 8.5 apple 5.0 banana 6.0 cherry
(integer) 3
127.0.0.1:6379> OBJECT ENCODING price
"ziplist"

底层结构 ziplist 如图 15 所示:

3.2 skiplist 编码的集合对象

skiplist 编码的集合对象使用 zset 作为底层实现。一个 zset 结构同时包含一个字典和一个跳跃表。结构源码如下:

# server.h
typedef struct zset {
dict *dict;
zskiplist *zsl;
} zset;

zset 结构中的 zsl 跳跃表按分值从小到大保存了所有集合元素,每个跳跃表节点都保存了一个集合元素。

跳跃表节点的 object 属性保存了元素的成员,而跳跃表节点的 score 属性则保存了元素的分支。**程序通过这个跳跃表,对有序集合进行范围型操作。比如 ZRANK、ZRANGE 等命令就是基于跳跃表 API 来实现的。

除此之外,zset 结构中的 dict 字典为有序集合创建了一个从成员到分值的映射。字典中的每个键值对都保存了一个集合元素:字典中的键保存了元素的成员,而字典的值则保存了元素的分值。通过这个字典,程序用 O(1) 复杂度查找给定成员的分值。

有序集合每个元素的成员都是一个字符串对象,而每个元素的分值都是一个 double 类型的浮点数。值得一提的是,虽然 zset 结构同时使用跳跃表和字典保存了有序集合的元素,但这两种数据结构都会通过指针来共享相同元素的成员和分值,所以不会产生任何重复成员和分值,也不会因此而浪费额外的内存。

如果前面 price 键创建的不是 ziplist 编码的有序集合对象,而是 skiplist 编码,那么这个有序集合对象将会如图 16 所示,而对象所使用的 zset 结果将会如图 17 所示:

图 17 中,为了展示方便,重复展示了各个元素的成员和分值。实际上,它们是共享元素的成员和分值。

3.3 编码转换

当有序集合对象同时满足以下两个条件时,对象使用 ziplist 编码:

  1. 有序集合对象保存的元素数量不超过 128 个。
  2. 有序集合中保存的所有元素成员的长度都小于 64 个字节。

上述条件中的临界值对应 redis.conf 文件中的配置:zset-max-ziplist-entrieszset-max-ziplist-value

对于集合对象,在新增键值对时,就会对集合元素以及键值对中的值进行检查,如果是符合条件,就会创建一个 ziplist 编码的集合对象,否则,则创建 skiplist 编码的集合对象。对应源码如下:

# t_zset.c/zaddGenericCommand
...
zobj = lookupKeyWrite(c->db,key);
if (zobj == NULL) {
if (xx) goto reply_to_client; /* No key + XX option: nothing to do. */
if (server.zset_max_ziplist_entries == 0 ||
server.zset_max_ziplist_value < sdslen(c->argv[scoreidx+1]->ptr))
{
# 对象元素数量为 0,或者
zobj = createZsetObject();
} else {
zobj = createZsetZiplistObject();
}
dbAdd(c->db,key,zobj);
} else {
if (zobj->type != OBJ_ZSET) {
addReply(c,shared.wrongtypeerr);
goto cleanup;
}
}

总结

  1. 哈希对象有 ziplisthashtable 编码。
  2. 集合对象有 intsethashtable 编码。
  3. 有序集合对象有 ziplistskiplist 编码。

跟着大彬读源码 - Redis 6 - 对象和数据类型(下)的更多相关文章

  1. 跟着大彬读源码 - Redis 5 - 对象和数据类型(上)

    相信很多人应该都知道 Redis 有五种数据类型:字符串.列表.哈希.集合和有序集合.但这五种数据类型是什么含义?Redis 的数据又是怎样存储的?今天我们一起来认识下 Redis 这五种数据结构的含 ...

  2. 跟着大彬读源码 - Redis 7 - 对象编码之简单动态字符串

    Redis 没有直接使用 C 语言传统的字符串表示(以空字符串结尾的字符数组),而是构建了一种名为简单动态字符串(simple dynamic string)的抽象类型,并将 SDS 用作 Redis ...

  3. 跟着大彬读源码 - Redis 8 - 对象编码之字典

    目录 1 字典的实现 2 插入算法 3 rehash 与 渐进式 rehash 总结 字典,是一种用于保存键值对的抽象数据结构.由于 C 语言没有内置字典这种数据结构,因此 Redis 构建了自己的字 ...

  4. 跟着大彬读源码 - Redis 9 - 对象编码之 三种list

    目录 1 ziplist 2 skiplist 3 quicklist 总结 Redis 底层使用了 ziplist.skiplist 和 quicklist 三种 list 结构来实现相关对象.顾名 ...

  5. 跟着大彬读源码 - Redis 10 - 对象编码之整数集合

    [TOC] 整数集合是 Redis 集合键的底层实现之一.当一个集合只包含整数值元素,并且元素数量不多时,Redis 就会使用整数集合作为集合键的底层实现. 1 整数集合的实现 整数集合是 Redis ...

  6. 跟着大彬读源码 - Redis 1 - 启动服务,程序都干了什么?

    一直很羡慕那些能读 Redis 源码的童鞋,也一直想自己解读一遍,但迫于 C 大魔王的压力,解读日期遥遥无期. 相信很多小伙伴应该也都对或曾对源码感兴趣,但一来觉得自己不会 C 语言,二来也不知从何入 ...

  7. 跟着大彬读源码 - Redis 2 - 服务器如何响应客户端请求?(上)

    上次我们通过问题"启动服务器,程序都干了什么?",跟着源码,深入了解了 Redis 服务器的启动过程. 既然启动了 Redis 服务器,那我们就要连上 Redis 服务干些事情.这 ...

  8. 跟着大彬读源码 - Redis 3 - 服务器如何响应客户端请求?(下)

    继续我们上一节的讨论.服务器启动了,客户端也发送命令了.接下来,就要到服务器"表演"的时刻了. 1 服务器处理 服务器读取到命令请求后,会进行一系列的处理. 1.1 读取命令请求 ...

  9. 跟着大彬读源码 - Redis 4 - 服务器的事件驱动有什么含义?(上)

    众所周知,Redis 服务器是一个事件驱动程序.那么事件驱动对于 Redis 而言有什么含义?源码中又是如何实现事件驱动的呢?今天,我们一起来认识下 Redis 服务器的事件驱动. 对于 Redis ...

随机推荐

  1. PNG透明窗体全攻略(控件不透明)

    http://blog.csdn.net/riklin/article/details/4417247 看好了,这是XP系统,未装.net.我的Photoshop学的不太好,把玻璃片弄的太透了些,如果 ...

  2. 原生Js封装的产品图片360度展示

    挺简单的一段程序,但是效果不错: 1.把需要展示的36张图片先预加载到浏览器缓存里 2.给展示图片的div添加方法 3.通过鼠标左右移动的像素转换图片 在线效果预览:http://jsfiddle.n ...

  3. SAP TABLECONTROL 自定义SEARCH HELP

    项目上需要开发一个界面如下的应用程序.这是一个MB1A发料的辅助程序,限制住移动类型和在特定字段写入产品号. 这个应用程序的主要功能毫无疑问是通过BAPI实现的.但在TABLECONTROL中需要对填 ...

  4. Hadoop集群(第5期)SecureCRT使用

    1.SecureCRT简介   SecureCRT是一款支持SSH(SSH1和SSH2)的终端仿真程序,同时支持Telnet和rlogin协议.SecureCRT是一款用于连接运行包括Windows. ...

  5. 30411MySQL安装与配置_win10

    1 下载 1.1下载地址 下载地址  https://downloads.mysql.com/archives/community/ 1.2 选择适合自己的版本并下载 1.3 将下载文件解压至自定义路 ...

  6. Application生命周期(一)

    1.Application是什么? Application和Activity,Service一样,是android框架的一个系统组件,当android程序启动时系统会创建一个 application对 ...

  7. 工作中vue项目前后端分离,调用后端本地接口出现跨域问题的完美解决

    在我们实际开发中,选择不错的前端框架可以为我们省掉很多时间,当然,有时我们也会遇到很多坑. 最近在做vue项目时就遇到了跨域问题,一般来说,出现跨域我们第一反应使用jsonp,但是这个只支持get请求 ...

  8. Azkaban学习之路(二)—— Azkaban 3.x 编译及部署

    一.Azkaban 源码编译 1.1 下载并解压 Azkaban 在3.0版本之后就不提供对应的安装包,需要自己下载源码进行编译. 下载所需版本的源码,Azkaban的源码托管在GitHub上,地址为 ...

  9. 系统学习 Java IO (六)----管道流 PipedInputStream/PipedOutputStream

    目录:系统学习 Java IO---- 目录,概览 PipedInputStream 类使得可以作为字节流读取管道的内容. 管道是同一 JVM 内的线程之间的通信通道. 使用两个已连接的管道流时,要为 ...

  10. (数据科学学习手札62)详解seaborn中的kdeplot、rugplot、distplot与jointplot

    一.简介 seaborn是Python中基于matplotlib的具有更多可视化功能和更优美绘图风格的绘图模块,当我们想要探索单个或一对数据分布上的特征时,可以使用到seaborn中内置的若干函数对数 ...