整数集合(intset)是集合键的底层实现之一,当一个集合只包含整数值元素,并且这个集合的元素数量不多时,Redis就会使用整数集合作为集合键的底层实现。

intset可以保存类型为int16_t,int32_t,int64_t的整数值,并且保证集合中不会出现重复元素。

整数集合的结构体定义在intset.h中:

typedef struct intset {
uint32_t encoding;
uint32_t length;
int8_t contents[];
} intset;

encoding表示intset中保存的整数的编码,共有三种编码,分别是:INTSET_ENC_INT16、INTSET_ENC_INT32和INTSET_ENC_INT64。三种编码的定义如下:

#define INTSET_ENC_INT16 (sizeof(int16_t))
#define INTSET_ENC_INT32 (sizeof(int32_t))
#define INTSET_ENC_INT64 (sizeof(int64_t))

注意,编码在保存时是按照小端的方式保存的,也就是说在大端系统中,还需要将实际的编码值翻转之后,才能存储到encoding中,比如:is->encoding =intrev32ifbe(INTSET_ENC_INT16); 其中intrev32ifbe表示将32位整数按照字节进行翻转。

length表示intset中保存的整数个数。与encoding一样,它也是按照小端的方式保存的,在大端系统中,也需要将实际值翻转之后,才能存储到length中,比如:is->length = intrev32ifbe(len-1)。

contents是柔性数组成员,它是整数集合的底层实现:整数集合中的每个元素都是contents数组的一个数组项,各个项在数组中按值从小到大有序地排列,并且数组中不包含任何重复项。

虽然contents的类型是int8_t,但它可以保存类型为int16_t,int32_t,int64_t的整数值。可以将contents想象为一段连续的内存空间,该空间的实际大小是encoding*length。保存在contents中的整数,也是按照小端的方式保存的。

如果encoding属性的值为INTSET_ENC_INT16,那contents中保存的整数就是int16_t类型,范围是[-32768,32767]。如果encoding属性的值为INTSET_ENC_INT32,那contents中保存的整数就是int32_t类型,范围是[-2147483648, 2147483647]。如果encoding属性的值为INTSET_ENC_INT64,那contents中保存的整数就是int64_t类型,范围是[-9223372036854775808,9223372036854775807]。

将一个新元素添加到intset,且新元素的类型比整数集合现有所有元素的类型都要大时,整数集合需要先进行升级,然后才能将新元素添加到整数集合里面。升级intset并添加新元素的代码实现如下:

static intset *intsetUpgradeAndAdd(intset *is, int64_t value) {
uint8_t curenc = intrev32ifbe(is->encoding);
uint8_t newenc = _intsetValueEncoding(value);
int length = intrev32ifbe(is->length);
int prepend = value < 0 ? 1 : 0; /* First set new encoding and resize */
is->encoding = intrev32ifbe(newenc);
is = intsetResize(is,intrev32ifbe(is->length)+1); /* Upgrade back-to-front so we don't overwrite values.
* Note that the "prepend" variable is used to make sure we have an empty
* space at either the beginning or the end of the intset. */
while(length--)
_intsetSet(is,length+prepend,_intsetGetEncoded(is,length,curenc)); /* Set the value at the beginning or the end. */
if (prepend)
_intsetSet(is,0,value);
else
_intsetSet(is,intrev32ifbe(is->length),value);
is->length = intrev32ifbe(intrev32ifbe(is->length)+1);
return is;
}

该函数只有在升级插入时才会调用,也就是说新值value超出了is现有的编码范围,因此,value要么插入在索引0,要么插入在索引is->length。

首先获取is当前的编码curenc,当前长度length,并根据value得到其合适的编码newenc,newenc成为is在升级插入value后的新编码;

prepend用于升级is时,定位contents中原有元素的新索引。如果value为正数,则value需要插入到索引is->length中,因此prepend为0,表明contents原有元素的索引值保持不变。注意这并不意味着contents的内容保持不变,因为编码升级了,每个元素所占的内存空间也发生了变化,因此还需要重新设置每个索引的元素;

若value为负数,则说明value要插入到索引0中,因此prepend为1,表明contents原有元素需要后移一个索引;

然后更新is的encoding为newenc,并调用intsetResize重新申请is的空间;根据新的编码newenc,将is的contents中的原有元素,根据prepend的值重新放置;

最后根据prepend值,将value插入到0或length处;并更新is的length属性。

注意,intset不支持降级操作,一旦对intset进行了升级,编码就会一直保持升级后的状态。比如一个intset保存了1,2,3,4四个数,这四个数使用编码INTSET_ENC_INT16即可,后插入了4294967295,intset升级编码为INTSET_ENC_INT64。现在如果再把4294967295删除了,则intset中,虽然还是1,2,3,4四个数,但是编码依然保持为INTSET_ENC_INT64。

有关intset其他的代码实现,可以参阅:

https://github.com/gqtc/redis-3.0.5/blob/master/redis-3.0.5/src/intset.c

Redis源码解析:06整数集合的更多相关文章

  1. redis源码学习_整数集合

    redis里面的整数集合保存的都是整数,有int_16.int_32和int_64这3种类型,和C++中的set容器差不多. 同时具备如下特点: 1.set里面的数不重复,均为唯一. 2.set里面的 ...

  2. Redis源码解析之跳跃表(三)

    我们再来学习如何从跳跃表中查询数据,跳跃表本质上是一个链表,但它允许我们像数组一样定位某个索引区间内的节点,并且与数组不同的是,跳跃表允许我们将头节点L0层的前驱节点(即跳跃表分值最小的节点)zsl- ...

  3. .Net Core缓存组件(Redis)源码解析

    上一篇文章已经介绍了MemoryCache,MemoryCache存储的数据类型是Object,也说了Redis支持五中数据类型的存储,但是微软的Redis缓存组件只实现了Hash类型的存储.在分析源 ...

  4. Redis源码解析:15Resis主从复制之从节点流程

    Redis的主从复制功能,可以实现Redis实例的高可用,避免单个Redis 服务器的单点故障,并且可以实现负载均衡. 一:主从复制过程 Redis的复制功能分为同步(sync)和命令传播(comma ...

  5. Redis源码解析:13Redis中的事件驱动机制

    Redis中,处理网络IO时,采用的是事件驱动机制.但它没有使用libevent或者libev这样的库,而是自己实现了一个非常简单明了的事件驱动库ae_event,主要代码仅仅400行左右. 没有选择 ...

  6. redis源码解析之内存管理

    zmalloc.h的内容如下: void *zmalloc(size_t size); void *zcalloc(size_t size); void *zrealloc(void *ptr, si ...

  7. Redis源码解析

    一.src/server.c 中的redisCommandTable列出的所有redis支持的命令,其中字符串命令包括从get到mget:列表命令从rpush到rpoplpush:集合命令包括从sad ...

  8. Redis源码解析:26集群(二)键的分配与迁移

    Redis集群通过分片的方式来保存数据库中的键值对:一个集群中,每个键都通过哈希函数映射到一个槽位,整个集群共分16384个槽位,集群中每个主节点负责其中的一部分槽位. 当数据库中的16384个槽位都 ...

  9. Redis源码解析:25集群(一)握手、心跳消息以及下线检测

    Redis集群是Redis提供的分布式数据库方案,通过分片来进行数据共享,并提供复制和故障转移功能. 一:初始化 1:数据结构 在源码中,通过server.cluster记录整个集群当前的状态,比如集 ...

随机推荐

  1. css3动画性能优化

    css3的动画简单好用,但是性能方面存在一些问题,很多时候一不留神cpu就已经满了. 现在记下一些常用的技巧,去优化我们的css3的动画. 1. translate3d进行gpu加速 写动画的时候写个 ...

  2. 从零开始Android逆向教程(二)——什么是Xposed

    前言在阅读本文之前,假设你的手机已经root,并且已经成功安装好了 XposedInstaller. Xposed是什么?       Xposed 是一个 Android 平台上的动态劫持框架,通过 ...

  3. java并发系列(四)-----源码角度彻底理解ReentrantLock(重入锁)

    1.前言 ReentrantLock可以有公平锁和非公平锁的不同实现,只要在构造它的时候传入不同的布尔值,继续跟进下源码我们就能发现,关键在于实例化内部变量sync的方式不同,如下所示: /** * ...

  4. 多机MySQL一主双从详细安装主从复制

    多机MySQL一主双从详细安装 一.复制的工作原理 要想实现AB复制,那么前提是master上必须要开启二进制日志 1.首先master将数据更新记录到二进制日志文件 2.从slave start开始 ...

  5. 网站被攻击扫描SQL注入的日常记录

    我发了个博客,泄露了域名之后,便有人疯狂的尝试攻击我的站点,奈何我防守做得比较好,直接把网段封了,看到403还锲而不舍,我真是想给他颁奖了 查看ua,发现很多sqlmap的ua,肯定会是被刷了,只是运 ...

  6. 实用Jupyter Notebook扩展工具——提升你的工作效率

    Jupyter Notebook 现已成为数据分析,机器学习的必备工具.因为它可以让数据分析师集中精力向用户解释整个分析过程.通过安装一些扩展工具,可以让你在Jupyter Notebook上的工作效 ...

  7. GYM100741 A Queries

    A. Queries time limit per test 0.25 s memory limit per test 64 MB input standard input output standa ...

  8. xmlns详解(转载)

    我们经常会在网页中碰到形如<html xmlns=”http://www.w3.org/2001/xhtml”>这样的代码, 或在是android 编码中的main.xml中看到形如< ...

  9. 备考2019年6月份PMP考试-分享一些考试笔记(二)

    最新比较经典的100道试题,有备考的小伙伴可以练练手,文章末尾附答案. 1     一个项目经理在运作一个数据中心安装项目.他发现相关方很恼火,因为他超出了预算,原因是人员费用要高于原先的计划.另外项 ...

  10. Leetcode766.Toeplitz Matrix托普利茨矩阵

    如果一个矩阵的每一方向由左上到右下的对角线上具有相同元素,那么这个矩阵是托普利茨矩阵. 给定一个 M x N 的矩阵,当且仅当它是托普利茨矩阵时返回 True. 示例 1: 输入: matrix = ...