intset介绍

intset 整数集合,当一个集合只有整数元素,且元素数量不多时,Redis 就会用整数集合作为集合键的底层实现。

redis> SADD numbers 1 3 5 7 9

(integer 5)

redis> OBJECT ENCODING numbers

(inset)

为什么要用 intset?

集合键的另外一种实现是值为空的散列表(hash table),当元素比较少时,用hash table 存就比较浪费内存,而用

intset 就比较节约内存。

整数集合实现

intset 结构定义:

// https://github.com/redis/redis/blob/3.0/src/intset.h#L35
typedef struct intset {
uint32_t encoding; // 编码格式, 这个格式有3种,见下面
uint32_t length; // 集合元素的数量
int8_t contents[]; // 保存元素的数组
} intset; // https://github.com/redis/redis/blob/3.0/src/intset.c#L40
/* Note that these encodings are ordered, so:
* INTSET_ENC_INT16 < INTSET_ENC_INT32 < INTSET_ENC_INT64. */
#define INTSET_ENC_INT16 (sizeof(int16_t)) // 16位2个字节
#define INTSET_ENC_INT32 (sizeof(int32_t)) // 32位4个字节
#define INTSET_ENC_INT64 (sizeof(int64_t)) // 64位8个字节

intset 整数集合结构示意图:

虽然,intset 整数集合里字段 contents 声明是 int8_t 数据类型,但是 contents 存储的数据类型是根据 encoding 属性值来确定的。

  • encoding 值为 INTSET_ENC_INT16 时,contents 就是一个 int16_t 类型的数组,数组里每一项都是 int16_t 类型的整数值。最小值为 -32768,最大值为 32767。
  • 同理,encoding 值为 INTSET_ENC_INT32 时,contents 就是一个 int32_t 类型的数组,数组里每一项都是 int32_t 类型的整数值。最小值为 -2,147,483,648,最大值为 2,147,483,647。
  • 同理,encoding 值为 INTSET_ENC_INT64 时,contents 就是一个 int64_t 类型的数组,数组里每一项都是 int64_t 类型的整数值。最小值为 -9,223,372,036,854,775,808,最大值为 9,223,372,036,854,775,807。

encoding 的值为什么有 3 种呢?

为了节省内存。redis 可以根据存储的元素数值大小,选择合适的类型来存储。

比如添加新元素时,元素整数值超过了当前编码格式能表示的范围,就升级数据类型。

整数集合操作的一些 API

整数集合操作一些 API:

// https://github.com/redis/redis/blob/3.0/src/intset.h#L41
intset *intsetNew(void); // 创建空集合
intset *intsetAdd(intset *is, int64_t value, uint8_t *success); // 将 value 添加到 is 集合中
intset *intsetRemove(intset *is, int64_t value, int *success); // 将 value 从 is 集合中移除
uint8_t intsetFind(intset *is, int64_t value); // 在结合 is 中搜索 value 元素,成功返回1,失败返回0
int64_t intsetRandom(intset *is); // 随机返回一个元素
uint8_t intsetGet(intset *is, uint32_t pos, int64_t *value); // 获取下标为pos的元素值并保持在value中
uint32_t intsetLen(intset *is); // 计算集合中元素个数
size_t intsetBlobLen(intset *is); // 计算集合中元素所占字节总数

获取元素编码格式函数:

_intsetValueEncoding

// https://github.com/redis/redis/blob/3.0/src/intset.c#L45
/* Return the required encoding for the provided value. */
static uint8_t _intsetValueEncoding(int64_t v) {
if (v < INT32_MIN || v > INT32_MAX)
return INTSET_ENC_INT64;
else if (v < INT16_MIN || v > INT16_MAX)
return INTSET_ENC_INT32;
else
return INTSET_ENC_INT16;
}

参考

Redis原理再学习05:数据结构-整数集合intset的更多相关文章

  1. redis 底层数据结构 整数集合intset

    整数集合是集合键的底层实现之一,当一个集合只包含整数值元素,并且这个集合的元素数量不多时Redis就会使用整数集合作为集合键的底层实现 整数集合是Redis用于保存整数值的集合抽象数据结构,它可以保存 ...

  2. Redis原理再学习04:数据结构-哈希表hash表(dict字典)

    哈希函数简介 哈希函数(hash function),又叫散列函数,哈希算法.散列函数把数据"压缩"成摘要,有的也叫"指纹",它使数据量变小且数据格式大小也固定 ...

  3. Redis数据结构—整数集合与压缩列表

    目录 Redis数据结构-整数集合与压缩列表 整数集合的实现 整数集合的升级 整数集合不支持降级 压缩列表的构成 压缩列表节点的构成 小结 Redis数据结构-整数集合与压缩列表 大家好,我是白泽.今 ...

  4. Redis数据结构之整数集合-intset

    当一个集合只包含整数值元素,并且这个集合的元素数量不多时,Redis会使用整数集合(intset)来存储集合元素. intset是紧凑的数组结构,同时支持16位.32位和64位整数. 结构 struc ...

  5. 学习javascript数据结构(三)——集合

    前言 总括: 本文讲解了数据结构中的[集合]概念,并使用javascript实现了集合. 原文博客地址:学习javascript数据结构(三)--集合 知乎专栏&&简书专题:前端进击者 ...

  6. Redis源码解析:06整数集合

    整数集合(intset)是集合键的底层实现之一,当一个集合只包含整数值元素,并且这个集合的元素数量不多时,Redis就会使用整数集合作为集合键的底层实现. intset可以保存类型为int16_t,i ...

  7. redis 5.0.7 源码阅读——整数集合intset

    redis中整数集合intset相关的文件为:intset.h与intset.c intset的所有操作与操作一个排序整形数组 int a[N]类似,只是根据类型做了内存上的优化. 一.数据结构 ty ...

  8. 多图解释Redis的整数集合intset升级过程

    redis源码分析系列文章 [Redis源码系列]在Liunx安装和常见API 为什么要从Redis源码分析 String底层实现——动态字符串SDS 双向链表都不懂,还说懂Redis? 面试官:说说 ...

  9. 大数据技术之_16_Scala学习_07_数据结构(上)-集合

    第十章 数据结构(上)-集合10.1 数据结构特点10.1.1 Scala 集合基本介绍10.1.2 可变集合和不可变集合举例10.2 Scala 不可变集合继承层次一览图10.2.1 图10.2.2 ...

随机推荐

  1. 常用获取inflate的写法

    1.             //context:上下文, resource:要转换成view对象的layout的id, root:将layout用root(ViewGroup)包一层作为codify ...

  2. Ext原码学习之Ext-more.js

    // JavaScript Document Ext.apply(Ext,{ userAgent:navigator.userAgent.toLowerCase(), cache:{}, isSeed ...

  3. Java访问修饰符和三大特征(封装,继承和多态)

    一.访问修饰符基本介绍: java提供四种访问控制修饰符号,用于控制方法和属性(成员变量)的访问权限(范围): 1.公开级别:用public修饰,对外公开2.受保护级别:用protected修饰,对子 ...

  4. LeetCode随缘刷题之最长回文子串

    这一题我用的相对比较笨的方法. 相对于大佬们用的动态规划法,比较复杂.但却更容易理解,我主要是通过记录下标来确定最长回文串的. package leetcode.day_12_06; /** * 给你 ...

  5. Python中set集合常用操作

    功能 Python符号 Python方法 备注 交集 & intersection, intersection_update &:取两者交集>>> set3 = se ...

  6. python官网导航翻译

  7. Solution -「ABC 213G」Connectivity 2

    \(\mathcal{Description}\)   Link.   给定简单无向图 \(G=(V,E)\),点的编号从 \(1\) 到 \(|V|=n\).对于 \(k=2..n\),求 \(H= ...

  8. Spring Boot数据访问之多数据源配置及数据源动态切换

    如果一个数据库数据量过大,考虑到分库分表和读写分离需要动态的切换到相应的数据库进行相关操作,这样就会有多个数据源.对于一个数据源的配置在Spring Boot数据访问之数据源自动配置 - 池塘里洗澡的 ...

  9. 图文并茂详解 NAT 协议!

    什么是 NAT 协议 我们的计算机要想访问互联网上的信息,就需要一个地址,而且这个地址是大家(其他主机)所认可的,是公共的,这个地址也叫做公有 IP 地址. 与之相对的,除了公有 IP 地址外,还有私 ...

  10. Gateway 简介

    概述 微服务可能分布在不同的主机上,这样有许多缺点:前端需要硬编码调用不同地址的微服务很麻烦:存在跨域访问的问题:微服务地址直接暴露是不安全的.还有所以需要为前端提供一个统一的访问入口.Gateway ...