Redis设计与实现-内部数据结构篇

题记:这本书是2015年11月份开始读的,大约花了一个多月的时间通读了一遍,最近由于需要对redis做一些深入的了解,因此又花了两个多月仔细精读了一遍,由于本书设计的内容较多,且每部分的内容都比较细致,因此在整理读书笔记的时候花了很多时间,但确实也收获了很多,本书是针对redis底层的数据结构部分做的整理。 -----Dimmacro 2016年11月7日18:21:54。
我们知道redis可以存储字符串、列表、哈希对象、集合、有序集合等五种对象类型,但是在redis内部,根据不同对象类型的数据特点,有对应的数据结构作为其底层的存储结构,而且即使是同一对象类型,当数据量或数据大小不同时,为了提供更好的性能及减少内存使用率,也会切换不同的底层数据结构。因此了解这些底层数据结构对我们深入了解redis分布式缓存有非常重要的帮助。
- redis是键值对数据库,每个键都是字符串对象,而值可以是字符串对象,列表对象,哈希对象,集合对象,有序集合对象五种之一;
- redis使用sds(simple dynamic string)简单动态字符串来表示最基本的字符串数据,该结构记录了用于保存字符串的字节数组char buf[]、已使用长度int len和未使用长度int free。有点类似于java中的String对象。
- 此sds利用c字符串作为字面量,并遵循以空字符'\0'作为字符串末尾的C风格,使得其可以直接重用C字符串函数库的部分函数,但相比较于C字符串有以下优点:
- 直接保存字符串长度而不是像C那样需要遍历才能获取长度;
- 通过空间预分配及惰性空间释放来减少由于修改字符串带来的内存重分配。空间预分配是指:当需要扩展字符数组容量时,如果分配后的长度将小于1MB,那么会预分配与当前len长度一样的字节量,如果超过1MB,则会分配1MB。惰性空间释放是指:当缩短sds字符串时,多余出来的字节数组并不回收,而是通过增长free记录起来,这样下次当需要增长到时候如果free本身就够用了,就不需要申请内存了。当然,也有API可调用来主动释放。
- 使用二进制方式处理buf数组,保持二进制数据,因此可以保存除文本数据外的其他格式,如图片,音视频,压缩文件等;

(二)数据结构部分-链表linkedlist
- 链表通过高效的节点重排、顺序访问、增删节点灵活调整期长度等特点,应用于redis中的列表键、发布与订阅、慢查询、监视器等;
- 链表的数据结构:表头head、表尾tail、节点数量即长度len、节点值复制函数dup、释放函数free、节点值对比函数match;
- 表中节点数据结构:前置节点prev、后置节点next、节点值value;
- 链表特点:双端、无环、表头表尾指针、长度计数器、多态(使用void *指针来保存节点值,可以用于保存各种不同类型的值)
- 字典是redis数据库的底层实现,对数据的增删查改操作都是构建在字典操作上的;
- 字典dict数据结构:类型特定函数dictType(多态字典)、私有函数void *privdata(类型特定的参数)、哈希表数据dictht ht[2](两个哈希表用于做rehash和渐进式hast);
- 哈希表是字典的底层实现,其结构为:dictEntry **table哈希表数组、long size哈希表大小、long sizemask哈希表掩码,用于计算索引值、long used哈希表已有节点数量、int trehashidx rehash是否在进行的标识;
- 哈希表数组的元素是哈希表节点,是保存字典中键值对的地方,即真正保存数据的地方,其结构为:*key键指针、v值、dictEntry *next下个哈希表节点,用于哈希值相同时,将当期值插入到表头,形成列表,解决键冲突问题;
- 哈希过程:根据键值使用MurmurHash2算法计算哈希值,然后与表掩码取模,得到index作为存放哈希表数组的位置,如果当前index已经有节点了,则在此节点头插入当前节点,形成链表。类似java中map结构put值的过程;
- rehash的过程:当字典中的哈希表[0]变化的时候,为了让负载因子维持在合理范围,会做rehash操作,其步骤如下:
- 为哈希表[1]分配空间,并根据扩展还是压缩操作设置其大小,值为2的N次方,扩展值为第一个大于等于ht[0]*used*2的2的n次幂,收缩操作为第一个大于等于ht[0]*used的2的N次幂;
- 将ht[0]中的所有键值rehash到ht[1]上,完成后释放ht[0],并间ht[1]设为ht[0],并重新创建一个空白的ht[1哈希表为下一次rehash做准备;(如果键值量大,会采用渐进式rehash的方式,在此期间会同时使用ht[0]和ht[1])。
- 跳跃表是一种有序数据结构,通过在每个节点中维持多个指向其他及节点的指针达到快速访问节点的目的;
- redis使用跳跃表用作实现有序集合键以及在集群节点中用作内部数据结构
- 用于少量整数的集合,是集合键的底层实现之一;
- 整数集合intset由encoding编码方式、length包含元素数量、contents元素数组三部分组成,各项在数组contents中按值的大小从小到大有序排列,不包含重复项;
- 当新添加的元素值大于现有集合encoding制定的范围时引发升级,现有元素所在位数增加;升级操作可以提升存储数据的灵活性,并节约内存;
- 不支持降级操作
- 压缩列表是一系列特殊编码的连续内存块组成的顺序型数据结构,为节约内存而开发,是列表键和哈希键的底层实现之一;
- 组成部分:zlbytes:4个字节,记录整个压缩列表占用的内存字节数;zltail4个字节,记录表尾节点距离压缩列表起始地址有多少字节;zllen,2个字节,记录压缩列表包含的节点数量;entryX列表节点;zlend:1个字节,特殊值0xFF用于标记压缩列表的末端;
- 列表节点由三部分构成:previous_entry_length记录压缩列表中前一个节点的长度,可用于从表尾向表头遍历;encoding记录本节点所保存的数据类型及长度;content保存节点值,可以是字节数组或整数;
- 当前一节点长度小于254字节,previous_entry_length占1字节,否则占5字节,因此有可能插入一个长度大于254字节的节点到表头是,如果后续节点都介于250到253之间,则可能发生连锁更新,影响性能。不过概率很小。
######以上文字来自Dimmacro,转载请说明来源:http://www.cnblogs.com/dimmacro/ #######
Redis设计与实现-内部数据结构篇的更多相关文章
- 共读《redis设计与实现》-数据结构篇
准备将之前攒下的书先看一遍,主要是有个大概的了解,以后用的时候也知道在哪里找.所以准备开几篇共读的帖子,激励自己多看一些书. Redis 基于 简单动态字符串(SDS).双端链表.字典.压缩列表.整数 ...
- 图解Redis之数据结构篇——链表
前言 Redis链表为双向无环链表! 图解Redis之数据结构篇--简单动态字符串SDS提到Redis使用了简单动态字符串,链表,字典(散列表),跳跃表,整数集合,压缩列表这些数据结构 ...
- 图解Redis之数据结构篇——简单动态字符串SDS
图解Redis之数据结构篇--简单动态字符串SDS 前言 相信用过Redis的人都知道,Redis提供了一个逻辑上的对象系统构建了一个键值对数据库以供客户端用户使用.这个对象系统包括字符串对象 ...
- 探索Redis设计与实现6:Redis内部数据结构详解——skiplist
本文转自互联网 本系列文章将整理到我在GitHub上的<Java面试指南>仓库,更多精彩内容请到我的仓库里查看 https://github.com/h2pl/Java-Tutorial ...
- 探索Redis设计与实现7:Redis内部数据结构详解——intset
本文转自互联网 本系列文章将整理到我在GitHub上的<Java面试指南>仓库,更多精彩内容请到我的仓库里查看 https://github.com/h2pl/Java-Tutorial ...
- 探索Redis设计与实现5:Redis内部数据结构详解——quicklist
本文转自互联网 本系列文章将整理到我在GitHub上的<Java面试指南>仓库,更多精彩内容请到我的仓库里查看 https://github.com/h2pl/Java-Tutorial ...
- 探索Redis设计与实现4:Redis内部数据结构详解——ziplist
本文转自互联网 本系列文章将整理到我在GitHub上的<Java面试指南>仓库,更多精彩内容请到我的仓库里查看 https://github.com/h2pl/Java-Tutorial ...
- 探索Redis设计与实现3:Redis内部数据结构详解——sds
本文转自互联网 本系列文章将整理到我在GitHub上的<Java面试指南>仓库,更多精彩内容请到我的仓库里查看 https://github.com/h2pl/Java-Tutorial ...
- 探索Redis设计与实现2:Redis内部数据结构详解——dict
本文转自互联网 本系列文章将整理到我在GitHub上的<Java面试指南>仓库,更多精彩内容请到我的仓库里查看 https://github.com/h2pl/Java-Tutorial ...
随机推荐
- visual webgui theme designer
- Codeforces Round #292 (Div. 1) C. Drazil and Park 线段树
C. Drazil and Park 题目连接: http://codeforces.com/contest/516/problem/C Description Drazil is a monkey. ...
- word2007二级标题自动编号不从大标题开始的解决方法
今天在编写word文档的时候,遇到一个很奇怪的问题,word2007二级标题自动编号不从大标题开始,可能我说的比较模糊,我截个图大家一看就明白了. 我想要的是2.1 2.2结果,他确是从1.1开始了. ...
- Windows下安装 msysGit 以及初始化 Git server环境
Windows下git工具msysGit使用以及Git server初始化 Windows下git工具,这里选择msysGit,版本为msysGit-netinstall-1.8.1.2-previe ...
- Navi.Soft30.开放平台.聚合.开发手册
1系统简介 1.1功能简述 现在是一个信息时代,并且正在高速发展.以前获取信息的途径非常少,可能只有电视台,收音机等有限的来源,而现在的途径数不胜数,如:QQ,微信,官方网站,个人网站等等 本开发手册 ...
- [原]常用sqlserver数据库使用sql语句
1.表结构文档生成查询语句: SELECT 架构名 Then s.[name] Else '' End, 表名 Then D.name Else '' End, 表说明 Then isnull(F.v ...
- 用 Jenkins 打包 iOS
需要安装插件: 1.GIT plugin 2.Xcode integration 1.新建 Job 填入“Item名称”,选择“构建一个自由风格的软件项目”,OK: 2.填入“项目名称” ...
- Eclipse调试时Application XXX is waiting for the debugger to attach的提示
原文链接: http://blog.csdn.net/star_huang/article/details/7678845 最近Eclipse调试时总是出现Application XXX is wa ...
- JSONP跨域请求数据报错 “Unexpected token :”的解决办法
原文 http://www.cnphp6.com/archives/65409 Jquery使用ajax方法实现jsonp跨域请求数据的时候报错 “Uncaught SyntaxError: Une ...
- MTNET 自用ios网络库开源
短短两天就在https://git.oschina.net/gangwang/MTNET这里收获15个星 github 5星, 值得收藏! MTNET 自用ios网络库开源, 自用很久了,在数歀上架的 ...