Redis设计与实现-内部数据结构篇
题记:这本书是2015年11月份开始读的,大约花了一个多月的时间通读了一遍,最近由于需要对redis做一些深入的了解,因此又花了两个多月仔细精读了一遍,由于本书设计的内容较多,且每部分的内容都比较细致,因此在整理读书笔记的时候花了很多时间,但确实也收获了很多,本书是针对redis底层的数据结构部分做的整理。 -----Dimmacro 2016年11月7日18:21:54。
我们知道redis可以存储字符串、列表、哈希对象、集合、有序集合等五种对象类型,但是在redis内部,根据不同对象类型的数据特点,有对应的数据结构作为其底层的存储结构,而且即使是同一对象类型,当数据量或数据大小不同时,为了提供更好的性能及减少内存使用率,也会切换不同的底层数据结构。因此了解这些底层数据结构对我们深入了解redis分布式缓存有非常重要的帮助。
- redis是键值对数据库,每个键都是字符串对象,而值可以是字符串对象,列表对象,哈希对象,集合对象,有序集合对象五种之一;
- redis使用sds(simple dynamic string)简单动态字符串来表示最基本的字符串数据,该结构记录了用于保存字符串的字节数组char buf[]、已使用长度int len和未使用长度int free。有点类似于java中的String对象。
- 此sds利用c字符串作为字面量,并遵循以空字符'\0'作为字符串末尾的C风格,使得其可以直接重用C字符串函数库的部分函数,但相比较于C字符串有以下优点:
- 直接保存字符串长度而不是像C那样需要遍历才能获取长度;
- 通过空间预分配及惰性空间释放来减少由于修改字符串带来的内存重分配。空间预分配是指:当需要扩展字符数组容量时,如果分配后的长度将小于1MB,那么会预分配与当前len长度一样的字节量,如果超过1MB,则会分配1MB。惰性空间释放是指:当缩短sds字符串时,多余出来的字节数组并不回收,而是通过增长free记录起来,这样下次当需要增长到时候如果free本身就够用了,就不需要申请内存了。当然,也有API可调用来主动释放。
- 使用二进制方式处理buf数组,保持二进制数据,因此可以保存除文本数据外的其他格式,如图片,音视频,压缩文件等;
(二)数据结构部分-链表linkedlist
- 链表通过高效的节点重排、顺序访问、增删节点灵活调整期长度等特点,应用于redis中的列表键、发布与订阅、慢查询、监视器等;
- 链表的数据结构:表头head、表尾tail、节点数量即长度len、节点值复制函数dup、释放函数free、节点值对比函数match;
- 表中节点数据结构:前置节点prev、后置节点next、节点值value;
- 链表特点:双端、无环、表头表尾指针、长度计数器、多态(使用void *指针来保存节点值,可以用于保存各种不同类型的值)
- 字典是redis数据库的底层实现,对数据的增删查改操作都是构建在字典操作上的;
- 字典dict数据结构:类型特定函数dictType(多态字典)、私有函数void *privdata(类型特定的参数)、哈希表数据dictht ht[2](两个哈希表用于做rehash和渐进式hast);
- 哈希表是字典的底层实现,其结构为:dictEntry **table哈希表数组、long size哈希表大小、long sizemask哈希表掩码,用于计算索引值、long used哈希表已有节点数量、int trehashidx rehash是否在进行的标识;
- 哈希表数组的元素是哈希表节点,是保存字典中键值对的地方,即真正保存数据的地方,其结构为:*key键指针、v值、dictEntry *next下个哈希表节点,用于哈希值相同时,将当期值插入到表头,形成列表,解决键冲突问题;
- 哈希过程:根据键值使用MurmurHash2算法计算哈希值,然后与表掩码取模,得到index作为存放哈希表数组的位置,如果当前index已经有节点了,则在此节点头插入当前节点,形成链表。类似java中map结构put值的过程;
- rehash的过程:当字典中的哈希表[0]变化的时候,为了让负载因子维持在合理范围,会做rehash操作,其步骤如下:
- 为哈希表[1]分配空间,并根据扩展还是压缩操作设置其大小,值为2的N次方,扩展值为第一个大于等于ht[0]*used*2的2的n次幂,收缩操作为第一个大于等于ht[0]*used的2的N次幂;
- 将ht[0]中的所有键值rehash到ht[1]上,完成后释放ht[0],并间ht[1]设为ht[0],并重新创建一个空白的ht[1哈希表为下一次rehash做准备;(如果键值量大,会采用渐进式rehash的方式,在此期间会同时使用ht[0]和ht[1])。
- 跳跃表是一种有序数据结构,通过在每个节点中维持多个指向其他及节点的指针达到快速访问节点的目的;
- redis使用跳跃表用作实现有序集合键以及在集群节点中用作内部数据结构
- 用于少量整数的集合,是集合键的底层实现之一;
- 整数集合intset由encoding编码方式、length包含元素数量、contents元素数组三部分组成,各项在数组contents中按值的大小从小到大有序排列,不包含重复项;
- 当新添加的元素值大于现有集合encoding制定的范围时引发升级,现有元素所在位数增加;升级操作可以提升存储数据的灵活性,并节约内存;
- 不支持降级操作
- 压缩列表是一系列特殊编码的连续内存块组成的顺序型数据结构,为节约内存而开发,是列表键和哈希键的底层实现之一;
- 组成部分:zlbytes:4个字节,记录整个压缩列表占用的内存字节数;zltail4个字节,记录表尾节点距离压缩列表起始地址有多少字节;zllen,2个字节,记录压缩列表包含的节点数量;entryX列表节点;zlend:1个字节,特殊值0xFF用于标记压缩列表的末端;
- 列表节点由三部分构成:previous_entry_length记录压缩列表中前一个节点的长度,可用于从表尾向表头遍历;encoding记录本节点所保存的数据类型及长度;content保存节点值,可以是字节数组或整数;
- 当前一节点长度小于254字节,previous_entry_length占1字节,否则占5字节,因此有可能插入一个长度大于254字节的节点到表头是,如果后续节点都介于250到253之间,则可能发生连锁更新,影响性能。不过概率很小。
######以上文字来自Dimmacro,转载请说明来源:http://www.cnblogs.com/dimmacro/ #######
Redis设计与实现-内部数据结构篇的更多相关文章
- 共读《redis设计与实现》-数据结构篇
准备将之前攒下的书先看一遍,主要是有个大概的了解,以后用的时候也知道在哪里找.所以准备开几篇共读的帖子,激励自己多看一些书. Redis 基于 简单动态字符串(SDS).双端链表.字典.压缩列表.整数 ...
- 图解Redis之数据结构篇——链表
前言 Redis链表为双向无环链表! 图解Redis之数据结构篇--简单动态字符串SDS提到Redis使用了简单动态字符串,链表,字典(散列表),跳跃表,整数集合,压缩列表这些数据结构 ...
- 图解Redis之数据结构篇——简单动态字符串SDS
图解Redis之数据结构篇--简单动态字符串SDS 前言 相信用过Redis的人都知道,Redis提供了一个逻辑上的对象系统构建了一个键值对数据库以供客户端用户使用.这个对象系统包括字符串对象 ...
- 探索Redis设计与实现6:Redis内部数据结构详解——skiplist
本文转自互联网 本系列文章将整理到我在GitHub上的<Java面试指南>仓库,更多精彩内容请到我的仓库里查看 https://github.com/h2pl/Java-Tutorial ...
- 探索Redis设计与实现7:Redis内部数据结构详解——intset
本文转自互联网 本系列文章将整理到我在GitHub上的<Java面试指南>仓库,更多精彩内容请到我的仓库里查看 https://github.com/h2pl/Java-Tutorial ...
- 探索Redis设计与实现5:Redis内部数据结构详解——quicklist
本文转自互联网 本系列文章将整理到我在GitHub上的<Java面试指南>仓库,更多精彩内容请到我的仓库里查看 https://github.com/h2pl/Java-Tutorial ...
- 探索Redis设计与实现4:Redis内部数据结构详解——ziplist
本文转自互联网 本系列文章将整理到我在GitHub上的<Java面试指南>仓库,更多精彩内容请到我的仓库里查看 https://github.com/h2pl/Java-Tutorial ...
- 探索Redis设计与实现3:Redis内部数据结构详解——sds
本文转自互联网 本系列文章将整理到我在GitHub上的<Java面试指南>仓库,更多精彩内容请到我的仓库里查看 https://github.com/h2pl/Java-Tutorial ...
- 探索Redis设计与实现2:Redis内部数据结构详解——dict
本文转自互联网 本系列文章将整理到我在GitHub上的<Java面试指南>仓库,更多精彩内容请到我的仓库里查看 https://github.com/h2pl/Java-Tutorial ...
随机推荐
- 正在使用MJRefresh & MJExtension的App
框架地址:https://github.com/CoderMJLee已经有上百个App用到了MJRefresh & MJExtension框架(只列出了其中一部分App):
- ELK——为调试 Logstash Grok 表达式,安装 GrokDebuger 环境
内容 安装 RVM 安装 Ruby 和 Gems 安装 Rails 安装 jls-grok Ruby grok 解析 调试 grok 注意:不要用 root 执行以下操作. 用 logstash ...
- Linq to sql-存储过程
带参数的存储过程 创建如下存储过程: create proc [dbo].[sp_withparameter] ), @rowcount int output as set nocount on se ...
- WCF 数据服务 4.5
.NET Framework 4.5 其他版本 WCF 数据服务(以前称为"ADO.NET Data Services")是 .NET Framework 的一个组件.可以使用此组 ...
- 【News】SpagoBI中国官方微信对外发布
爱数据,爱分析,爱达比 致力于国际优秀开源BI应用在中国的普及推广,用数据开启中小企业智慧之门: 扫描上图二维码,关注SpagoBI中国官方微信,2015年8月18日将在腾讯课堂.百度传课.网易云课堂 ...
- Java历史版本下载
下载个以前版本的Java工具不容易.Java SE 6 版本拿去: http://www.oracle.com/technetwork/java/javasebusiness/downloads/ja ...
- ubuntu 下安装 lxml 失败
/tmp/pip-build-7HN4t8/lxml/src/lxml/includes/etree_defs.h:14:31: fatal error: libxml/xmlversion.h: N ...
- 1.什么是泛型和C#中泛型在Class上的实现
阅读目录 一:什么是泛型? 二:C#中泛型在Class上的实现 一:什么是泛型? 我们在编程的时候需要一个数据类型,但是在刚开始的时候还不确定这个数据类型是怎么样的,或者说对于不同的多个数据类型有 ...
- 学习之路三十八:Hook(钩子)的学习
好久没写文章了,还记得年前面试了一家公司,为了检测一下我的学习能力,给了我一个任务,做一个自动登录并自动操作菜单的程序. 花了几天的时间研究了Hook以及使用WindowsAPI操作程序的知识,现在记 ...
- JSP Servlet性能分析
JSP Servlet性能分析:http://www.docin.com/p-757790851.html