redis代码解析-dictionary类型

dict本质上是为了解决算法中的查找问题（Searching），一般查找问题的解法分为两个大类：一个是基于各种平衡树，一个是基于哈希表。

redis中的dict传统的哈希算法类似，它采用某个哈希函数从key计算得到在哈希表中的位置，采用拉链法解决冲突，并在装载因子（load factor）超过预定值时自动扩展内存，引发重哈希（rehashing）.在一个dict中有两个hash表，目的是来实现逐步的rehash,同时rehash时仍然可以访问dict.

正常使用的是ht[0],在rehash的时候先设置ht[1]大小为rehash后的需要的大小，然后逐步的将ht[0]中的内容rehash到ht[1]中，rehashidx记录着当前rehash到的index，在全部rehash完成之后，将ht[1]给ht[0],再reset ht[1].

当前dict是否处于rehash过程中可以通过rehashidx的值来判断，rehash时记录的是已经进行到的index，非rehash时为-1.

逐步的rehash是将rehash操作分散到对于dict的各个增删改查的操作中去。这种方法能做到每次只对一小部分key进行重哈希，而每次重哈希之间不影响dict的操作。dict这样设计避免重哈希期间单个请求的响应时间的剧烈增加

typedef struct dict {

    dictType *type;

    void *privdata;

    dictht ht[2];

    long rehashidx; /* rehashing not in progress if rehashidx == -1 */

    unsigned long iterators; /* number of iterators currently running */

} dict;

一个hash table即dictht中的table是一个dictEntry数组，dict每次rehash时，table扩容或者缩小的时候都是２的ｎ次方大小．

同时dictht还记录了当前table的大小，以及存在的dictEntry的数量.判断是否需要rehash就是通过used/size==1为需要rehash,used/size==5需要强制rehash

dictht中sizemask的值为size-1,因为size总是2的n次方，所以sizemask是n位的１，用来一个key的hash&sizemask定位出这个key应该在ｔａｂｌｅ中的位置．

同时，解决hash冲突的方法是链式

typedef struct dictEntry {

    void *key;

    union {

        void *val;

        uint64_t u64;

        int64_t s64;

        double d;

    } v;

    struct dictEntry *next;

} dictEntry;

/* This is our hash table structure. Every dictionary has two of this as we

 * implement incremental rehashing, for the old to the new table. */

typedef struct dictht {

    dictEntry **table;

    unsigned long size;

    unsigned long sizemask;

    unsigned long used;

} dictht;

一个dict的图示如下：

图片引用自：http://zhangtielei.com/posts/blog-redis-dict.html

dict的其他操作都非常简单，都是正常的对hash table的操作

dict scan还有点意思，因为redis中dict数据结构的关系，所以没办法使用传统的顺序遍历，因为

　　１　如果发生了扩容，原来的表大小是8,扩容之后是１６，就会把原来的１－８rehash到新的１－１６个slot中．如果现在要顺序访问８，则从８－１６之前的其实全部在旧的表中１－７中访问过，会有大量的重复访问．

　　２　如果发生了缩表，原来的１６缩小到８，就正好相反会有遗漏．

　　３　如果正在rehash,t0表中的数据是不全的也依然肯定有问题．

所以，redis中dict scan设计了一种新的遍历方法：对二进制高位进行加１遍历．

如果表的大小是８的话，和大小为２的访问顺序会是如下：

０００　－＞　０   00-> 0

１００　－＞　４   10-> 2

０１０　－＞　２   01-> 1

１１０　－＞　６   11-> 3

００１　－＞　１

１０１　－＞　５

０１１　－＞　３

１１１　－＞　７

１　表扩容，先访问n,然后是访问n+2的n次方，不会重复，不会遗漏.

２　表缩小,通过n&m0（size mask）定位，可能会有重复的情况，不会遗漏．

３　如果正在rehash过程中，访问n的时候,会先在容量小的表中访问(n&m0)，然后在大的表中遍历出全部的n&m0对应的位置.

dict scan　详细可参考这篇ｂｌｏｇ，http://chenzhenianqing.cn/articles/1101.html

redis代码解析-dictionary类型的更多相关文章

redis代码解析-事务
redis 的事务相关的几个命令分别为 watch multi exec. watch 可以监控一个变量在事务开始执行之前是否有被修改.使用方式为: WATCH key [key ...] 在redi ...
Redis源码解析：18Hiredis同步API和回复解析API代码解析
Redis的sentinel模式使用了Hiredis代码,Hiredis是redis数据库一个轻量级的C语言客户端库.它实现的向Redis发送命令的API函数redisCommand,使用方法类似于p ...
GraphSAGE 代码解析(一) - unsupervised_train.py
原创文章-转载请注明出处哦.其他部分内容参见以下链接- GraphSAGE 代码解析(二) - layers.py GraphSAGE 代码解析(三) - aggregators.py GraphSA ...
VBA常用代码解析
031 删除工作表中的空行如果需要删除工作表中所有的空行,可以使用下面的代码. Sub DelBlankRow() DimrRow As Long DimLRow As Long Dimi As L ...
java集合框架之java HashMap代码解析
java集合框架之java HashMap代码解析文章Java集合框架综述后,具体集合类的代码,首先以既熟悉又陌生的HashMap开始. 源自http://www.codeceo.com/arti ...
linux内存管理--slab及其代码解析
Linux内核使用了源自于 Solaris 的一种方法,但是这种方法在嵌入式系统中已经使用了很长时间了,它是将内存作为对象按照大小进行分配,被称为slab高速缓存. 内存管理的目标是提供一种方法,为实 ...
redis（Remote Dictionary Server）
redis的简介和使用简介 redis(Remote Dictionary Server)是一种Nosql技术,它是一个开源的高级kv存储和数据结构存储系统,它经常被拿来和Memcached相比 ...
Redis源代码分析（一）--Redis结构解析
从今天起,本人将会展开对Redis源代码的学习,Redis的代码规模比較小,很适合学习,是一份很不错的学习资料,数了一下大概100个文件左右的样子,用的是C语言写的.希望终于能把他啃完吧,C语言好久不 ...
C# 获取与解析枚举类型的 DescriptionAttribute
原文:C# 获取与解析枚举类型的 DescriptionAttribute System.ComponentModel.DescriptionAttribute 这个 Attribute,经常被用来为 ...

随机推荐

Redis(一)、Redis五种数据结构
Redis五种数据结构如下: 对redis来说,所有的key(键)都是字符串. 1.String 字符串类型是redis中最基本的数据类型,一个key对应一个value. String类型是二进制安 ...
week1 notebook1
初识Python 一.python介绍 - 解释器: cpython(默认使用) ipython(shell) jpython(java) ironpython rubypython - 编码: as ...
BZOJ1211: [HNOI2004]树的计数(prufer序列)
Time Limit: 10 Sec Memory Limit: 162 MBSubmit: 2987 Solved: 1111[Submit][Status][Discuss] Descript ...
JavaWeb详细学习路线图
- Java攻城狮学习路线 - 图转自网络.
css 中font属性知识点总结
一. font属性值可以继承.例如子元素可以继承父元素的行高,字体大小等等. 二.font属性可以进行连写:font: font-sytle font-weight font-size/line- ...
Fragment_动态加载
1.新建Fragment的XML布局文件. 2.在activity.xml中添加需要加载Fragment.列如: <?xml version="1.0" encoding=& ...
FLP不可能原理
1. FLP impossibility背景 FLP Impossibility(FLP不可能性)是分布式领域中一个非常著名的结果,该结果在专业领域被称为“定理”,其地位之高可见一斑.该定理的论文是由 ...
【Oracle】删除undo表空间时，表空间被占用：ORA-30042: Cannot offline the undo tablespace
特别注意:此办法只用于实在没有办法的时候,因为需要加入oracle中的隐含参数,慎用!!! 1. 先查一下是什么在占用undo SYS@ENMOEDU>select segment_name,o ...
获取json的节点名称
好几次想取json的节点名称,今天搞定了. procedure GetJsonNames(o: ISuperObject; Strs: TStrings); var ite: TSuperAvlIte ...
css3的过滤效果
上面的图片就是css3新特性的滤镜效果,学会了这些那么我们这群爱美爱帅的大web是不是就可以完美的用代码实现照片美化了捏~~ 好,咱们先把照片后面的白框实现, <style> #div1{ ...

redis代码解析-dictionary类型

redis代码解析-dictionary类型的更多相关文章

随机推荐

热门专题