Redis Scan迭代器遍历操作原理（一）

Redis在2.8.0版本新增了众望所归的scan操作，从此再也不用担心敲入了keys*, 然后举起双手看着键盘等待漫长的系统卡死了···

命令的官方介绍在这里，中文版由huangz同学细心翻译了，作者Antirez的介绍在这里：Finally Redis collections are iterable （我又邪恶的想到了之前他那次机器down机的事故了···）。

具体的使用参考上面的链接即可，这里大概介绍一下Scan操作的实现原理。

Redis的SCAN操作由于其整体的数据设计，无法提供特别准的scan操作，仅仅是一个“can ‘ t guarantee ， just do my best”的实现，优缺点如下：

优点：
- 提供键空间的遍历操作，支持游标，复杂度O(1), 整体遍历一遍只需要O(N)；
- 提供结果模式匹配；
- 支持一次返回的数据条数设置，但仅仅是个hints，有时候返回的会多；
- 弱状态，所有状态只需要客户端需要维护一个游标；
缺点：
- 无法提供完整的快照遍历，也就是中间如果有数据修改，可能有些涉及改动的数据遍历不到；
- 每次返回的数据条数不一定，极度依赖内部实现；
- 返回的数据可能有重复，应用层必须能够处理重入逻辑；

所以结论是Scan是一个不错的但也让人又爱又恨的命令···。下面来介绍一下代码。

首先scanCommand 函数处理简单的scan操作，其他类似hscan函数跟这个的区别就是hscan需要取获取一遍key对应的空间或者说域，他们主要都是嚼用了通用的scan操作函数：scanGenericCommand 。

scanGenericCommand 函数分4步：

第一步当然就是解析参数了，比如count， match匹配参数；

第二部是需要去做真正的扫描键的操作了，redis为了性能考虑，对于小数据结构会转换为ziplist，intset数据结构因此需要区分这2类，对于后者，由于其本身比较小，因此可完全可以在这一次scan操作的时候返还所有的数据，反正不大的。

另外一类就是正常的hash表所代表的扫描了，其扫描路径比较复杂，好吧，我看了好几次都没有看明白这到底是怎么扫描的，这几天啃也要啃出来！

    /* Handle the case of a hash table. */

    ht = NULL;

    if (o == NULL) {//键扫描

        ht = c->db->dict;

    } else if (o->type == REDIS_SET && o->encoding == REDIS_ENCODING_HT) {

        ht = o->ptr;

    } else if (o->type == REDIS_HASH && o->encoding == REDIS_ENCODING_HT) {

        ht = o->ptr;

        count *= 2; /* We return key / value for this type. */

    } else if (o->type == REDIS_ZSET && o->encoding == REDIS_ENCODING_SKIPLIST) {

        zset *zs = o->ptr;

        ht = zs->dict;

        count *= 2; /* We return key / value for this type. */

    }

//由于redis的ziplist, intset等类型数据量挺少，所以可用一次返回的。下面的else if 做这个事情。全部返回一个key 。

    if (ht) {//一般的存储，不是intset, ziplist

        void *privdata[2];

        /* We pass two pointers to the callback: the list to which it will

         * add new elements, and the object containing the dictionary so that

         * it is possible to fetch more data in a type-dependent way. */

        privdata[0] = keys;

        privdata[1] = o;

        do {

        	//一个个扫描，从cursor开始，然后调用回调函数将数据设置到keys返回数据集里面。

            cursor = dictScan(ht, cursor, scanCallback, privdata);

        } while (cursor && listLength(keys) < count);     } else if (o->type == REDIS_SET) {

        int pos = 0;

        int64_t ll;

        while(intsetGet(o->ptr,pos++,&ll))//将这个set里面的数据全部返回，因为它是压缩的intset，会很小的。

            listAddNodeTail(keys,createStringObjectFromLongLong(ll));

        cursor = 0;

    } else if (o->type == REDIS_HASH || o->type == REDIS_ZSET) {//那么一定是ziplist了，字符串表示的数据结构，不会太大。

        unsigned char *p = ziplistIndex(o->ptr,0);

        unsigned char *vstr;

        unsigned int vlen;

        long long vll;

        while(p) {//扫描整个键，然后全部返回这一条。并且返回cursor为0表示没东西了。其实这个就等于没有遍历

            ziplistGet(p,&vstr,&vlen,&vll);

            listAddNodeTail(keys,

                 (vstr != NULL) ? createStringObject((char*)vstr,vlen) : createStringObjectFromLongLong(vll));

            p = ziplistNext(o->ptr,p);

        }

        cursor = 0;

    } else {

        redisPanic("Not handled encoding in SCAN.");

    }

上面简单的地方在于如果这个键是已REDIS_SET或者REDIS_HASH或者REDIS_ZSET行事存储的话，那么只需要扫描所有的键，然后一个个将其加入到临时的列表里面，以备返回给客户端。

最难的地方在于dictScan 函数，里面是各种位运算。

随后第三步就是进行结果的过滤了，一般就是用match参数代表的字符串去做匹配，看是否需要过滤数据。

第四步就是将收集到的数据返回给客户端。然后就完成了请求。

dictScan 原理：

好吧，我看了2次，没看懂·····先做饭··

ps: 写着写着发现一篇文章写不完，所以令起一篇了：Redis Scan迭代器遍历操作原理（二）–dictScan反向二进制迭代器，希望能讲清楚.

Redis Scan迭代器遍历操作原理（一）的更多相关文章

Redis Scan迭代器遍历操作原理（二）
续上一篇文章 Redis Scan迭代器遍历操作原理(一)–基础 ,这里着重讲一下dictScan函数的原理,其实也就是redis SCAN操作最有价值(也是最难懂的部分). 关于这个算法的源头,来自 ...
Redis Scan命令
原地址:https://www.cnblogs.com/tekkaman/p/4887293.html [Redis Scan命令] SCAN cursor [MATCH pattern] [COUN ...
Redis SCAN命令实现有限保证的原理
SCAN命令可以为用户保证:从完整遍历开始直到完整遍历结束期间,一直存在于数据集内的所有元素都会被完整遍历返回,但是同一个元素可能会被返回多次.如果一个元素是在迭代过程中被添加到数据集的,又或者是在迭 ...
Java List中迭代器遍历
在java中,List接口从Collection接口中继承了 iterator()函数,返回值是一个T类型的迭代器(泛型),T是List中元素的类型 public class TestListAndI ...
java 迭代器遍历List Set Map
Iterator接口: 所有实现了Collection接口的容器类都有一个iterator方法用以返回一个实现Iterator接口的对象 Iterator对象称作为迭代器,用以方便的对容器内元素的遍历 ...
Java 中List 集合索引遍历与迭代器遍历
package yzhou.iterator; import java.util.ArrayList; import java.util.HashSet; import java.util.Itera ...
有关map中使用iterate迭代器遍历的不保序问题和list remove(object)的细节问题
今天在做项目的过程中发现了如下两个问题: 一使用map的iterator迭代器对map进行遍历得到的结果是不保序的,也就是每次输出结果都是不一样的.针对这个问题,看以下iterator迭代器的源码. ...
迭代器遍历【List、Set、Map】
迭代器遍历[List.Set.Map] example package boom.collection; import java.util.ArrayList; import java.util.Ha ...
迭代器:遍历集合元素的操作. iterator()
package seday11; import java.util.ArrayList;import java.util.Collection;import java.util.Iterator; / ...

随机推荐

Maven学习(十二)-----Maven POM
Maven POM POM代表项目对象模型.它是 Maven 中工作的基本单位,这是一个 XML 文件.它始终保存在该项目基本目录中的 pom.xml 文件.POM 包含的项目是使用 Maven 来构 ...
python爬虫入门之URL
python爬虫,顾名思义是爬取信息的.大数据时代,信息的获取是非常关键的,它甚至能决定一个公司大发展的方向与未来,互联网就好像一张大网,人们想要获取信息就要从这张大网里爬取,这种手段也可以称为搜索引 ...
Python 3 利用 Dlib 实现摄像头人脸检测特征点标定
0. 引言利用 Python 开发,借助 Dlib 库捕获摄像头中的人脸,进行实时人脸 68 个特征点标定: 支持多张人脸: 有截图功能: 图 1 工程效果示例( gif ) 图 2 工程效果示例( ...
Delphi 实现照片抽奖-原创
有单位年会要用照片抽奖,上网搜了几个都不满意,且居然还要收费.自己写一个算了.只是有一点不爽,Delphi 7 在 Windows 7 64位下有问题,不能双击 dpr 文件直接打开项目! 关于性能: ...
直线石子合并（区间DP）
石子合并时间限制:1000 ms | 内存限制:65535 KB 描述有N堆石子排成一排,每堆石子有一定的数量.现要将N堆石子并成为一堆.合并的过程只能每次将相邻的两堆石子堆成一堆,每次合并花费 ...
【C#】人脸识别视频数据转图片数据
使用虹软人脸识别的开发过程中遇到了转换的问题因为不会用C#直接打开摄像头,就只能用第三方dll.一开始用Aforge,后来发现有个问题,关闭摄像头老是陷入等待,所以抛弃了.前一阵子开始用封装了Ope ...
【RL系列】马尔可夫决策过程——Jack‘s Car Rental
本篇请结合课本Reinforcement Learning: An Introduction学习 Jack's Car Rental是一个经典的应用马尔可夫决策过程的问题,翻译过来,我们就直接叫它“租 ...
tomcat 最大并发连接数设置
转自: http://blog.csdn.net/qysh123/article/details/11678903 这是个很简单的问题,但是搜了一圈,发现大家都写错了.所以这里总结一下: 几乎所有的中 ...
Polycarp and Letters（set首战！）
Description Polycarp loves lowercase letters and dislikes uppercase ones. Once he got a string s con ...
OOP 1.3 动态内存分配
1.new运算符用法分配一个变量:P=new T; T是任意类型名,P是类型为T的指针.动态分配出一片大小为sizeof(T)字节的内存空间,将该空间的起始地址赋值给P(new T的返回值为 T). ...

Redis Scan迭代器遍历操作原理（一）

dictScan 原理：

Redis Scan迭代器遍历操作原理（一）的更多相关文章

随机推荐

热门专题