Redis集群是Redis提供的分布式数据库方案,集群通过分片来进行数据共享,并提供复制和故障转移操作。

一个Redis集群通常由多个节点组成,在刚开始的时候每个节点都是相互独立的,他们处于一个只包含自己的集群当中,我们通过使用CLUSTER MEET命令将节点连接到一起,构成一个包含多节点的集群。

集群的数据结构:

clusterNode结构保存了一个节点的当前状态,比如节点创建时间、节点名称、节点当前的配置纪元、节点的ip端口。每个节点都会使用一个clusterNode结构记录自己的状态,并为集群中的所有其他节点都创建一个相应的clusterNode结构。

struct clusterNode{
//创建节点的时间
mstime_t ctime;
//节点的名称,由40个十六进制字符组成
char name[REDIS_C:USTER_NAMELEN]
//节点标识(标识节点的角色以及节点目前状态)
inf flags;
//节点当前的配置纪元
uint64_t configEpochl;
//节点的ip地址
char ip;
//节点的端口号
int port;
//保存连接节点所需要的有关信息
clusterLink *link;
}
typedef struct clusterLink{
//连接的创建时间
mstime_t ctime;
//TCP 套接字描述
int fd;
//输出缓冲区,保存着等待发送给其他节点的消息
sds sndbuf;
//输入缓冲区,保存着从其他节点接收到的消息
sds rcvbuf;
//与这个连接相关联的节点,如果没有的话为NULL
struct clusterNode *node;
} clusterLink;

每个节点都保存着一个clusterState结构,这个结构记录了在当前节点的视角下,集群目前所处的状态,

typedef struct clusterState{
//指向当前节点的指针
clusterNode *myself;
//集群当前的配置纪元,用于实现故障转移。
uint64_t currentEpoch;
//集群当前的状态:在线或下线
int state;
//集群中至少处理着一个槽的节点数量
int size;
//集群节点名单(包括myself节点)
//字典的键为节点的名称,字典值为节点对应的clusterNode结构
dict *node;
} clusterState;

槽指派:

Redis集群通过分片的方式来保存数据库中的键值对:集群的整个数据库被分成16348个槽,数据库中的每个键都属于16384个槽的其中一个,集群中的每个节点可以处理0个最多16384个槽。

使用cluster meet 命令将节点连接到集群里面后,这时集群仍处于下线状态,因为集群中的节点没有处理任何槽

通过使用cluster addslots < slot > 命令,可以为节点分配槽

记录节点的槽指派信息:

clusterNode 结构的slots属性和numslot属性记录了节点负责处理那些槽:

struct clusterNode{
unsigned char slots[/];
int numslots;
};

同时,节点会将自己的slots数组通过消息发送给集群中的其他节点,以此来告知其他节点自己目前负责处理那些槽。

clusterState结构中的slots数组记录了集群中所有16384个槽的指派信息。

typedef struct clusterState{
clusterNode *slots[];
}clusterState;

clusterState.slots是为了更快的定位槽所在的节点O(i)。

clusterNode.slots 当程序需要将某个节点的槽指派信息通过消息发送给其他节点时,程序只需要将相应节点的clusterNode.slots数组整个发送过去就可以,clusterState.slots记录了集群中所有的槽指派讯息,而clusterNode.slots只记录了当前节点的槽指派信息。

当客户端向节点发送与数据库键有关的命令时,接收命令的节点会计算出命令要处理的数据库键属于哪个槽,并检查这个槽是否指派给了自己:

如果键所在的槽正好是指派给了当前节点,那么节点直接执行这个命令;如果键所在的槽并没有指派给当前节点,那么节点会向客户端返回一个MOVED错误,指引客户端转向到正确节点,并再次发送之前想要执行的命令。

节点使用以下算法来计算给定键key属于哪个槽:

def slot_number(key):
return CRC16(key) &

当节点计算出键所属的槽i之后,节点就会检查自己在clusterState.slots数组中的项i,判断所在的槽是否由自己负责:如果clusterState.slots[i]等于clusterState.myself,那么说明槽i由当前节点负责,节点可以执行客户端发送的命令;反之节点会根据slusterState.slots[i]指向的clusterNode结构所记录的节点IP和端口号,向客户端返回MOVED错误指引客户端转向至再处理槽i的节点。

MOVED错误的格式为:MOVED < slot > <ip>:<port>

当客户端接收到节点返回的MOVED错误时,客户端根据MOVED错误提供的IP地址和端口号,转向至负责处理槽slot的节点,并向该节点重新发送之前想要执行的命令。一个集群客户端通常会与集群中的多个节点创建套接字连接,而所谓的节点转向实际上就是换一个套接字来发送命令。

集群模式的redis-cli 客户端在接收到MOVED错误时,并不会打印出MOVED错误,而是根据MOVED错误自动进行节点转向,并打印出转向信息,所以我们时看不见节点返回的MOVED错误。

节点和单机服务器在数据库方面的一个区别时,节点只能使用0号数据库,而单机Redis服务器则没有这一限制。除了将键值对保存在数据库里面之外,节点还会用clusterState结构中slots_to_keys跳跃表来保存槽和键之间的关系:

typedef struct clusterState{
zskiplist *slots_to_keys;
} clusterState;

slots_to_keys跳跃表每个节点的分值score都是一个槽号,而每个节点的成员(member)都是一个数据库键:每当节点往数据库中添加一个新的键值对时,节点就会将这个键以及键的槽号关联到slots_to_keys跳跃表;当节点删除数据库中的每个键值对时,节点就会在slots_to_keys跳跃表解除被删除键与槽号的关联。

通过在slots_to_keys跳跃表中记录各个数据库键所属的槽,节点可以很方便地对属于某个或某些槽的所有数据库键进行批量操作。

Redis集群的重新分片操作可以将任意数量已经指派给某个节点(源节点)的槽改为指派给另一个节点,并且相关槽所属的键值对也会从源节点被移动到目标节点。重新分派操作可以在线进行,在重新分片的过程中,集群不需要下线,并且源节点和目标节点都可以继续处理命令请求。

Redis集群的重新分片操作是由Redis的集群管理软件redis-trib负责执行的,Redis提供了进行重新分片所需要的所有命令,而redis-trib则通过源节点和目标节点发送命令来进行重新分片操作。

1)redis-trib对目标节点发送CLUSTER SETSLOT < slot > IMPORTING <source_id >命令,让目标节点准备好从源节点导入属于槽slot的键值对。

2)redis-trib对CLUSTER SETSLOT< slot > MIGATING < target_id > 命令,让源节点准备好将属于槽slot的键值对迁移至目标节点。

3)redis-trib向源节点发送CLUSTER GETKEYSINGSLOT < slot > < count > 获得最多count 个属于槽slot的键值对的键名。

4)对于步骤3获得的键名,redis-trib都向源节点发送一个MIGRATE < target_ip > < target_port > < key_name > 0 <timeout> 命令,将被选中的键原子地从源节点迁移至目标节点。

5)重复 3,4步骤,直到所有键值对都被迁移至目标节点。

6)redis-trib向集群中的任意一个节点发送CLUSTER SETSLOT < slot > NODE < target_id > 命令,将槽slot指派给目标节点,这一指派信息通过消息发送至整个集群,最终集群中的所有节点都会直到槽slot已经指派给了目标节点。

当客户端向源节点发送一个与数据库键有关的命令,并且命令要处理的数据库键恰好就属于正在被迁移的槽时:源节点会先在自己的数据库里查找指定的键,如果找到的话,就直接执行客户端发送的命令;相反,如果源节点没能在自己的数据库里找到指定的键,那么这个键有可能已经被迁移到目标节点,源节点向客户端返回一个ASK错误,指引客户端转向正在导入槽的目标节点,并再次发送之前想要执行的命令。

clusterState结构的importing_slots_from 数组记录了当前节点正在从其他节点导入的槽:

typedef struct clusterState{
clusterNode *importing_slots_from[];
} clusterState;

如果 importing_slots_from[i]的值不为NULL,而是指向一个clusterNode结构,那么标识当前节点正在从clusterNode所标识的节点导入槽i

clusterState结构migrating_slots_to数组记录了当前节点正在迁移至其他节点的槽:

typedef struct clusterState{
clusterNode *migratubg_slots_to[];
}clusterState;

如果migrating_slots_to[i]的值不为NULL,而是指向一个clusterNode结构,那么表示当前节点正在将槽i迁移至clusterNode所标识的节点。

ASK错误与MOVED错误的区别:

MOVED错误代表槽的负责权已经从一个节点转移到另一个节点:在客户端收到槽i的MOVED错误之后,客户端每次遇到关于槽i的命令请求时,都可以直接将命令请求发送至MOVED错误所指向的节点,因为该节点就是目前负责槽i的节点。

ASK错误只是两个节点在迁移槽的过程中使用的一种临时措施。ASK错误的转向不会对客户端今后发送关于槽i的命令请求产生任何影响,客户端仍然会将关于槽i的命令请求发送至目前负责处理槽i的节点。


每天学一点,总会有收获。

说明:尊重作者知识产权,文中内容参考《Redis设计与实现》,仅在此做学习与大家分享。


Redis学习笔记(十七) 集群(上)的更多相关文章

  1. redis 学习笔记-cluster集群搭建

    一.下载最新版redis 编译 目前最新版是3.0.7,下载地址:http://www.redis.io/download 编译很简单,一个make命令即可,不清楚的同学,可参考我之前的笔记: red ...

  2. redis 学习笔记2(集群之哨兵模式的使用)

    redis3.0之前已经有了哨兵模式,3.0之后有了cluster(分片集群),官方不推荐使用!!主要原因是分片后单节点故障后需要实现手动分槽... 集群较为成熟的解决方案codis,公司使用的是哨兵 ...

  3. Spark学习笔记——在集群上运行Spark

    Spark运行的时候,采用的是主从结构,有一个节点负责中央协调, 调度各个分布式工作节点.这个中央协调节点被称为驱动器( Driver) 节点.与之对应的工作节点被称为执行器( executor) 节 ...

  4. Quartz学习笔记:集群部署&高可用

    Quartz学习笔记:集群部署&高可用 集群部署 一个Quartz集群中的每个节点是一个独立的Quartz应用,它又管理着其他的节点.这就意味着你必须对每个节点分别启动或停止.Quartz集群 ...

  5. Spark学习之在集群上运行Spark(6)

    Spark学习之在集群上运行Spark(6) 1. Spark的一个优点在于可以通过增加机器数量并使用集群模式运行,来扩展程序的计算能力. 2. Spark既能适用于专用集群,也可以适用于共享的云计算 ...

  6. MongoDB学习笔记~Mongo集群和副本集

    回到目录 一些概念 对于Mongo在数据容灾上,推荐的模式是使用副本集模式,它有一个对外的主服务器Primary,还有N个副本服务器Secondary(N>=1,当N=1时,需要有一台仲裁服务器 ...

  7. Spark学习之在集群上运行Spark

    一.简介 Spark 的一大好处就是可以通过增加机器数量并使用集群模式运行,来扩展程序的计算能力.好在编写用于在集群上并行执行的 Spark 应用所使用的 API 跟本地单机模式下的完全一样.也就是说 ...

  8. NodeJS学习笔记 (17)集群-cluster(ok)

    cluster模块概览 node实例是单线程作业的.在服务端编程中,通常会创建多个node实例来处理客户端的请求,以此提升系统的吞吐率.对这样多个node实例,我们称之为cluster(集群). 借助 ...

  9. redis相关笔记(二.集群配置及使用)

    redis笔记一 redis笔记二 redis笔记三 1.配置:在原redis-sentinel文件夹中添加{8337,8338,8339,8340}文件夹,且复制原8333中的配置 在上述8333配 ...

  10. Dubbo -- 系统学习 笔记 -- 示例 -- 集群容错

    Dubbo -- 系统学习 笔记 -- 目录 示例 想完整的运行起来,请参见:快速启动,这里只列出各种场景的配置方式 集群容错 在集群调用失败时,Dubbo提供了多种容错方案,缺省为failover重 ...

随机推荐

  1. 初识JAVA(学习记录)

    Java 1.1Java简介 Java是一种跨平台的,面向对象的程序设计语言.无论是电脑还是手机,到处都运行着JAVA开发的应用程序:JAVA程序可以在任何计算机.操作系统以及支持JAVA的硬件设备上 ...

  2. Identity Card(hdu2629)

    输入方式:先输入一个整型,再输入不带空格未知长度/已知长度的字符串. 思考:用scanf_s()函数输入整型,再循环输入不带空格未知长度的字符串,用gets_s()函数. 注意:scanf_s()函数 ...

  3. java-五大内存图

    jrm—Java虚拟机在进行程序运行时会向cpu申请一个内存约为10%左右,该内存被jrm分为5大区域 一:栈内存(stack)用来存储变量 当栈消失时,变量也随之消失.二:堆内存(heap)在Jav ...

  4. [Objective-C] 010_Foundation框架之NSSet与NSMutableSet

    在Cocoa Foundation中的NSSet和NSMutableSet ,和NSArray功能性质一样,用于存储对象属于集合.但是NSSet和NSMutableSet是无序的, 保证数据的唯一性, ...

  5. java第十三周课后作业 0529

    1.把多个企鹅的信息添加到集合中查看企鹅的数量及所有企鹅的信息删除集合中部分企鹅的元素判断集合中是否包含指定企鹅 package homework; import java.util.ArrayLis ...

  6. 看了这篇,我确定你已经彻底搞懂Java的继承了

    遇到认真的读者是作者的一种幸运,真的,上一篇接口推送后,有好几个读者留言说,"二哥,你有一处内容需要修正,应该是接口中不能有 private 和 protected 修饰的方法." ...

  7. GitHub 热点速览 Vol.22:如何打造超级技术栈

    作者:HelloGitHub-小鱼干 摘要:build-your-own-x,无论是新手还是老手,这都是一个指向标.方向有了,剩下就是时间和实践的事情,收集了大量可用于软件和 Web 开发的 Publ ...

  8. PAT1090 危险品装箱 (25分) ——值得留意的map用法(int型与vector型的关联)

    1090 危险品装箱 (25分)   集装箱运输货物时,我们必须特别小心,不能把不相容的货物装在一只箱子里.比如氧化剂绝对不能跟易燃液体同箱,否则很容易造成爆炸. 本题给定一张不相容物品的清单,需要你 ...

  9. WebServer远程部署

    通过远程部署获取webshell并不属于代码层次的漏洞,而是属于配置性错误漏洞. 1.Tomcat tomcat是一个jsp/Servlet容器 端口号:8080 攻击方法: 默认口令.弱口令,爆破, ...

  10. 又发现一款纯js开源电子表格Luckysheet

    据官网介绍这个电子表格插件,是一款纯前端类似excel的在线表格,功能强大.配置简单.完全开源. 官网链接: Luckysheet官网 在线DEMO 特性包含: 表格设置,包括冻结行列.合并单元格.筛 ...