Redis4.0 主从复制(PSYN2.0)
Redis4.0版本相比原来3.x版本,增加了很多新特性,如模块化、PSYN2.0、非阻塞DEL和FLUSHALL/FLUSHDB、RDB-AOF混合持久化等功能。尤其是模块化功能,作者从七年前的redis1.0版本就开始谋划,终于在4.0版本发布了,所以版本号也就从3.x直接迭代到了4.0以表示版本变化之大。简单看了一下新版的PSYN2.0,虽然很多细节没搞清楚,但是大概流程倒是搞明白了。
一、主要流程
在新版的PSYN2.0中,相比原来的PSYN功能,最大的变化支持两种场景下的部分重同步,一个场景是slave提升为master后,其他slave可以从新提升的master进行部分重同步。另外一个场景就是slave重启后,可以进行部分重同步。
在具体实现上redis服务器在生成RDB文件的时候会把当前的复制ID和复制偏移量一起保存到RDB文件中,后面服务器重启的时候,就可以从RDB文件中读取复制ID和复制偏移量,从而可以进行部分重同步功能。另外当服务器从slave提升为master后,会保存两个复制ID,其他slave复制的时候可以根据第二个复制ID来进行部分重同步。
假设两台Redis服务器A和B启动后,对B执行slaveof命令,使得B变为A的从服务器,整体流程如下
1、B在启动的时候,会尝试从RDB文件中加载复制ID和复制偏移量(loadDataFromDisk),如果没有配置RDB文件或者RDB文件中不包含主从复制相关信息,那么使用随机生成的复制ID
2、B接收到slaveof命令时候,设置复制状态为REPL_STATE_CONNECT(replicationSetmaster)
3、周期调度的时间事件中,如果检测到REPL_STATE_CONNECT状态,则会初始化连向master的套接字(serverCron->replicationCron->connectWithmaster),套接字关联事件对应的事件处理程序(syncWithmaster)
4、连接建立后,对应的事件处理程序,则会依据相关设置等,依次发送PING、AUTH、PORT、IP、CAPA、PSYN等信息(syncWithmaster)
其中CAPA表示发送端在主从复制方面支持的能力,目前Redis4.0版本支持两种能力,一个是EOF、另外一个是PSYNC2。
EOF表示slave可以接收直接由套接字发送过来的RDB流。传统的全量复制方式是master首先生成一个RDB文件,然后以$<count> bulk format发送到slave。而EOF格式下,master并不会在硬盘上生成RDB文件,而是先通过$EOF:<40 bytes delimiter>通知slave一个随机生成的40byte结束符,master边生成RDB文件,边发往slave,在slave以接收到的delimiter来判断接收过程结束。
PSYNC2则表示支持Redis4.0最新的PSYN复制操作。
PSYN信息中,slave会把自己的复制ID和复制偏移量发给master
5、master根接收到PSYN消息后,根据复制ID如果复制ID与自己的复制ID相同且复制偏移量仍然存在于复制缓存区中(server.repl_backlog),那么执行部分重同步,回复CONTINUE消息,并从复制缓存区中复制相关的数据到slave。否则执行全量重同步,回复FULLRESYNC消息,生成RDB传输到slave。(实际上master会维护两个复制id,如果PSYN复制ID与第二个复制ID相同且PSYN的复制偏移量没有超过第二个复制ID的偏移量,也会执行部分重同步,参考后面的slave提升为master场景)
7、CONTINUE消息和FULLRESYNC消息中都会带有master的复制ID,slave需要将自己的复制ID更新为master的复制ID(如果两者不同)。
6、同步成功以后,后续master接收到修改数据库的新命令,则会把新命令传输到slave执行。
二、网络闪断超时
master在与slave同步后,slave每隔1s发送一个REPLCONF ACK消息给master,master每隔10s给slave发送一个PING消息。如果master在一定的时间内(server.repl_timeout)没有收到消息,则会释放slave连接。同样如果slave在一定的时间(server.repl_timeout)内没有收到master的PING消息,也会释放套接字连接(replicationCron)。但是slave会设置复制状态为REPL_STATE_CONNECT(replicationHandlemasterDisconnection),后续slave端定时事件调度的时候,则会根据复制状态尝试重新连接。
测试脚本如下
#!/bin/shTIMEOUT=15M_IP=127.0.0.1M_PORT=6379M_OUT=master.outS1_IP=127.0.0.2S1_PORT=6380S1_OUT=slave_1.outS1_RDB_NAME=slave_1.rdbnohup ../src/redis-server --port $M_PORT --bind $M_IP --repl-timeout $TIMEOUT > $M_OUT &nohup ../src/redis-server --port $S1_PORT --bind $S1_IP --dbfilename $S1_RDB_NAME --repl-timeout $TIMEOUT > $S1_OUT&echo set redis hello | nc $M_IP $M_PORTecho lpush num 1 2 3 | nc $M_IP $M_PORTsleep 1echo slaveof 127.0.0.1 6379 | nc $S1_IP $S1_PORTsleep 1echo set redis world | nc $M_IP $M_PORTecho lpush num 4 | nc $M_IP $M_PORTecho save | nc $S1_IP $S1_PORTsleep 5echo "modify iptables"sudo iptables -I INPUT -s 127.0.0.1 -d 127.0.0.2 -j DROPsudo iptables -I OUTPUT -s 127.0.0.2 -d 127.0.0.1 -j DROPecho set redis helloworld | nc $M_IP $M_PORTecho lpush num 5 | nc $M_IP $M_PORTsleep 25echo "restore iptables"sudo iptables -D INPUT -s 127.0.0.1 -d 127.0.0.2 -j DROPsudo iptables -D OUTPUT -s 127.0.0.2 -d 127.0.0.1 -j DROP
最终运行如上脚本,得到如下结果,可以看到在slave初始启动的时候,NO20处slave通过REPLCONF CAPA信息通知master,自己支持EOF格式的RDB传输同时支持PSYNC2.0协议,接着通过PSYNC发送了一个随机生成的复制ID,master收到这个ID后发现与自己的复制ID不相符,需要全量复制,因此回复FULLRESYNC消息,slave收到FULLRESYNC消息后,会把自己的复制ID更新为f8e28****,后续slave生成RDB文件的时候,就会把f8e28****这个复制ID和复制偏移量保存进去。


网络闪断超时后,master和slave都会释放连接,当网络恢复后,slave会重新建立连接,同时通过PSYNC消息把对应的复制ID和复制偏移量发给master,master收到PSYNC消息后,发现复制ID与自己相同,说明这个slave之前是自己的slave,同时复制偏移量位于缓存区范围内,因此满足进行部分重同步的条件,回复CONTINUE消息,指示slave进行部分重同步

三、slave提升为master以及slave重启场景
这两种场景是PSYN2.0新增支持的场景,原理也很容易理解,就是通过复制ID来进行匹配的。直接看示例吧,通过一个综合示例来看一下这两种场景
示例场景:首先有一个master和两个从服务器slave1和slave2,同步过程中首先把slave2进程kill掉,然后在master上执行两个命令同步到slave1后,把slave1手动提升为master,并把slave2重启指向之前的slave1
测试脚本
#!/bin/shTIMEOUT=15M_IP=127.0.0.1M_PORT=6379M_OUT=master.outS1_IP=127.0.0.2S1_PORT=6380S1_OUT=slave_1.outS1_RDB_NAME=slave_1.rdbS2_IP=127.0.0.3S2_PORT=6381S2_OUT=slave_2.outS2_RDB_NAME=slave_2.rdbnohup ../src/redis-server --port $M_PORT --bind $M_IP --repl-timeout $TIMEOUT > $M_OUT &nohup ../src/redis-server --port $S1_PORT --bind $S1_IP --dbfilename $S1_RDB_NAME --repl-timeout $TIMEOUT > $S1_OUT&nohup ../src/redis-server --port $S2_PORT --bind $S2_IP --dbfilename $S2_RDB_NAME --repl-timeout $TIMEOUT > $S2_OUT&sleep 1s1_pid=`cat $S1_OUT|grep PID`s1_pid=`echo ${s1_pid#*PID:}`echo s1_pid:$s1_pids2_pid=`cat $S2_OUT|grep PID`s2_pid=`echo ${s2_pid#*PID:}`echo s1_pid:$s2_pidecho set redis hello | nc $M_IP $M_PORTecho lpush num 1 2 3 | nc $M_IP $M_PORTsleep 1echo slaveof $M_IP $M_PORT | nc $S1_IP $S1_PORTecho slaveof $M_IP $M_PORT | nc $S2_IP $S2_PORTsleep 1echo set redis world | nc $M_IP $M_PORTecho lpush num 4 | nc $M_IP $M_PORTsleep 1echo save | nc $S2_IP $S2_PORTkill -9 $s2_pidsleep 3echo set redis helloworld | nc $M_IP $M_PORTecho lpush num 5 | nc $M_IP $M_PORTecho "slave1提升为master"echo slaveof no one | nc $S1_IP $S1_PORTecho "重启slave2 并设置 slaveof $S1_IP $S1_PORT"nohup ../src/redis-server --port $S2_PORT --bind $S2_IP --dbfilename $S2_RDB_NAME --repl-timeout $TIMEOUT > $S2_OUT&sleep 1echo slaveof $S1_IP $S1_PORT | nc $S2_IP $S2_PORT
需要注意的是在No68和No69处,slave2重启并设置slaveof 127.0.0.2 6380的时候,127.0.0.2:6380虽然回复了CONTINUE消息,但是复制ID却发生了变化。原因是在127.0.0.2 6380执行slaveof no one的时候,Redis服务器会把当前的复制ID和复制偏移量保存起来,并重新生成一个新的复制ID(shiftReplicationId)。如果后续PSYN收到的复制ID与先前保存的复制ID相同,且复制偏移量小于先前保存的复制偏移量那么就可以进行部分重同步(当前如果与新生成的复制ID相同,且偏移量在缓存区内,同样可以进行部分重同步)。这里需要重新生成一个复制ID的原因就是旧有的复制ID的复制偏移量在执行完slaveof no one后不能在继续增加,否则会导致数据混淆。(masterTryPartialResynchronization)



补充说明
1、Redis的RESP协议https://redis.io/topics/protocol
2、Redis4.0 http://antirez.com/news/110
Redis4.0 主从复制(PSYN2.0)的更多相关文章
- Mysql8.0主从复制搭建,shardingsphere+springboot+mybatis读写分离
1.安装mysql8.0 首先需要在192.167.3.171上安装JDK. 下载mysql安装包,https://dev.mysql.com/downloads/,找到以下页面下载. 下载后放到li ...
- mysql 8.0 主从复制配置
背景: 主库: 192.168.211.128 从库: 192.168.211.129 一.关闭防火墙 [root@node01 ~]# systemctl disable firewalld [ro ...
- 创建或打开解决方案时提示"DotNetCore.1.0.1-SDK.1.0.0.Preview2-003131-x86"错误的解决方案
提示"DotNetCore.1.0.1-SDK.1.0.0.Preview2-003131-x86"错误的解决方案: 1.检查是否有C:\Program Files (x86)\d ...
- Android requires compiler compliance level 5.0 or 6.0. Found '1.4' instead的解决办法
今天在导入工程进Eclipse的时候竟然出错了,控制台输出的是: [2013-02-04 22:17:13 - takepicture] Android requires compiler compl ...
- 字符串数组初始化0 与memset 0 效率的分析
转自:http://www.xuebuyuan.com/1722207.html 结合http://blog.sina.com.cn/s/blog_59d470310100gov8.html来看. 最 ...
- bootstrap2.0与3.0的区别
在阅读这篇bootstrap2.0与3.0的区别的文章之前,大家一定要先了解什么是响应式网站设计?推荐大家看看这篇"教你快速了解响应式网站设计" . 我觉得bootstrap的可视 ...
- centos7.2环境elasticsearch-5.0.1+kibana-5.0.1+zookeeper3.4.6+kafka_2.9.2-0.8.2.1部署详解
centos7.2环境elasticsearch-5.0.1+kibana-5.0.1+zookeeper3.4.6+kafka_2.9.2-0.8.2.1部署详解 环境准备: 操作系统:centos ...
- ASP.Net MVC3安全升级导致程序集从3.0.0.0变为3.0.0.1
开发环境一般引用的是本机 C:\Program Files (x86)\Microsoft ASP.NET\ASP.NET MVC 3\Assemblies下的System.Web.Mvc.dll,当 ...
- R语言中的logical(0)和numeric(0)以及赋值问题
logical(0) 不等于 numeric(0).两者都不等于NULL值,即is.null(logical(0))和is.null(numeric(0))返还值都是FALSE.这很有意思,说明长度为 ...
随机推荐
- ADI高速信号采集芯片与JESD204B接口简介
ADI高速信号采集芯片与JESD204B接口简介 JESD204B接口 介绍: JEDEC Standard No. 204B (JESD204B)—A standardized serial int ...
- 2 timeit模块,python中数据结构
1.timeit模块:代码事件测量模块 timeit模块可以用来测试一小段Python代码的执行速度. class timeit.Timer(stmt='pass', setup='pass', ti ...
- Kubernetes学习之路(十三)之Pod控制器--DaemonSet
一.什么是DaemonSet? DaemonSet 确保全部(或者一些)Node 上运行一个 Pod 的副本.当有 Node 加入集群时,也会为他们新增一个 Pod .当有 Node 从集群移除时,这 ...
- JAVA 删除指定目录下指定文件类型的所有文件
public class DelFile { public static void main(String[] args) { File file = new File("C:\\DETEC ...
- 部署jenkins问题
总结:配置的url,jenkins部署的ip必须有开放,否则发布会超时失败
- 快速稀疏角点光流框架(Fast sparse corner optical flow framework)
光流适用在连续的图像系列(视频流)中,描述本身或画面目标的运动状态:在目标跟踪.运动分析.甚至slam中都有广泛应用. opencv里就有不少光流算法,其中很经典也是当前被调用最多的的Lucas-Ka ...
- [Lua] 尾调用消除(tail-call elimination)
<Lua程序设计(第2版)> 6.3 正确的尾调用(proper tail call) Lua是支持尾调用消除(tail-call elimination)的,如下面对函数g的调用就是尾调 ...
- 《杜增强讲Unity之Tanks坦克大战》6-发射子弹
6 发射子弹 本节完成发射子弹的功能,最终代码如下: image 首先,发射子弹得确定发射的位置和方向,还有发射的初始速度.具体的发射速度和按下发射按键的时间长短有关,这个关于子弹的蓄力我们在第九 ...
- maven scope属性值设置含义
1.枚举各个属性值的含义 compile,缺省值,适用于所有阶段,会打包进项目. provided,类似compile,期望JDK.容器或使用者会提供这个依赖. runtime,只在运行时使用,如JD ...
- Docker容器的启动与停止
启动docker:systemctl start docker 停止docker:systemctl stop docker 重启docker:systemctl restart docker 查看d ...