理解分布式一致性:Raft协议

什么是分布式一致性
Leader选举
日志复制流程
term选举周期
timeout
选举和选举timeout
选举分裂
日志复制和心跳timeout

在分布式系统中，分布式一致性是一个非常重要的概念，它是指分布式系统的各个服务器都保持一个统一的状态（数据）。但是在分布式系统中，通常由于网络，系统状态等原因会导致某些服务不可用或者不可靠。这就需要一种分布式一致性的协议来保证系统在某些服务失败的情况下仍然整体可用。

Raft协议是受到Paxos的影响而产生的，相对于Paxos而言，Raft协议更加简单易懂。我会在后面的博客里面专门详细介绍Paxos协议的具体内容。这里我们重点讨论Raft协议。

什么是分布式一致性

下面举个例子：

假如我们有一个单节点的服务节点A，这个单节点的服务只是用来存储一个字母。同时我们还有一个客户端向这个服务发起更新数据的请求。

对于单节点的分布式一致性来说，服务响应客户端的更新请求即可。但是当我们有多个服务节点的情况下会怎么样呢？

Raft协议就是保证多个服务器节点数据一致性的协议。

接下来我们看看Raft是怎么工作的。

Raft协议中，一个服务器的节点可以是以下三种状态中的任意一个：

Follower 状态：跟随者，被动接收数据。我们用实心圆表示。
Candidate 状态：候选人，可以被选做Leader。我们用实心圆+虚线边框表示。
Leader 状态：领导者，处理所有客户端交互，日志复制等，一般一次只有一个Leader. 我们用实心圆+实线边框表示。

Leader选举

所有的节点都是从Follower状态开始的。

如果Follower在一定的时间里面没有收到选举请求或者Leader节点的回复，Follower则会转变为Candidate。

Candidate会发送选举请求给所有的其他节点，收到选举请求的其他节点会反馈回Candidate，当Candidate收到的所有响应数目大于n/2 时，Candidate会认为绝大多数节点已经选我作为Leader了，这时候Candidate就会转变为Leader。接下来所有的数据变化都会经由Leader发起。

日志复制流程

在Raft系统中，所有的数据变化都是以日志记录的形式添加到服务节点之中。服务节点会不断的读取日志记录，并将日志记录更新到服务节点的数据中。日志记录最开始的状态是uncommited, 更新之后状态则变为commited.

为了实现所有服务节点的一致性更新，步骤如下：

client 发送数据更改请求到Leader
Leader复制日志记录到Follower节点
Leader等待大多数节点完成复制日志记录。
Leader节点commit 当前日志记录，并更新Leader节点的数据。
Leader通知Follower节点该日志记录已经commit.
Follower节点commit该日志记录。
整个分布式系统实现了数据一致性。

term选举周期

在Raft 协议中，有一个term的概念。term是一个选举周期，一个term周期只会产生一个Leader，term连续递增。

timeout

在Raft协议中，为了保证选举和数据更新的顺利进行，规定了两种类型的timeout:

选举timeout和心跳timeout。

选举和选举timeout

每个term开始时，会重置选举timeout。在一个term中，Follower会等待timeout的时间，如果超出这个时间还没有得到其他节点的选举请求，Follower会主动转变为Candidate，并且term+1，意味着开启了新的选举周期。

选举timeout是150ms-300ms之间的一个随机数，之所以随机产生timeout，是为了避免同时产生多个Candidate的情况。

当Follower转变为Candidate之后，term加1，然后开始新一轮的选举。Candidate首先会将自己的Vote Count 加1，然后发送请求选举的消息给其他节点。
接收节点首先会比较term的大小，如果自己的term小于Candidate的term，则更新自己的term和Candidate的term保持一致，并重置timeout。如果接收节点在这个term中还没有做任何选举，则会返回选举响应消息给Candidate节点。
Candidate 节点收到大部分节点的选举响应之后，会变成Leader 节点。
一个选举周期完成，接下来Leader 发送更新日志给Follower节点，进入日志更新阶段。

选举分裂

值得注意的是Candidate只有得到超出n/2个节点的选举响应才能变为Leader节点。如果两个Follower节点同时变成Candidate节点，则会产生选举分裂的问题。

现在假设我们总共有4个节点，其中两个节点同时变成Candidate节点，并向其余两个节点发送选举请求：

节点B，C成为Candidate节点并行向节点A，D发送选举请求。

节点A，D分别响应节点B，C的请求，这时候两个Candidate节点由于得到的Vote都是2，不满足大于n/2的条件，则其不能转变为Leader节点，继续等待timeout至新的term开始并开启新一轮的选举，只到符合条件为止。

日志复制和心跳timeout

当系统进入到日志复制阶段，Leader节点会以心跳timeout的节奏向Follower节点发送日志记录，并且需要确保所有的节点都能够接受到完整的日志记录。

客户发送set 5 给Leader，在下一个心跳timeout，Leader将set 5的日志记录发给Follower。
Leader 收到大部分节点的ack 响应之后，commit 该日志记录。
Leader通知Client已经提交该日志记录，同时通知Follower 提交该日志记录。

更多教程请参考flydean的博客

理解分布式一致性:Raft协议的更多相关文章

理解分布式一致性:Paxos协议之Basic Paxos
理解分布式一致性:Paxos协议之Basic Paxos 角色 Proposal Number & Agreed Value Basic Paxos Basic Paxos without f ...
理解分布式一致性:Paxos协议之Generalized Paxos & Byzantine Paxos
理解分布式一致性:Paxos协议之Generalized Paxos & Byzantine Paxos Generalized Paxos Byzantine Paxos Byzantine ...
理解分布式一致性:Paxos协议之Cheap Paxos & Fast Paxos
理解分布式一致性:Paxos协议之Cheap Paxos & Fast Paxos Cheap Paxos Message flow: Cheap Multi-Paxos Fast Paxos ...
理解分布式一致性:Paxos协议之Multi-Paxos
理解分布式一致性:Paxos协议之Multi-Paxos Multi-Paxos without failures Multi-Paxos when phase 1 can be skipped Mu ...
理解分布式一致性与Raft算法
理解分布式一致性与Raft算法永远绕不开的CAP定理出于可用性及负载方面考虑,一个分布式系统中数据必然不会只存在于一台机器,一致性简单地说就是分布式系统中的各个部分保持数据一致但让数据保持一致往 ...
理解分布式一致性:拜占庭容错与PBFT
理解分布式一致性:拜占庭容错与PBFT 拜占庭问题拜占庭容错BFT PBFT(Practical Byzantine Fault Tolerance) why 3f+1 ? PBFT 的优点 PBF ...
Raft 为什么是更易理解的分布式一致性算法
一致性问题可以算是分布式领域的一个圣殿级问题了,关于它的研究可以回溯到几十年前. 拜占庭将军问题 Leslie Lamport 在三十多年前发表的论文<拜占庭将军问题>(参考[1]). 拜 ...
【转】Raft 为什么是更易理解的分布式一致性算法
编者按:这是看过的Raft算法博客中比较通俗的一篇了,讲解问题的角度比较新奇,图文并茂,值得一看.原文链接:Raft 为什么是更易理解的分布式一致性算法一致性问题可以算是分布式领域的一个圣殿级问题了 ...
Raft 为什么是更易理解的分布式一致性算法(转)
一致性问题可以算是分布式领域的一个圣殿级问题了,关于它的研究可以回溯到几十年前. 拜占庭将军问题 Leslie Lamport 在三十多年前发表的论文<拜占庭将军问题>(参考[1]). 拜 ...

随机推荐

Python第三方包之离线安装
Python第三方包之离线安装第一步首先我们得从pypi上先下载要装的第三方包 https://pypi.org/ 第二步(因为下载下来的包可能需要其他包的依赖,那我们依旧要按照第一步再次下载) ...
IDEA+EasyCode实现代码生成
IDEA+EasyCode实现代码生成 Easy Code介绍 EasyCode是基于IntelliJ IDEA开发的代码生成插件,支持自定义任意模板(Java,html,js,xml).只要是与数据 ...
【Java技术系列】爱情36技之Bug大战
1. 鲁迅先生说:程序员,天不怕地不怕,就怕小虫儿爬呀爬,爬呀爬. 随着时间的推移,鲁迅先生又说:真正勇猛的程序员,敢于让虫子面对惨淡的虫生. 虫子在程序员心中是啥东西?虫子的学名为 Bug,是多少入 ...
Failed to introspect Class [XXX] from ClassLoader [ParallelWebap报错
今天写了一个Controller,结果刚刚本地跑就给了一个惊喜 org.springframework.beans.factory.BeanCreationException: Error creat ...
JVM类加载过程详细分析
双亲委派加载模型为什么需要双亲委派加载模型主要是为了安全,避免用户恶意加载破坏JVM正常运行的字节码文件,比如说加载一个自己写的java.util.HashMap.class.这样就有可能造成包冲 ...
真没想到，Springboot能这样做全局日期格式化，有点香！
最近面了一些公司,有一些 Java方面的架构.面试资料,有需要的小伙伴可以在公众号[程序员内点事]里,无套路自行领取说在前边最近部门几位同事受了一些委屈相继离职,共事三年临别之际颇有不舍,待一切手 ...
搭建DVWA Web渗透测试靶场
文章更新于:2020-04-13 按照惯例,需要的文件附上链接放在文首. 文件名:DVWA-1.9-2020.zip 文件大小:1.3 M 文件说明:这个是新版 v1.9 (其实是 v1.10开发版) ...
Python 0(安装及初步使用+学习资源推荐)
不足之处,还请见谅,请指出不足.本人发布过的文章,会不断更改,力求减少错误信息. Python安装请借鉴网址https://www.runoob.com/python/python-install.h ...
中阶 d04 xml 概念及使用
idea新建xml文件https://www.jianshu.com/p/b8aeadae39b0 或https://blog.csdn.net/Hi_Boy_/article/details/804 ...
python3（四）list tuple
# !/usr/bin/env python3 # -*- coding: utf-8 -*- # list是一种有序的集合,可以随时添加和删除其中的元素. classmates = ['Michae ...

理解分布式一致性:Raft协议

理解分布式一致性:Raft协议

什么是分布式一致性

Leader选举

日志复制流程

term选举周期

timeout

选举和选举timeout

选举分裂

日志复制和心跳timeout

理解分布式一致性:Raft协议的更多相关文章

随机推荐

热门专题