hashicorp/raft模块实现的raft集群存在节点跨集群身份冲突问题

我通过模块github.com/hashicorp/raft使用golang实现了一个raft集群功能，发现如下场景中会遇到一个问题：

测试启动如下2个raft集群，集群名称，和集群node与IP地址如下，raft集群均通过BootstrapCluster方法初始化：

Cluster1 BootstrapCluster servers:

- node1: {raft.ServerID: c1-node1, raft.ServerAddress: 192.168.100.1:7000}

- node2: {raft.ServerID: c1-node2, raft.ServerAddress: 192.168.100.2:7000}

- node3: {raft.ServerID: c1-node3, raft.ServerAddress: 192.168.100.3:7000}

Cluster2 BootstrapCluster servers：

- node3: {raft.ServerID: c2-node3, raft.ServerAddress: 192.168.100.3:7000}

- node4: {raft.ServerID: c2-node4, raft.ServerAddress: 192.168.100.4:7000}

- node5: {raft.ServerID: c2-node5, raft.ServerAddress: 192.168.100.5:7000}

其中，"node3"的地址会存在2个集群中。

"node1","node2"按照"Cluster1"启动:

sudo ./raft_svr -cluster 'c1-node1,127.0.0.1,800;c1-node2,127.0.0.2,800;c1-node3,127.0.0.3,800' -id c1-node1

sudo ./raft_svr -cluster 'c1-node1,127.0.0.1,800;c1-node2,127.0.0.2,800;c1-node3,127.0.0.3,800' -id c1-node2

"node3","node4","node5"先按照"Cluster2"启动:

sudo ./raft_svr -cluster 'c2-node3,127.0.0.3,800;c2-node4,127.0.0.4,800;c2-node5,127.0.0.5,800' -id c2-node3

sudo ./raft_svr -cluster 'c2-node3,127.0.0.3,800;c2-node4,127.0.0.4,800;c2-node5,127.0.0.5,800' -id c2-node4

sudo ./raft_svr -cluster 'c2-node3,127.0.0.3,800;c2-node4,127.0.0.4,800;c2-node5,127.0.0.5,800' -id c2-node5

然后就会发现"node3"会在"Cluster1"和"Cluster2"之间来回切换，一会属于"Cluster1"，一会属于"Cluster2".

INFO[0170] current state:Follower, leader address:127.0.0.5:800, servers:[{Suffrage:Voter ID:c2-node3 Address:127.0.0.3:800} {Suffrage:Voter ID:c2-node4 Address:127.0.0.4:800} {Suffrage:Voter ID:c2-node5 Address:127.0.0.5:800}], last contact:2025-05-14 15:35:53.330867 +0800 CST m=+169.779019126

INFO[0171] current state:Follower, leader address:127.0.0.1:800, servers:[{Suffrage:Voter ID:c2-node3 Address:127.0.0.3:800} {Suffrage:Voter ID:c2-node4 Address:127.0.0.4:800} {Suffrage:Voter ID:c2-node5 Address:127.0.0.5:800}], last contact:2025-05-14 15:35:54.308388 +0800 CST m=+170.756576126

我的代码如下:

package main

import (

	"flag"

	"fmt"

	"io"

	"net"

	"os"

	"strconv"

	"strings"

	"time"

	"github.com/hashicorp/raft"

	log "github.com/sirupsen/logrus"

)

type raftCluster struct {

	localRaftID     raft.ServerID

	servers         map[raft.ServerID]raft.ServerAddress // raftID : raftAddressPort

	raft            *raft.Raft

	electionTimeout time.Duration

}

func (r *raftCluster) Start() error {

	config := raft.DefaultConfig()

	config.HeartbeatTimeout = 2000 * time.Millisecond

	config.ElectionTimeout = 5000 * time.Millisecond

	config.CommitTimeout = 2000 * time.Millisecond

	config.LeaderLeaseTimeout = 2000 * time.Millisecond

	config.LocalID = r.localRaftID

	config.LogOutput = log.StandardLogger().Out

	r.electionTimeout = config.ElectionTimeout * time.Duration(len(r.servers)*2)

	localAddressPort := string(r.servers[r.localRaftID])

	tcpAddr, err := net.ResolveTCPAddr("tcp", localAddressPort)

	if err != nil {

		return fmt.Errorf("resolve tcp address %s, %v", localAddressPort, err)

	}

	transport, err := raft.NewTCPTransport(localAddressPort, tcpAddr, 2, 10*time.Second, log.StandardLogger().Out)

	if err != nil {

		return fmt.Errorf("fail to create tcp transport, localAddressPort:%s, tcpAddr:%v, %v",

			localAddressPort, tcpAddr, err)

	}

	snapshots := raft.NewInmemSnapshotStore()

	logStore := raft.NewInmemStore()

	stableStore := raft.NewInmemStore()

	fm := NewFsm()

	r.raft, err = raft.NewRaft(config, fm, logStore, stableStore, snapshots, transport)

	if err != nil {

		return fmt.Errorf("create raft error, %v", err)

	}

	var configuration raft.Configuration

	for sID, addr := range r.servers {

		server := raft.Server{

			ID:      sID,

			Address: addr,

		}

		configuration.Servers = append(configuration.Servers, server)

	}

	err = r.raft.BootstrapCluster(configuration).Error()

	if err != nil {

		return fmt.Errorf("raft bootstrap faild, conf:%v, %v", configuration, err)

	}

	log.Infof("bootstrap cluster as config: %v", configuration)

	return nil

}

func (r *raftCluster) checkLeaderState() {

	ticker := time.NewTicker(time.Second)

	for {

		select {

		case leader := <-r.raft.LeaderCh():

			log.Infof("im leader:%v, state:%s, leader address:%s", leader, r.raft.State(), r.raft.Leader())

		case <-ticker.C:

			verifyErr := r.raft.VerifyLeader().Error()

			servers := r.raft.GetConfiguration().Configuration().Servers

			switch verifyErr {

			case nil:

				log.Infof("im leader, servers:%v", servers)

			case raft.ErrNotLeader:

				// check cluster leader

				log.Infof("current state:%v, servers:%+v, leader address:%v, last contact:%v",

					r.raft.State(), servers, r.raft.Leader(), r.raft.LastContact())

			}

		}

	}

}

func main() {

	var (

		clusters = flag.String("cluster", "",

			"cluster node address, fmt: ID,IP,Port;ID,IP,Port")

		clusterId = flag.String("id", "", "cluster id")

	)

	flag.Parse()

	if *clusterId == "" {

		log.Infof("cluster id messing")

		os.Exit(1)

	}

	servers := make(map[raft.ServerID]raft.ServerAddress)

	for _, cluster := range strings.Split(*clusters, ";") {

		info := strings.Split(cluster, ",")

		var (

			nid   string

			nip   net.IP

			nport int

			err   error

		)

		switch {

		case len(info) == 3:

			nid = info[0]

			nip = net.ParseIP(info[1])

			if nip == nil {

				log.Infof("cluster %s ip %s parse failed", cluster, info[1])

				os.Exit(1)

			}

			nport, err = strconv.Atoi(info[2])

			if err != nil {

				log.Infof("cluster %s port %s parse failed, %v", cluster, info[2], err)

			}

		default:

			log.Infof("cluster args value is bad format")

			os.Exit(1)

		}

		log.Infof("cluster node id:%s, ip:%v, port:%d", nid, nip, nport)

		addr := net.TCPAddr{IP: nip, Port: nport}

		servers[raft.ServerID(nid)] = raft.ServerAddress(addr.String())

	}

	r := raftCluster{

		localRaftID: raft.ServerID(*clusterId),

		servers:     servers,

	}

	err := r.Start()

	if err != nil {

		log.Infof("rafter cluster start failed, %v", err)

		os.Exit(1)

	}

	r.checkLeaderState()

}

// SimpleFsm: 实现一个简单的Fsm

type SimpleFsm struct {

	db database

}

func NewFsm() *SimpleFsm {

	fsm := &SimpleFsm{

		db: NewDatabase(),

	}

	return fsm

}

func (f *SimpleFsm) Apply(l *raft.Log) interface{} {

	return nil

}

func (f *SimpleFsm) Snapshot() (raft.FSMSnapshot, error) {

	return &f.db, nil

}

func (f *SimpleFsm) Restore(io.ReadCloser) error {

	return nil

}

type database struct{}

func NewDatabase() database {

	return database{}

}

func (d *database) Get(key string) string {

	return "not implemented"

}

func (d *database) Set(key, value string) {}

func (d *database) Persist(sink raft.SnapshotSink) error {

	_, _ = sink.Write([]byte{})

	_ = sink.Close()

	return nil

}

func (d *database) Release() {}

测试了hashicorp/raft多个版本都是相同的情况，以当前最新版本v1.7.3分析了下，应该是如下原因导致的：

集群启动后各个节点都通过BootstrapCluster初始化，并引导集群选举，在node3上可以看见如下日志，说明在选举阶段node3能判断自己不属于Cluster1集群。

[WARN]  raft: rejecting appendEntries request since node is not in configuration: from=c1-node1

但是当Cluster1选举出leader后，node3就可能变成Cluster的成员了，这是因为Cluster1的leader会不断通过心跳向集群内node发送日志，而在这个过程中：
1. fllower节点是不会判断这个请求的leader是否是自己集群中的设备。
2. fllower节点只对比请求日志的编号是否比自己本地的大，如果比本地的大，就接收存下来，并将发起请求的leader设置为自己集群的leader。
3. 同样的，在Cluster2选举出leader后，Cluster2的leader也会向node3不断通过心跳发送日志请求。这就导致node3一会属于Cluster1，一会属于Cluster2

这个过程中的漏洞出在raft节点接收日志修改leader的过程，代码位置为hashicop/raft模块中的raft.go:L1440位置的func (r *Raft) appendEntries(rpc RPC, a *AppendEntriesRequest)函数

修改改函数，增加对请求Leader的ID的判断，则可避免这个问题：

	// Ignore an older term

	if a.Term < r.getCurrentTerm() {

		return

	}

	// yzc add，这里是我们添加的函数，注意，拒绝之后需要返回错误，否则会导致另外一个集群不断重新选举

	if len(r.configurations.latest.Servers) > 0 && !inConfiguration(r.configurations.latest, ServerID(a.ID)) {

		r.logger.Warn("rejecting appendEntries request since node is not in configuration",

			"from", ServerID(a.ID))

		rpcErr = fmt.Errorf("node is not in configuration")

		return

	}

	// Increase the term if we see a newer one, also transition to follower

	// if we ever get an appendEntries call

	if a.Term > r.getCurrentTerm() || (r.getState() != Follower && !r.candidateFromLeadershipTransfer.Load()) {

		// Ensure transition to follower

		r.setState(Follower)

		r.setCurrentTerm(a.Term)

		resp.Term = a.Term

	}

重新编译运行后，我们看到node3始终保持在Cluster2中，并且可以看到如下日志

[WARN]  raft: rejecting appendEntries request since node is not in configuration: from=c1-node1

在Cluster1的leader日志中，我们可以看到该leader向node3发送心跳失败的日志：

[DEBUG] raft: failed to contact: server-id=c1-node3 time=1m29.121143167s

[ERROR] raft: failed to heartbeat to: peer=127.0.0.3:800 backoff time=1s error="node is not in configuration"

hashicorp/raft模块实现的raft集群存在节点跨集群身份冲突问题的更多相关文章

redis 集群环境搭建-redis集群管理
集群架构 (1)所有的redis节点彼此互联(PING-PONG机制),内部使用二进制协议优化传输速度和带宽. (2)节点的fail是通过集群中超过半数的节点检测失效时才生效. (3)客户端与redi ...
Kubernetes使用集群联邦实现多集群管理
Kubernetes在1.3版本之后,增加了“集群联邦”Federation的功能.这个功能使企业能够快速有效的.低成本的跨区跨域.甚至在不同的云平台上运行集群.这个功能可以按照地理位置创建一个复制机 ...
Elasticsearch 主从同步之跨集群复制
文章转载自:https://mp.weixin.qq.com/s/alHHxXont6XFm_m9PfsGfw 1.什么是跨集群复制? 跨集群复制(Cross-cluster replication, ...
HUE配置文件hue.ini 的filebrowser模块详解（图文详解）（分HA集群和非HA集群）
不多说,直接上干货! 我的集群机器情况是 bigdatamaster(192.168.80.10).bigdataslave1(192.168.80.11)和bigdataslave2(192.168 ...
庐山真面目之七微服务架构Consul集群、Ocelot网关集群和IdentityServer4版本实现
庐山真面目之七微服务架构Consul集群.Ocelot网关集群和IdentityServer4版本实现一.简介在上一篇文章<庐山真面目之六微服务架构Consul集群.Ocelot网 ...
庐山真面目之十二微服务架构基于Docker搭建Consul集群、Ocelot网关集群和IdentityServer版本实现
庐山真面目之十二微服务架构基于Docker搭建Consul集群.Ocelot网关集群和IdentityServer版本实现一.简介在第七篇文章<庐山真面目之七微服务架构Consul ...
Kubernetes集群搭建之Etcd集群配置篇
介绍 etcd 是一个分布式一致性k-v存储系统,可用于服务注册发现与共享配置,具有以下优点. 简单 : 相比于晦涩难懂的paxos算法,etcd基于相对简单且易实现的raft算法实现一致性,并通过g ...
docker swarm英文文档学习-6-添加节点到集群
Join nodes to a swarm添加节点到集群当你第一次创建集群时,你将单个Docker引擎置于集群模式中.为了充分利用群体模式,可以在集群中添加节点: 添加工作节点可以增加容量.当你将服 ...
Docker swarm集群增加节点和删除节点
Docker swarm集群增加节点 docker swarm初始化 docker swarm init docker swarm 增加节点在已经初始化的机器上执行:# docker swarm j ...
庐山真面目之六微服务架构Consul集群、Ocelot网关集群和Nginx版本实现
庐山真面目之六微服务架构Consul集群.Ocelot网关集群和Nginx版本实现一.简介在上一篇文章<庐山真面目之五微服务架构Consul集群.Ocelot网关和Nginx版本实 ...

随机推荐

用 solon-ai 写个简单的 deepseek 程序（构建全国产 ai 智能体应用）
用国产应用开发框架(及生态),对接国产 ai.构建全国产 ai 智能体应用. 1.先要申请个 apiKey 打开 https://www.deepseek.com 官网,申请个 apiKey .(一万 ...
C#/.NET/.NET Core技术前沿周刊 | 第 28 期（2025年2.24-2.28）
前言 C#/.NET/.NET Core技术前沿周刊,你的每周技术指南针!记录.追踪C#/.NET/.NET Core领域.生态的每周最新.最实用.最有价值的技术文章.社区动态.优质项目和学习资源等. ...
循环（Java篇）
令人头痛的循环(:´д｀)ゞ我们在学习循环的时候可能会有点懵,什么是循环?它可以干嘛?我这里为什么要用循环来写这段代码?等问题. 首先我们来讲一下循环可以干嘛循环是什么?o(′益`)o 在 Jav ...
Oracle 对 Json 数据进行增删改
1.背景: 由于项目要求,需要对大型的 Json 数据入库到DB中(clob 类型),由于内容过长或者 oracle 版本限制,有一些熟知的处理方法是不能使用的. 精确解决问题,可以直接看第四步:[4 ...
如何在 Github 上获得 1000 star？
作为程序员,Github 是第一个绕不开的网站.我们每天都在上面享受着开源带来的便利,我相信很多同学也想自己做一个开源项目,从而获得大家的关注.然而,理想很丰满,现实却是开发了很久的项目仍然无人问津. ...
【FAQ】HarmonyOS SDK 闭源开放能力 —Push Kit（10）
1.问题描述: 离线推送,锁屏的时候没有弹出消息,只有下拉在通知中心里面显示.请问是否是正常的? 解决方案: 检查一下是否存在图片风控:https://developer.huawei.com/con ...
MQ 如何保证数据一致性？
前言上个月,我们有个电商系统出了个灵异事件:用户支付成功了,但订单状态死活不改成"已发货". 折腾了半天才定位到问题:订单服务的MQ消息,像人间蒸发一样消失了. 这个Bug让我明 ...
构建窗体--java进阶day03
1.窗体对象Jframe 要创建窗体就需要Jframe对象,窗体创建好不会自己显示,还需要我们自己写一段代码让其显示 2.设置窗体可见--setVisible(true) 该方法用于显示窗体 3.窗体 ...
js调用datasnap rest server
场景: 有嵌套的多层json数据结构的变量,js通过post调用 datasnap rest server,会出现问题: var json = [{ stcd: system.sn, dateTime ...
ubuntu 22.04安装harbor
一.概述 Harbor 是一个企业级的云原生容器镜像仓库,由 VMware 开发并贡献给 Cloud Native Computing Foundation (CNCF).它在传统的 Docker R ...

hashicorp/raft模块实现的raft集群存在节点跨集群身份冲突问题

hashicorp/raft模块实现的raft集群存在节点跨集群身份冲突问题的更多相关文章

随机推荐

热门专题