概述

lab2中实现了raft协议，本lab将在raft之上实现一个可容错的k/v存储服务，第一部分是实现一个不带日志压缩的版本，第二部分是实现日志压缩。时间原因我只完成了第一部分。

设计思路

如上图，lab2实现了raft协议，本lab将实现kvserver。每个raft都关联一个kvserver，Clerks发送Put(), Append(), Get() RPC给leader服务器中的kvserver，kvserver收到请求后将操作打包成Log Entry提交给raft，然后阻塞等待raft将这个Entry拷贝到其它server，当Log Entry被拷贝到大部分的server后，leader 的raft会通知kvserver（raft往管道中塞comitted Entry，kvserver通过读这个管道获取通知），kvserver执行命令，然后响应Clerk。

Clerk

客户端通过Clerk发送请求，来看下Clerk代码：

type Clerk struct {

	servers []*labrpc.ClientEnd

	// You will have to modify this struct.

	lastLeader	int

	cid		    int64

	seq			int

}

func (ck *Clerk) Get(key string) string {

	// You will have to modify this function.

    // 参数: 要读的key, 当前clerk的id，  请求序列号

	getArgs := GetArgs{Key: key, Cid:ck.cid, Seq:ck.seq}

	reply := GetReply{}

	for {

		doneCh := make(chan bool, 1)

		go func() {

           //发送Get() RPC

			ok := ck.servers[ck.lastLeader].Call("KVServer.Get", &getArgs, &reply)

			doneCh <- ok

		}()

		select {

		case <-time.After(600 * time.Millisecond):

			DPrintf("clerk(%d) retry PutAppend after timeout\n", ck.cid)

			continue

		case ok := <- doneCh:

           //收到响应后，并且是leader返回的，那么说明这个命令已经执行了

			if ok && reply.WrongLeader != WrongLeader {

				//请求序列号加1

              ck.seq++

				return reply.Value

			}

		}

       //换一个server重试

		ck.lastLeader++

		ck.lastLeader %= len(ck.servers)

	}

	return ""

}

这里只给出了Get()的代码，Put()和Append()类似，发送KVServer.Get给一个server，如果这个server不是leader，换一个server重试。直到发给真正的leader，并且leader将这个命令拷贝到大部分其它server后，然后成功执行该命令，Clerk.Get()才会返回。

KVServer

再来看下服务端的代码，KVServer处理Clerk的RPC请求：

type KVServer struct {

	mu      sync.Mutex

	me      int

	rf      *raft.Raft

	applyCh chan raft.ApplyMsg

	maxraftstate int // snapshot if log grows this big

	// Your definitions here.

   // 保存键值对

	db 		map[string]string

	latestReplies map[int64]*LatestReply

	notify map[int]chan struct{}

}

func (kv *KVServer) Get(args *GetArgs, reply *GetReply) {

	// Your code here.

	if _, isLeader := kv.rf.GetState(); !isLeader {

		reply.WrongLeader = WrongLeader

		reply.Err = ""

		return

	}

	// 防止重复请求

	kv.mu.Lock()

	if latestReply, ok := kv.latestReplies[args.Cid]; ok && args.Seq <= latestReply.Seq {

		reply.WrongLeader = IsLeader

		reply.Value = latestReply.Reply.Value

		reply.Err = latestReply.Reply.Err

		kv.mu.Unlock()

		return

	}

	kv.mu.Unlock()

	command := Op{Operation:"Get", Key:args.Key, Cid:args.Cid, Seq:args.Seq}

	index, term, _ := kv.rf.Start(command)

	// 阻塞等待结果

	kv.mu.Lock()

	ch := make(chan struct{})

	kv.notify[index] = ch

	kv.mu.Unlock()

	select {

	case <-ch:

		curTerm, isLeader := kv.rf.GetState()

		DPrintf("%v got notify at index %v, isLeader = %v\n", kv.me, index, isLeader)

		if !isLeader || curTerm != term {

			reply.WrongLeader = WrongLeader

			reply.Err = ""

		} else {

			reply.WrongLeader = IsLeader

			kv.mu.Lock()

			if value, ok := kv.db[args.Key]; ok {

				reply.Value = value

				reply.Err = OK

			} else {

				reply.Err = ErrNoKey

			}

			kv.mu.Unlock()

		}

	}

}

KVServer.db用于保存键值对。

KVServer.Get()首先判断自己是不是leader，如果不是leader，直接返回，这样Clerk好重试其它server。如果是leader，先在缓存中找，看这个请求是否已经执行过了。

因为可能出现这么一种情况：如果leader commit一个Entry后立即奔溃了，那么Clerk就收不到响应，那么Clerk会将这个请求发给新的leader，新的leader收到请求后如果不做任何措施，将会二次commit该Log Entry，对于Put()和Append()请求执行两次是不正确的，所以需要一个办法防止一个请求执行两次。

可以这么做：每个Clerk都分配一个唯一的cid，每个请求分配一个唯一的序列号seq，每成功一个请求，该序列号加一。服务端记录每个客户端cid最近一次apply的请求的序列号seq和对应的响应结果，根据这个信息可知，当再次收到这个客户端的序列号小于seq的请求时，说明已经执行过了，直接返回结果。

如果之前没有执行过，那么调用

kv.rf.Start(command)

将Log Entry提交给raft，并且阻塞等待raft将这个Entry拷贝到其它大部分server，从阻塞返回后，说明这个Entry已经被拷贝到大部分server了，并且已经执行了命令，这时可以将结果返回给Clerk了。

那么在哪里接收raft的消息呢？KVServer在创建的时候会在一个线程中执行如下函数：

func (kv *KVServer) applyDaemon()  {

	for appliedEntry := range kv.applyCh {

		command := appliedEntry.Command.(Op)

		// 执行命令, 过滤已经执行过得命令

		kv.mu.Lock()

		if latestReply, ok := kv.latestReplies[command.Cid]; !ok || command.Seq > latestReply.Seq {

			switch command.Operation {

			case "Get":

				latestReply := LatestReply{Seq:command.Seq,}

				reply := GetReply{}

				if value, ok := kv.db[command.Key]; ok {

					reply.Value = value

				} else {

					reply.Err = ErrNoKey

				}

				latestReply.Reply = reply

				kv.latestReplies[command.Cid] = &latestReply

			case "Put":

				kv.db[command.Key] = command.Value

				latestReply := LatestReply{Seq:command.Seq}

				kv.latestReplies[command.Cid] = &latestReply

			case "Append":

				kv.db[command.Key] += command.Value

				latestReply := LatestReply{Seq:command.Seq}

				kv.latestReplies[command.Cid] = &latestReply

			default:

				panic("invalid command operation")

			}

		}

		DPrintf("%d applied index:%d, cmd:%v\n", kv.me, appliedEntry.CommandIndex, command)

		// 通知

		if ch, ok := kv.notify[appliedEntry.CommandIndex]; ok && ch != nil {

			DPrintf("%d notify index %d\n",kv.me, appliedEntry.CommandIndex)

			close(ch)

			delete(kv.notify, appliedEntry.CommandIndex)

		}

		kv.mu.Unlock()

	}

}

kv.applyCh这个chanel会在创建raft的时候传给raft，当某个Log Entry可以被commit的时候，raft会往这个chanel中塞，只要for循环这个kv.applyCh，就能知道已经被commit的Entry，拿到Entry后，根据其中的命令执行相应的操作，然后通知KVServer.Get()继续执行。

具体代码在：https://github.com/gatsbyd/mit_6.824_2018

如有错误，欢迎指正：

15313676365

MIT-6.824 Lab 3: Fault-tolerant Key/Value Service的更多相关文章

MIT 6.824(Spring 2020) Lab1: MapReduce 文档翻译
首发于公众号:努力学习的阿新前言大家好,这里是阿新. MIT 6.824 是麻省理工大学开设的一门关于分布式系统的明星课程,共包含四个配套实验,实验的含金量很高,十分适合作为校招生的项目经历,在文 ...
6.824 Lab 3: Fault-tolerant Key/Value Service 3A
6.824 Lab 3: Fault-tolerant Key/Value Service Due Part A: Mar 13 23:59 Due Part B: Apr 10 23:59 Intr ...
6.824 Lab 3: Fault-tolerant Key/Value Service 3B
Part B: Key/value service with log compaction Do a git pull to get the latest lab software. As thing ...
6.824 Lab 2: Raft 2A
6.824 Lab 2: Raft Part 2A Due: Feb 23 at 11:59pm Part 2B Due: Mar 2 at 11:59pm Part 2C Due: Mar 9 at ...
MIT 6.824 lab1:mapreduce
这是 MIT 6.824 课程 lab1 的学习总结,记录我在学习过程中的收获和踩的坑. 我的实验环境是 windows 10,所以对lab的code 做了一些环境上的修改,如果你仅仅对code 感兴 ...
MIT 6.824 : Spring 2015 lab3 训练笔记
摘要: 源代码参见我的github:https://github.com/YaoZengzeng/MIT-6.824 Lab3: Paxos-based Key/Value Service Intro ...
MIT 6.824 : Spring 2015 lab2 训练笔记
源代码参见我的github:https://github.com/YaoZengzeng/MIT-6.824 Lab 2:Primary/Backup Key/Value Service Overvi ...
MIT 6.824 Lab2D Raft之日志压缩
书接上文Raft Part C | MIT 6.824 Lab2C Persistence. 实验准备实验代码:git://g.csail.mit.edu/6.824-golabs-2021/src ...
MIT 6.824 Lab2C Raft之持久化
书接上文Raft Part B | MIT 6.824 Lab2B Log Replication. 实验准备实验代码:git://g.csail.mit.edu/6.824-golabs-2021 ...
MIT 6.824 Llab2B Raft之日志复制
书接上文Raft Part A | MIT 6.824 Lab2A Leader Election. 实验准备实验代码:git://g.csail.mit.edu/6.824-golabs-2021 ...

随机推荐

【CH4201】楼兰图腾
题目大意:给定一个长度为 N 的序列,从序列中任意挑出三个数,求满足中间的数字值最小(最大)有多少种情况. 题解:建立在值域上的树状数组,从左到右扫描一遍序列,统计出每个点左边有多少个数大于(小于)该 ...
【洛谷P1491】集合位置
题目大意:求给定的一张无向带权图的次短路. 题解:先跑一遍 spfa 求出从起点到终点的最短路,记录路径.接着枚举删边,并重新跑 spfa,统计最小值即可. 至于为什么 dp 做法不行,暂时还不清楚. ...
jQuery EasyUI API 中文文档 - 消息框（Messager）
http://www.cnblogs.com/Philoo/archive/2011/11/15/jeasyui_api_messager.html Messager 消息框博客园风流涕淌 (p ...
python 获取自身ip
原文见过很多获取服务器本地IP的代码,个人觉得都不是很好,例如以下这些不推荐:靠猜测去获取本地IP方法 #!/usr/bin/env python # -*- coding: utf-8 -*- ...
第七节认识SpringMVC中的表单标签
所谓成熟,就是:你要习惯,任何人的忽冷忽热:也要看淡,任何人的渐行渐远: --胖先生 SpringMVC的表单标签回顾: JSTL标签 --C标签 FMT标签自学:JSP如何自定义标签[开源社区当 ...
在angularJs实现批量删除
原理:在js中定义一个数组,然后给每个复选框一个点击事件,点击事件的方法参数有两个,一个是事件源$event,一个是id.点击复选框根据事件源判断是否被选中,然后进而是向这个数组增加或者删除id. $ ...
bzoj千题计划222：bzoj2329: [HNOI2011]括号修复（fhq treap）
http://www.lydsy.com/JudgeOnline/problem.php?id=2329 需要改变的括号序列一定长这样 :)))((( 最少改变次数= 多余的‘)’/2 [上取整] + ...
C#_界面程序_数码游戏
using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; usin ...
使用 git 托管代码
1. 下载安装好 git 客户端 2. 找一个家代码托管平台我用 coding.net,注册个账号,建一个空项目然后打开安装好的 git bash 客户端,使用 git clone 命令克隆下远程 ...
《翻译》PEP 380 – 委托子生成器语法
PEP 380 – 委托子生成器语法翻译自: https://www.python.org/dev/peps/pep-0380/ 摘要一项新的语法被提出了:生成器委托其部分操作给另一个生成器.委 ...

MIT-6.824 Lab 3: Fault-tolerant Key/Value Service

概述

设计思路

Clerk

KVServer

MIT-6.824 Lab 3: Fault-tolerant Key/Value Service的更多相关文章

随机推荐

热门专题