Cocklebur集群的工作原理

  在集群正常工作时,整个集群只会有一个Leader,其他都是Follower。Client可以注册到某个Follower,当然也可以注册到Leader,为了减轻Leader压力,一般要选择注册到Follower。读操作直接向Follower请求数据,而写数据则直接向Leader提交请求(在Client注册到Follower时已经得知当前的Leader的地址信息并缓存在Client本地,如果Client提交写操作时发现目标主机已经不是Leader则将重新向Follower询问Leader地址)。这种状态下的集群,Leader和Follower的状态(维护的数据)满足最终一致性,而Leader拥有最新数据。

图一、Cocklebur对外服务示意图

  注意,由于最终一致性可能会导致Follower的数据更新延迟,对于整个集群来说,读数据时必然是延迟的,但是写数据时Leader是必经之路,Leader可以保证数据永远都是最新的。所以写当一个Client读到延迟信息时发出特定目的写操作时可能会失败,但最终集群的数据一定不会发生错误。

  这就好像是你明明看到一个空的座位(读取数据),当你要去坐的时候发现已经有人做了(尝试要写数据时,因为坐位子相当于是改变了座位的状态)。这实际上对于座位来说并没有什么不合适的,因为谁先来的就应该是谁坐,而不是谁先看到就谁坐,因为看到并不算改变了它的状态。所以通过这个例子,你可以想想分布式锁的场景。

Cocklebur主要功能模块

而从cocklebur总体设计来看,其主要功能模块如下图所示:

图二、Cocklebur基础功能模块

  除了Thrift RPC序列化框架是第三方库之外,其他cocklebur不依赖其他库。而负责通信这部分属于十分基础的技术,故不详细介绍。另外大家可以看到,cocklebur并没有实现ACL(访问控制列表,访问权限相关),其实ACL可以在数据操作模块完成,本人时间有限所以就没有实现ACL。之后的博客也主要围绕上面四块展开,介绍完功能模块设计,就开始介绍一些主要的控制流程。

  类Paxos选举算法:目前Paxos的工程实现都不是Paxos原版,都是在其基础上进行了化简和改变。这样有助于节约带宽、化简设计等等。该部分主要功能就是负责集群启动选举Leader,以及当集群不构成集群对外服务条件时进行重新选举。最终目的就是尽可能让集群最快的对外服务。那么什么是集群对外服务条件呢?那就是当前有Leader且Leader与其领导的Followers能够组成一个多数派(超过集群节点半数)。

  DataTree目录结构:内存版的文件系统或者指的是一个数据结构。分布式锁以及名字空间、共享文件就是通过这样的数据结构去实现的。其实这个数据结构并不是很难理解,因为Tree这种结构很擅长去组织层次化的东西,正如xml,json,文件目录那样应用广泛。

  日志快照系统:用于为每个节点容灾考虑设计,事实上光写日志就可以保证容灾,快照是为了更快的去恢复当前内存状态,就像你玩游戏的检查点(check point),下次开机玩就不用从第一关开始了。

  数据操作的Client/Server:一方面集群要对外服务,提供Client和Server。另一方面,集群节点之间内部同步数据时也需要使用这些组件。另外注册-通知机制(观察者模式)也是这部分实现的。

【分布式协调器】Paxos的工程实现-cocklebur简介(二)的更多相关文章

  1. 【分布式协调器】Paxos的工程实现-cocklebur简介(一)

    初识分布式协调器 分布式协调器的“协调”二字让人摸不到头脑,怎么就协调了,用的着协调吗?实际上这个东西在之前就是为了提供分布式锁服务而设计的,伟大的google公司发明了chubby,雅虎随后也推出了 ...

  2. 中小研发团队架构实践之分布式协调器.Net版ZooKeeper

    原文:中小研发团队架构实践之分布式协调器.Net版ZooKeeper 一.ZooKeeper是什么  Apache ZooKeeper是由Apache Hadoop的子项目发展而来,于2010年11月 ...

  3. 中小研发团队架构实践之分布式协调器ZooKeeper

    一.ZooKeeper是什么  Apache ZooKeeper是由Apache Hadoop的子项目发展而来,于2010年11月正式成为了Apache的顶级项目. ZooKeeper是一个开放源代码 ...

  4. 【分布式协调器】Paxos的工程实现-cocklebur选举

    其实整个项目中一个最主要的看点就是选举算法,而这部分也是逻辑最复杂最难理解的部分.不同的实现在不同的场景下的策略也不尽相同,而且场景非常之多.接下来我们一起来看一下Cocklebur的实现思路. 一个 ...

  5. 【分布式协调器】Paxos的工程实现-Cocklebur状态转移

    集群中的主机经过选举过程由Looking状态变为了Leadering或Following状态.而这些状态之间转移的条件是什么呢?先来个直观的,上状态图. 图 4.1 Cocklebur选举过程中的状态 ...

  6. 中小型研发团队架构实践:分布式协调服务ZooKeeper

    一.ZooKeeper 是什么 Apache ZooKeeper 由 Apache Hadoop 的子项目发展而来,于 2010 年 11 月正式成为了 Apache 的顶级项目. 相关厂商内容 优秀 ...

  7. 【分布式协调】之理解paxos

    感叹一下 不得不说近几年国内软件行业发生了巨大的变化,之前几乎所有应用都围绕桌面展开,而近几年很多让人神魂颠倒的关键词一个接一个的映入眼帘:web2.0.移动应用.云计算.大数据.互联网的浪潮一波接着 ...

  8. SqlServer & Windows 可更新订阅立即更新启用分布式事务协调器(MSDTC)

    原文:SqlServer & Windows 可更新订阅立即更新启用分布式事务协调器(MSDTC) 在可更新订阅中,在订阅设置更新方法,将 "排队更新" 设置为 " ...

  9. 分布式系列文章——Paxos算法原理与推导

    Paxos算法在分布式领域具有非常重要的地位.但是Paxos算法有两个比较明显的缺点:1.难以理解 2.工程实现更难. 网上有很多讲解Paxos算法的文章,但是质量参差不齐.看了很多关于Paxos的资 ...

随机推荐

  1. First glance in Go

    Because I forgot to install the Chinese input in this OS, I have to use English input. The first pro ...

  2. Symantec Backup Exec 报"Access denied to directory xxx" Error Code E0008488

    使用Symantec Backup Exec将几台Linux服务器上的RMAN备份收带时,偶尔会遇到作业备份失败的情况,检查Job History,就会发现有“Access denied to dir ...

  3. [20130919]出现有持续性的Lazy Write

    表现:收到性能告警,LazyWrite严重超标,一般在100以上,正常情况下,LazyWrite为0,但是奇怪的是,当时的Free pages =312190左右,相当于2G空闲空间.OS的可用内存在 ...

  4. maven 常见错误解决方法

    1. 最重要的一点,使用国内镜像,比如 oschina.net 的镜像: 搜 jar 推荐:http://maven.outofmemory.cn/,速度极快. 2. 错误:Could not res ...

  5. Linux磁盘管理之磁盘结构、概念、原理01

    一.磁盘的分类 磁盘主要有IDE.SATA.SCSI.IDE是比较老的硬盘,数据速度比较慢:SATA是现在用的比较多的,台式机.笔记本大多都用的SATA硬盘:SCSI硬盘速度最快,但是价格相对较高. ...

  6. Getaddrinfo()笔记

    WSADATA dwRetval; if (WSAStartup(MAKEWORD(2,2),&dwRetval)!=0) //开启Socket { printf("WSAStart ...

  7. android PopupWindow使用实例

    注:点空白或菜单外隐藏popupwindow菜单: 但是,若点击有点击事件的组件则要再写代码手动隐藏: @Override public boolean onTouchEvent(MotionEven ...

  8. Debian deb源方法升级PHP软件包

    学习Linxu以来,一直坚持编译方式安装软件包,貌似圈子里面也是都倾向于编译,可是搜索到的编译方法都是一堆复制粘贴来的指令, 每个人都这么编译, 却几乎没有人去写明那些五花八门的编译指令代表了什么,是 ...

  9. STM32重映射(PinRemap)的使用,注意!

    STM32重映射,内容和细节稍后补充,这里只说几个注意点,花了我一晚上的时间调试终于找到问题所在了... 芯片: STM32f107vct6 晶振: 25M 通过分频器与锁相环,使系统时钟为72M 背 ...

  10. 学习OpenStack之 (2):Cinder LVM 配置

    0.背景 OpenStack 中的实例是不能持久化的,cinder服务重启,实例消失.如果需要挂载 volume,需要在 volume 中实现持久化.Cinder提供持久的块存储,目前仅供给虚拟机挂载 ...