Glusterfs冗余镜像（AFR）修复原理以及脑裂分析

研究Glusterfs半年多了，通过实际操作以及源代码分析，对它有了越来越深的了解，由衷的赞叹Gluster的整体架构。今天时间不早了，想写点关于Glusterfs的冗余镜像产生脑裂的原因。

首先，简单描述一下脑裂，所谓脑裂，就是指两个或多个节点都“认为”自身是正常节点而互相“指责”对方，导致不能选取正确的节点进行接管或修复，导致脑裂状态。这种现象出现在数据修复、集群管理等等高可用场景。

Glusterfs的冗余镜像（下文简称AFR）提供了数据副本功能，能够在即使只有一个冗余节点的情况下仍能正常工作，不中断上层应用。当节点恢复后，能够将数据修复到一致状态，保证数据的安全。

AFR工作原理

AFR数据修复主要涉及三个方面：ENTRY，META，DATA，我们以冗余度为2即含有两个副本A和B的DATA修复为例进行讲解。记录描述副本状态的称之为ChangeLog，记录在每个副本文件扩展属性里，读入内存后以矩阵形式判断是否需要修复以及要以哪个副本为Source进行修复。初始值以及正常值为0.（注：ENTRY和META,DATA分布对应着一个数值）。

Write的步骤可分解为：

1）下发Write操作。

2）加锁Lock。

3）向A，B副本的ChangeLog分别加1，记录到各个副本的扩展属性中。

4）对A，B副本进行写操作。

5）若该副本写成功则ChangeLog减1，若该副本写失败则ChangLog值不变，记录到各个副本的扩展属性中。

6）解锁UnLock。

7）向上层返回，只要有一个副本写成功就返回成功。

上述在AFR中是完整的一个transaction动作。根据两个副本记录的ChangeLog的数值确定了副本的几种状态：

1）WISE，智慧的，即该副本的ChangeLog中对方对应的数值大于0而且自身对应的数值等于0.

2）INNOCENT，无辜的，即该副本上的ChangeLog即不指责对方也指责自己，ChangeLog全为0.

3）FOOL，愚蠢的，即该副本上的ChangeLog是指责自己的。

4）IGNORANT，忽略的，即该副本的ChangeLog丢失。

所以一般情况下，会选取WISE的副本作为Sourse进行修复。但是当两个节点都是WISE状态时，这就出现了声名狼藉的脑裂状态。

AFR脑裂

两个副本均为WISE时发生脑裂，那么在哪种场景下会产生脑裂呢？我们还是以冗余度为2的情况举一个简单的例子：某文件X的两个副本位于物理机A和物理机B上，在A和B上分别运行着进程a和进程b，a和b持续通过各自所在的物理机上的客户端对文件X进行不同的写操作。然后物理机A和B之间网络中断，因为AFR在一个副本的情况下仍能不中断上层应用，所以进程a和进程b仍会持续运行，但因为网络中断，文件X在A和B上的副本数据不再一致且都认为对方是异常的，当网络恢复时，两个副本互相“指责”，即出现了脑裂。当然这是脑裂发生的场景之一，有时候是有可能发生脑裂，而有时候是必然发生脑裂。脑裂，也是很多人关心的一个问题，不能一概而论。

关于脑裂，我个人认为不同的场景处理方法也是不同的，甚至某些场景的脑裂是无法避免的，只能尽量避免脑裂的发生。好了，今天就写到这里吧。晚安~

原文出处：

Glusterfs冗余镜像（AFR）修复原理以及脑裂分析
http://www.iesool.com/forum.php?mod=viewthread&tid=90&fromuid=2
(出处: 吖Sool-社区)

Glusterfs冗余镜像（AFR）修复原理以及脑裂分析的更多相关文章

GlusterFS数据存储脑裂修复方案最全解析
本文档介绍了glusterfs中可用于监视复制卷状态的heal info命令以及解决脑裂的方法一. 概念解析常见术语名称解释 Brick GlusterFS 的基本存储单元,由可信存储池中服务 ...
PostgreSQL 一主多从(多副本,强同步)简明手册 - 配置、压测、监控、切换、防脑裂、修复、0丢失 - 珍藏级
参考来源: https://github.com/digoal/blog/blob/master/201803/20180326_01.md#postgresql-一主多从多副本强同步简明手册---配 ...
HA 脑裂原理
HA 脑裂原理 “裂脑”,乃一个形象的术语,系HA系统危机情景. 引子:“裂脑”是治疗“癫痫”病的一种手术.医生们认为癫痫病发作是由于大脑“异常放电”所至.为了阻止“异常放电”波及整个大脑(左.右半脑 ...
Namenode HA原理详解（脑裂）
转自:http://blog.csdn.net/tantexian/article/details/40109331 Namenode HA原理详解社区hadoop2.2.0 release版本开始 ...
Andfix热修复原理
一.前言最近腾讯弄出一个Tinker热修复框架,那么本文先不介绍这个框架,先来介绍一下阿里的一个热修复框架AndFix,这个框架出来已经很长时间了,但是看网上没有太多非常详细的讲解,这里就来做一次分 ...
HBase运维基础--元数据逆向修复原理
背景鉴于上次一篇文章——“云HBase小组成功抢救某公司自建HBase集群,挽救30+T数据”的读者反馈,对HBase的逆向工程比较感兴趣,并咨询如何使用相应工具进行运维等等.总的来说,就是想更深层 ...
后盾网lavarel视频项目---5、淘宝镜像cnpm的原理及如何使用
后盾网lavarel视频项目---5.淘宝镜像cnpm的原理及如何使用一.总结一句话总结: 原理:把npm上面的所有软件copy过来使用:npm install -g cnpm --regist ...
【Docker】7. 镜像-加载原理、分层原理、commit镜像
一.什么是镜像镜像是一种轻量级.可执行的独立软件包,用来打包软件运行环境和基于运行环境开发的软件. 它包含运行某个软件所需的所有内容,包括代码.运行时环境.库.环境变量和配置文件. 所有的应用,直接 ...
【Redis集群原理专题】分析一下相关的Redis集群模式下的脑裂问题！
技术格言世界上并没有完美的程序,但是我们并不因此而沮丧,因为写程序就是一个不断追求完美的过程. 什么是脑裂字面含义首先,脑裂从字面上理解就是脑袋裂开了,就是思想分家了,就是有了两个山头,就是有了 ...

随机推荐

分享知识-快乐自己：mybatis 主键回调
以下两种方式实现主键回掉方式.  <insert id="insertUser" useGeneratedKeys=&quo ...
JavaUtil_06_HttpUtil_使用httpclient实现
一.简介使用 appache 的 httpclient 来实现的二.源码 package com.ray.weixin.gz.util; import java.io.File; import j ...
FileInputStream 原理总结把文件作为字节流进行读操作
package io; import java.io.FileInputStream; import java.io.IOException; public class IOUtil { /** * ...
Tomcat报错：HTTP Status 500 - Wrapper cannot find servlet class
HTTP Status 500 - Wrapper cannot find servlet class com.servlet.servlet.RegServlet or a class it dep ...
如果你使用WebView+FloatingActionButton
在WebView中想要使用FAB,如果你想向上滑动的时候隐藏FAB,那么需要再WebView外面套一个ScrollView! 原因之前也分析过,和为什么ListView不能让ToolBar.Tab隐藏 ...
SPOJ Query on a tree III (树剖(dfs序)+主席树 || Splay等平衡树)（询问点）
You are given a node-labeled rooted tree with n nodes. Define the query (x, k): Find the node whose ...
训练集、测试集loss容易出现的问题总结
train loss 不断下降,test loss不断下降:说明网络仍在学习; train loss 不断下降,test loss趋于不变:说明网络过拟合; train loss 趋于不变,test ...
Poj 3356 ACGT（LCS 或带备忘的递归）
题意:把一个字符串通过增.删.改三种操作变成另外一个字符串,求最少的操作数. 分析: 可以用LCS求出最大公共子序列,再把两个串中更长的那一串中不是公共子序列的部分删除. 分析可知两个字符串的距离肯定 ...
uva 512
1. 问题不知道怎么存储操作看代码注释,else if等 2. 代码 #include <iostream> #include <stdio.h> #include < ...
3.JasperReports学习笔记3-在浏览器生成PDF文件
转自:https://i.cnblogs.com/posts?categoryid=921197 一.新建web工程,导入jasperreports所需的jar包,配置web.xml <serv ...

Glusterfs冗余镜像（AFR）修复原理以及脑裂分析

Glusterfs冗余镜像（AFR）修复原理以及脑裂分析的更多相关文章

随机推荐

热门专题