BASE 理论是由 Dan Pritchett 在 ACM 上发表的一篇论文中提出的理论。是在 CAP 理论基础上提出的一种更实际的理论指导,和 PACELC 理论是有些相近的地方的。

BASE 是指 基本可用Basically Available)、软状态Soft State)、最终一致性Eventual Consistency)。

对于目前的互联网应用,基本上都不会是单机系统,而是多机分布式系统,所以 CAP 中的 P 是一定要的特性。剩下的 C P 根据实际场景取舍。BASE 就是一种取舍方案的指导。

假设我们微服务系统结构是:

假设我们系统有如下几个业务需求:

  1. 查询账户余额(涉及账户微服务)
  2. 商品下单(涉及账户微服务,订单微服务,商品微服务)
  3. 商品剩余库存(涉及商品微服务)
  4. 查看用户订单(涉及订单微服务,商品微服务)

1. 基本可用(Basically Available)

基本可用主要包括三点:

  1. 目前系统能承受的压力范围内的请求是正常处理的,超过范围的可能处理不正常,但是不能因为这些请求影响正常的请求。
  2. 响应时间正常,在压力大的时候,响应时间可能增长,但是不能超过一定时间
  3. 可以忍受一定的功能损失,在某些系统出问题的时候,其他系统应该保证本身业务接口正常的运行。

1.1. 目前系统能承受的压力范围内的请求是正常处理的

在双 11 的时候,用户量会突然增高,并且这个量很难预测,尤其是商品下单的业务压力会增大很多,可能超过系统的极限。在超过系统极限的时候,可能会导致整个系统都不可用(例如超过超时极限导致很多请求在队列排队导致后续请求也排队从而雪崩),这是不可取的。

所以,一般会考虑动态扩容,根据业务压力,进行相应的系统微服务的扩容。并且由于动态扩容一般具有滞后性,还需要加上限流器,对某些敏感业务请求根据微服务数量进行动态限制,防止雪崩的出现。

1.2. 响应时间正常

在闲时,用户请求下单可能是毫秒级返回,在系统压力大的时候,这个响应时间可以适当加大,例如 3s 返回。但是这个响应超时时间不要设置太长,第一影响用户体验,第二会导致更多请求排队。

对于不同的业务接口最好设置不同的响应超时时间,例如查询账户余额超时时间短一些,查看用户订单可以稍微长一些。

可以根据系统接口的平均响应时间,请求的个数,制定系统扩容策略

1.3. 可以忍受一定的功能损失

这个主要在于微服务的拆分,以及服务降级策略

比如现在商品微服务因为压力过大挂了,或者重启,这时候的业务:

  1. 查询账户余额(涉及账户微服务),这个由于微服务隔离不受影响
  2. 查询商品剩余库存(涉及商品微服务),这个系统挂了,需要服务降级,例如返回商品库存加载中(前端定时查询),或者商品库存为 0.
  3. 商品下单,目前不可用
  4. 查看用户的订单,可能里面的商品信息显示不出来(服务降级),但是订单列表,以及其中的订单金额、交易时间信息等等应该可以展示,而不是整个接口报异常。

2. 软状态(Soft State)

指的是允许系统中的数据存在中间状态,并认为该状态不影响系统的整体可用性,即允许系统在多个不同节点的数据副本存在数据延时。

例如下单,订单可以有 初始化 -> 已冻结金额 -> 已扣库存 -> 已扣款 -> 下单成功 这几个状态,如果扣库存失败则变为 待解冻金额 -> 下单失败 状态,分别对应下单的几个中间逻辑。除了下单成功下单失败以外,其他的都是软状态,并不是最终状态。基本上所有的软状态都需要对应的补偿任务。有了这些中间状态,即使系统重启,也可以通过这些中间状态补偿重试将下单逻辑走下去。

查询订单的时候,在已冻结金额状态之后的订单就可以展示给用户看了,在下单成功之前,都可以显示为处理中。在扣库存失败之后,可以显示为退款中

3. 最终一致性(Eventually Consistent)

上面提到的软状态,并不会一直保持在这个软状态,而是最终通过系统正常逻辑或者补偿逻辑走向最终状态,各个节点也会同步这个最终状态,这就是最终一致性。

Werner Vogels针对这个最终一致性,总结了五种实现最终一致性的不同场景方案,分别是:

  • Causal consistency(因果一致性)
  • Read-your-writes consistency(读你所写一致性)
  • Session consistency(会话级别一致性)
  • Monotonic read consistency(单调读一致性)
  • Monotonic write consistency(单调写一致性)

在实际的实践中,这 5 种设计方案往往会互相结合使用,以构建一个具有最终一致性的分布式系统。

3.1. Causal consistency(因果一致性)

因果关系的意思是进程 A 的修改会通知进程 B,没有因果一致性的就是进程 A 的修改不会通知进程 C。对于有因果关系的进程,他们访问的数据应该是强一致性的,没有这个关系的走的是最终一致性。

举一个例子,用户查看商品库存的请求是非常巨大的,并且能接受一点时间内的不一致。假设为了应对这么大的请求,这个库存在商品微服务实例本地也缓存了一份,并且会随着收到下单请求就会将缓存失效重新获取扣库存后最新的库存量,同时这个缓存 5s 后一定会过期(真正扣库存不会使用这个缓存,这个仅仅展示用)。那么下单请求通过订单微服务 RPC 请求的商品微服务实例上面的库存就是最新的库存,其他实例的库存可能有点滞后性。

3.2. Read-your-writes consistency(读你所写一致性)

进程 A 在更新了数据项之后,总是访问更新的值,永远不会看到旧的值。这是因果一致性模型的一个特例

3.3. Session consistency(会话级别一致性)

在同一个会话内的修改,是可以立刻读取到最终修改的。在其他会话可能不会立刻读取到。

例如数据库的主从同步,请求在这个会话内写入主数据库,那么主数据库会话能立刻读取到这个修改,根据数据库的双 1 同步配置,默认情况下,只有同步完成后才能读取到这个修改。

3.4. Monotonic read consistency(单调读一致性)

如果一个节点从系统中读取出一个数据项的某个值后,那么系统对于该节点后续的任何数据访问都不应该返回更旧版本的值。

3.5. Monotonic write consistency(单调写一致性)

系统要保证同一个节点的写操作是顺序执行的。

微信搜索“我的编程喵”关注公众号,每日一刷,轻松提升技术,斩获各种offer

2021-2-20:请你说说分布式系统 BASE 理论是什么?的更多相关文章

  1. 分布式系统的BASE理论

    一.BASE理论 eBay的架构师Dan Pritchett源于对大规模分布式系统的实践总结,在ACM上发表文章提出BASE理论,BASE理论是对CAP理论的延伸,核心思想是即使无法做到强一致性(St ...

  2. 分布式系统的CAP和BASE理论

    1. 背景 网络分区:俗称“脑裂”.当网络发生异常情况,导致分布式系统中部分节点之间的网络延时不断变大,最终导致组成分布式系统的所有节点中,只有部分节点之间能够进行正常通信,而另一些节点则不能. 当网 ...

  3. 2021.07.20 P3951 小凯的疑惑(最大公因数,未证)

    2021.07.20 P3951 小凯的疑惑(最大公因数,未证) 重点: 1.最大公因数 题意: 求ax+by最大的表示不了的数(a,b给定 x,y非负). 分析: 不会.--2021.07.20 代 ...

  4. 2021.07.20 CF1477A Nezzar and Board(最大公因数,未证)

    2021.07.20 CF1477A Nezzar and Board(最大公因数,未证) CF1477A Nezzar and Board - 洛谷 | 计算机科学教育新生态 (luogu.com. ...

  5. 分布式系统中的CAP原理和BASE理论

    CAP是一致性(Consistency).可用性(Availability).分区容忍性(Partition tolerance)的缩写.CAP原理指的是这三个要素最多只能同时实现两点,不可能三者兼顾 ...

  6. 从分布式一致性谈到CAP理论、BASE理论

    问题的提出 在计算机科学领域,分布式一致性是一个相当重要且被广泛探索与论证问题,首先来看三种业务场景. 1.火车站售票 假如说我们的终端用户是一位经常坐火车的旅行家,通常他是去车站的售票处购买车票,然 ...

  7. 分布式之 BASE理论

    ------------------------------珍惜眼前的学习机会,当你现在有机会学习各种经验时,一定要倍加珍惜.靠混日子是混不了一辈子的,许多过程都是不能省略的,至少学会这些经验可以让你 ...

  8. 【分布式】1、CAP原则(CAP定理)、BASE理论

    CAP原则又称CAP定理,指的是在一个分布式系统中, Consistency(一致性). Availability(可用性).Partition tolerance(分区容错性),三者不可得兼. CA ...

  9. 分布式系统理论--CAP理论、BASE理论

    问题的提出 在计算机科学领域,分布式一致性是一个相当重要且被广泛探索与论证问题,首先来看三种业务场景. 1.火车站售票 假如说我们的终端用户是一位经常坐火车的旅行家,通常他是去车站的售票处购买车票,然 ...

随机推荐

  1. idea一定要做的配置

    自动编译开关 忽略大小写开关 IDEA默认匹配大小写,如果你开了这个开关,你无论输入String或者string都会出现代码提示或者智能补充 智能导包开关 两个选项勾上:自动导入不明确的结构.智能优化 ...

  2. 分布式缓存 — memcache

    MemCache是一个自由.源码开放.高性能.分布式的分布式内存对象缓存系统,用于动态Web应用以减轻数据库的负载.它通过在内存中缓存数据和对象来减少读取数据库的次数,从而提高了网站访问的速度.Mem ...

  3. Excel 常用数据类型、自定义格式、特殊值等等

    常用数据类型: 常规: 常规单元榴格式不包含慑拍H靛的数字格式. 数值: 可以设置小数位数,是否使用千位分割符,以及负数样式 货币: 可以设置小数位数,货币符号,以及负数样式 会计专用: 可以设置小数 ...

  4. navicat连接阿里云mysql数据库服务器遇到的1130等相关问题

    最近搭建自己的博客网站的时候使用了阿里云的云服务器ESC,搭建了一个mysql数据库,在windows下使用navicat连接mysql的时候,总是连接不上,出现了1130的问题等等错误信息. 下面将 ...

  5. cmath取整函数

    #include <iostream> #include <cmath>//头文件 using namespace std; int main () { double n; c ...

  6. Codeforces Round #481 (Div. 3) C. Letters (模拟,二分)

    题意:有个\(n\)个公寓,每个公寓\(a_{i}\)代表着编号为\(1-a_{i}\)个房间,给你房间号,问它在第几栋公寓的第几个房间. 题解:对每个公寓的房间号记一个前缀和,二分查找属于第几个公寓 ...

  7. 四、Jmeter 集合点(实际场景应用)

    一.jmeter集合点的作用域及作用范围 先明确一些概念:1)定时器是在每个sampler(采样器)之前执行的,而不是之后: 是的,你没有看错,不管这个定时器的位置放在sampler之后,还是之下,它 ...

  8. 国产网络损伤仪SandStorm -- 基本概念:什么是仿真引擎

    "仿真引擎"在网络损伤仪SandStorm(www.minismb.com)或者网络IP仿真损伤仪中是一个最基本概念,它就相当于一个由两个物理以太网口组成的"网桥&quo ...

  9. woj1009 最短路 The Legend of Valiant Emigration

    title: woj1009 最短路 The Legend of Valiant Emigration date: 2020-03-07 categories: acm tags: [acm,最短路, ...

  10. Leetcode(337)-打家劫舍III

    小偷又发现一个新的可行窃的地点. 这个地区只有一个入口,称为"根". 除了根部之外,每栋房子有且只有一个父房子. 一番侦察之后,聪明的小偷意识到"这个地方的所有房屋形成了 ...