ACID:关系型数据库中事务的4个属性:
 
Atomicity,原子性,整个事务的所有操作,要么全部完成,要么全部不完成,不可能停滞在中间的某个环节。事务在执行过程中出错,会回滚到事务开始前的状态,就像没发生一样。

 
Consistency,一致性,在事务开始之前和结束之后,数据的完整性没有被破换。
所谓数据完整性,是指数据是正确无误的,没有歧义的。如果数据存在自相矛盾,不相容的地方,则其完整性被破坏了。
 
Isolation,隔离性,两个事务的执行是互不干扰的,一个事务不能看到其他事务运行时中间某一时刻的数据。
 
Durability,持久性,事务结束之后,该事务对数据库所做的修改会持久地保存在数据库中,不会被回滚。
 
CAP理论:分布式系统中只能同时满足CAP中的两个:
 
Consistency,一致性,有两方面含义。
一方面是指无论何时何地访问这个数据,都会得到相同的结果,即保证行为的一致。比如,A写入一个数据,那么下次读时应该能看到上次写的数据,否则就出现了不一致。
另一方面是指数据在分布式系统中,不存在歧义,即保证数据的一致。比如,数据的多个副本都是相同的,否则就出现了歧义。
Availability,可用性,是指分布式系统时刻能够提供服务,不存在暂停服务的时刻。
Partition Tolerance,分区容忍性,是指数据不受分布式的影响,即使某个节点失效,也不会出现数据错误、失效等问题。
 
可以看出,同时满足CAP是不可能的。
如想保证一致性和可用性,那么就不能再分布式。因为分布式会破坏一致性或者可用性中的一者,也就是说一定会破坏两者的组合。
如想保证分布式和一致性,那么就必须在系统运行的某个时刻,暂停服务,进行数据同步,这就破坏了可用性。
如想保证分布式和可用性,那么系统时刻不停机,就没有机会进行数据同步,也就破坏了一致性。
 
BASE:分布式系统与关系型数据库相对的3个属性:
Basically Availability,基本可用性,这个称呼可能有些歧义,应该翻译为“主要可用性”,实际上BASE的目的就是舍去Consistency,而得到Availability,因此,这里应理解为一切以可用性为主。
 
Soft State,软状态,是指系统介于stateful和stateless之间,只维护一定的信息,作为高速缓存,这些信息实际上可以通过一定的计算重新得到(如从周围节点收集信息汇总),因此即使丢失也无所谓。当系统出错时,可以迅速恢复状态。
 
Eventually Consistency,最终一致性,为弱一致性的一种特例,是指系统中多副本之间并不是时刻保持一致的(言外之意,不同用户,或者同一用户的不同时刻,可能会读到不一致的数据),但系统最终会在某个时刻变得一致(如经过数据同步)。
 
从用户(Client)看到的角度讲:
强一致性(Strong Consistency),保证对a修改之后(事务完成之后),任何用户马上就能看到a的最新值。
弱一致性(Weak Consistency),对a修改后,不保证所有用户都能看到最新值。最终一致性是弱一致性的特例。
 
从系统内部(Server)的角度讲:
一致性的意思是,在分布式系统中,数据之间必须相容,不存在有歧义的地方。如多个副本的内要容相同,或者有多个版本但版本之间不冲突。又如不能同时存在这三条导致矛盾的记录:a>b,b>c,a<c。
可以看出,在系统内部,数据不一定是严格一致的,只要保证用户看到的是一致的即可。
Dynamo提供采用NRW模型来描述一致性:
N 数据副本的总数
R 每次读取的副本数
W 每次写的副本数
系统要想向外提供强一致性,则保证R+W>N即可,也即R集合和W集合存在交集,这样用户在读时,至少能得到一个最新的记录,进而通过版本号/时间戳/Vector Clock来决定选择哪一个记录。
否则,若系统只能保证R+W<=N,则它就是弱一致性的。
在同时向多个节点同步数据时,通常采用两阶段提交协议(Two Phase Commit),该协议分两个阶段,第一阶段为准备阶段(Prepare),master向所有的slave发送写请求,slave收到请求后,做一定的操作(如判断是否有冲突),然后向master回复是否同意写请求,master收到所有回复后,再判断是否进行提交。最后,进入提交阶段(Commit),master向所有slave发送提交请求,slave收到后正式将修改持久化。
Dynamo在写W个副本时,采用了改进的2PC,即如果准备阶段W中有节点没有响应,则尝试W之外的节点,保证收到W个节点的响应,才会进入提交阶段。
HDFS在同步写多个副本时,也采用了改进的2PC,即先以pipeline的方式,向多个副本写数据,其过程中只要有一个节点写失败,则整个写操作失败,只有当所有节点都成功后(后面的节点会向前级联反馈),发起者才决定写成功(向NameNode提交)。

ACID和CAP, BASE的更多相关文章

  1. 分布式系列文章——从ACID到CAP/BASE

    事务 事务的定义: 事务(Transaction)是由一系列对系统中数据进行访问与更新的操作所组成的一个程序执行逻辑单元(Unit),狭义上的事务特指数据库事务. 事务的作用: 当多个应用程序并发访问 ...

  2. 分布式系列文章 —— 从 ACID 到 CAP / BASE

    转自:https://mp.weixin.qq.com/s?amp;mid=2652037708&__biz=MzI0NDI0MTgyOA%3D%3D&idx=1&chksm= ...

  3. 1.2 从 ACID 到 CAP/BASE

    1.事务 事务(Tranction)是指,由一系列对系统中数据进行访问与更新操作,所组成的一个逻辑执行单元.狭义上的事务是指数据库事务. 事务有四个特性. 原子性:原子性要求事务只允讲有两种状态,全部 ...

  4. 分布式理论系列(一)从 ACID 到 CAP 到 BASE

    分布式理论系列(一)从 ACID 到 CAP 到 BASE 一.ACID 1.1 事务的四个特征: (1) Atomic(原子性) 事务必须是一个原子的操作序列单元,事务中包含的各项操作在一次执行过程 ...

  5. [转帖]浅谈分布式一致性与CAP/BASE/ACID理论

    浅谈分布式一致性与CAP/BASE/ACID理论 https://www.cnblogs.com/zhang-qc/p/6783657.html ##转载请注明 CAP理论(98年秋提出,99年正式发 ...

  6. 分布式中 CAP BASE ACID 理解(转载)

    概念理解(CAP,BASE, ACID) CAP CAP:  Consistency, Availability, Partition-tolerance 强一致性(Consistency).系统在执 ...

  7. 从ACID到CAP及BASE

    从ACID到CAP及BASE ACID 说到事务,肯定想到事务的ACID特性,即原子性(Atomicity).一致性(Consistency).隔离性(Isolation).持久性(Durabilit ...

  8. 分布式数据库中CAP原理(CAP+BASE)

    分布式数据库中CAP原理(CAP+BASE) 传统的ACID 1)原子性(Atomicity): 事务里的所有操作要么全部做完,要么都不做,事务成功的条件是事务里的所有操作都成功. 2)一致性(Con ...

  9. 事务,acid,cap,paxos随笔

    事务ACID四个特性: A:原子性(Atomicity)C:一致性(Consistency)I:隔离性(Isolation)D:持久性(Durability) 原子性:语句要么全执行,要么全不执行,是 ...

随机推荐

  1. iOS 的音频播放

    一.Audio Toolbox 1.使用代码 #import <AudioToolbox/AudioToolbox.h> AudioServicesPlaySystemSound(1106 ...

  2. nginx 反向代理到目录

    upstream yg{ server 127.0.0.x; } server { listen 80; server_name www.hikaru.pw; location / { rewrite ...

  3. java模拟http请求

    java模拟http发送请求,第一种是HttpURLConnection发送post请求,第二种是使用httpclient模拟post请求, 方法一: package main.utils; impo ...

  4. JavaWeb(三十五)——使用JDBC处理Oracle大数据

    一.Oracle中大数据处理 在Oracle中,LOB(Large Object,大型对象)类型的字段现在用得越来越多了.因为这种类型的字段,容量大(最多能容纳4GB的数据),且一个表中可以有多个这种 ...

  5. 常用常忘的delegate,记一下。

    多线程: 1 new Thread(new ThreadStart(Method1))).Start(); 1 new Thread(new ParameterizedThreadStart(Meth ...

  6. 博弈论(Game Theory) - 04 - 纳什均衡

    博弈论(Game Theory) - 04 - 纳什均衡 开始 纳什均衡和最大最小定理是博弈论的两大基石. 博弈不仅仅是对抗,也包括合作和迁就,纳什均衡能够解决这些问题,提供了在数学上一个完美的理论. ...

  7. 《图解 HTTP 》阅读 —— 第二章

    第2章 简单的http协议 http 协议用于客户端和服务器端的通信. 请求访问文本或图像等资源的一端称为客户端,提供资源响应的一端称为服务器端. 请求报文: 响应报文: 为了能够处理大量的事务,ht ...

  8. NodeJS实现同步的方法

    NodeJS被打上了单线程.非阻塞.事件驱动…..等标签. 在单线程的情况下,是无法开启子线程的.经过了很久的研究,发现并没有thread函数!!!但是有时候,我们确实需要“多线程”处理事务.node ...

  9. 性能测试持续集成(Jenkins+Ant+Jmeter)

    一.环境准备: 1.JDK:http://www.oracle.com/technetwork/java/javase/downloads/index.html 2.Jmeter:http://jme ...

  10. mysql group by 取第一条

    select * from table where id in (select max(id) from table group by sku) 说明:id是自增序列,sku是表中的一个字段