这篇我觉得有点难度,我会更慢的更详细的分析一些 case 。

MySQL 的默认事务隔离级别和其他几个主流数据库隔离级别不同,他的事务隔离级别是 RR(REPEATABLE-READ) 其他的主流数据库比如 oracle 通常是 RC(READ-COMMITTED)

关于数据库有哪些隔离级别我这里就不详细阐述了,大概是什么特性我这里就不阐述了大家可以自行翻阅资料,让我们聚焦这两个最重要的隔离级别在一些查询更新的时候会出现什么样的特性表达。

当我们使用 RR 的时候,事务启动的时候会创建一个视图 read-view,之后事务执行期间,即使有其他事务修改了数据,事务看到的仍然和她启动的时候看到的一样。也就是说,一个在可重复读隔离级别下执行的事务不受外界影响。

但是上一篇分享锁的文章里面我们也提到了,如果说另外一个事务对表加了行锁,他会被锁住进入等待状态。那么当等待状态结束,这个事务自己要获取行锁更新数据的时候,他读到的值是什么呢?

来看个例子

mysql> CREATE TABLE `t` (
`id` int(11) NOT NULL,
`k` int(11) DEFAULT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB;
insert into t(id, k) values(1,1),(2,2);

然后使用这个事务启动顺序来测试

这里有几个点需要注意,我们在数据库使用事务 begin/start transaction 命令并不是一个事务的起点,在执行到第一个操作 InnooDB 表的语句,事务才被真正启动。

如果我们要马上启动一个一致性读事务使用 start transaction with consistent snapshot 这个。

它的含义是:执行 start transaction 同时建立本事务一致性读的 snapshot . 而不是等到执行第一条语句时,才开始事务,并且建立一致性读的 snapshot 。

文章中说,这个顺序查询,事务 B 查询到的 id =1 的 k 值是3,事务 A 查询到的值 k 值是 1。我起初也无法理解,下面让我们一步一步来得出结论。

快照”在 MVCC 里是怎么工作的?

在可重复读隔离级别下,事务在启动的时候就拍了快照。InnoDB 里面每个事务有一个唯一的事务 ID, 叫 transaction id。它是在事务开始的时候向 InnoDB 的事务系统申请的。是按照申请顺序递增的。每行数据也有多个版本,每次事务更新数据的时候,都会生成一个新的数据版本,并且把 transaction id 赋值给这个数据版本的事务 ID, row trx_id。旧的数据版本要保留,并且新的数据版本中,能够有信息可以直接拿到。

当前最新版本是 V4 V4 版本是经过一系列更新之后得到的最新的状态。 他的 row trx_id = 25。

u1 u2 u3 都是 undo log 的记录,我们可以在 v4 通过 undolog 恢复到版本v1 v2 v3 并不是物理上真实存在的。

这里按照可重复度的定义,当一个事务启动的时候,能偶看到所有已经提交的事务结果。但是之后,这个事务执行期间,其他事务的更新对它不可见。

因此一个在 RR 事务级别启动一个事务的时候声明说,以我启动的时刻为准,如果一个数据版本是在我启动之前生成的就认,如果是我启动之后才生成的,就不认,我必须找到他的上一个版本。如果上一个版本也不可见,就继续往前找。当然如果是这个事务自己本身更新的数据,它自己是要认的。

在实现上, InnoDB 为每个事务构造了一个数组,用来保存这个事务启动的时候,当前正在“活跃”的所有事务 ID,“活跃”指的是,启动了但是还没有提交。

这个数组组成了一个类似这样的东西

低水位:指获取到这个数组内的 trx_id 最小值。

高水位:指获取到的这个数组内的 trx_id 最大值 + 1

这样对于当前事务启动的瞬间来说,一个数据版本的 row trx_id 有以下几种可能。

1. 如果落在绿色部分,标示这个版本是已经提价的事务护着当前自己事务生成的,这个数据是可见的。

2. 如果落在红色部分,标示这个版本是由将来的事务生成的,是不可见的。

3. 如果落在黄色部分,

a. 如果 row trx_id 在数组中,标示这个版本是由还没有提交哦的事务生成的,不可见。

b. 如果 row trx_id 不在数组中,标示这个版本是已经提交了的事务生成的,可见。

下面我们用上面的理论拉来解释一下为什么我第一张图的查询结果会是那个样子。

1. 假设 事务 A 开始前,系统里面没有哦活跃事务 ID .

2. 事务 A 开始时候的事务版本号为 100 事务 B 开始时候的事务版本号为 101 事务 C 开始时候的事务版本号为 102。

3. 三个事务开始前 id =1 k =1 的数据 row trx_id 是 90.

事务 A 开始的时候事务数组为 [100]

事务 B 开始时候的事务数组为 [100, 101]

事务 C 开始时候的事务数组为 [100, 101, 102]

祖先版本是 id =1, k=2 对应版本是 90。

第一个有效更新的事务是 C 当 C 完成更新之后 102 版本就是对应 id = 1 k = 2.

这个时候由于版本 102 无论对于事务 B 还是 事务 A 都处于高水位,所以都是不见的。也就是说现在我们执行

select * from t where id = 1 会发现

mysql> select * from t;
+----+------+
| id | k |
+----+------+
| 1 | 1 |
| 2 | 2 |
+----+------+

这个时候第二个有效事务 B 更新了,把数据从 id =1 k = 2 变更为 id =1 k=3,这个时候数据的最新版本变成了 101,而102 变成了历史版本。

注意这个时候事务 B 会发现自己的数据没有经过 k=2 这一步 直接就变成 k =3 了。。。因为事务 C 更新并且提交了,我们在这个基础上增加会读取到 102 的更新。

但是事务 A 还是无法读取到 102 版本和 101 版本的更新,因为他们都在高水位,所以最终读取到的还是 id =1 k=1。

但是真实的情况 事务 A 是会去判断的,也就是说他会找到最后一个被更新的版本 101 会发现是高水位不可见。

接着找上一个版本 102 还是高水位不可见。

最后找到原始版本 90 处于低于低水位的区域可见。

这样执行下来,虽然期间这一行数据被修改过,但是事务 A 无论在什么时候查询,看到这行数据的结果都是一致的,所以我们称为一致性读。

RR 的更新数据都是先读后写的,这个读就是当前读。这可以解释为什么我们可以跳过 k=2 直接 k=3。因为在 k=1 的时候进行当前读发现 k=2 了,然后再 +1 就 k=3 了。

当然 select xx for update | lock in share mode 也是当前读。

我觉得 此片文章到此就差不多了。感觉老师后面以紧接着介绍了一些无关紧要的东西 包括 RC 的情况。给本来就比较难以理解的情况搞得更复杂了。

现在我解除到大部分公司的 DB 使用 MySQL 都会将事务隔离级别从默认的 RR 设置到 RC,更好理解也可以更方便的用乐观锁来保证数据的一致性。并且我感觉如果不使用当前读,可能还会对性能有一定的影响。毕竟上面介绍到的流程里面,是需要扫 undolog 参与的,感觉这些可能都会有一定的性能损失。

Reference:

本读书笔记皆来自发布在极客时间的 林晓斌(丁奇)的 MySQL 实战45讲:

极客时间版权所有: https://time.geekbang.org/ 版权所有:

https://time.geekbang.org/column/article/70562

【MySQL 读书笔记】RR(REPEATABLE-READ)事务隔离详解的更多相关文章

  1. Net Core中数据库事务隔离详解——以Dapper和Mysql为例

    Net Core中数据库事务隔离详解--以Dapper和Mysql为例 事务隔离级别 准备工作 Read uncommitted 读未提交 Read committed 读取提交内容 Repeatab ...

  2. MySQL提升笔记(3)日志文件详解

    在MySQL数据库和InnoDB存储引擎中,有很多种文件,如:参数文件.日志文件.socket文件.pid文件.MySQL表结构文件.存储引擎文件. 本节重点关注日志文件,MySQL的复制.事务等重要 ...

  3. Windows驱动——读书笔记《Windows驱动开发技术详解》

    =================================版权声明================================= 版权声明:原创文章 谢绝转载  请通过右侧公告中的“联系邮 ...

  4. (转)Spring事务管理详解

    背景:之前一直在学习数据库中的相关事务,而忽略了spring中的事务配置,在阿里面试时候基本是惨败,这里做一个总结. 可能是最漂亮的Spring事务管理详解 https://github.com/Sn ...

  5. 【Spring】——声明式事务配置详解

    项目中用到了spring的事务: @Transactional(rollbackFor = Exception.class, transactionManager = "zebraTrans ...

  6. 可能是最漂亮的Spring事务管理详解

    Java面试通关手册(Java学习指南):https://github.com/Snailclimb/Java_Guide 微信阅读地址链接:可能是最漂亮的Spring事务管理详解 事务概念回顾 什么 ...

  7. 可能是最漂亮的Spring事务管理详解 专题

    微信阅读地址链接:可能是最漂亮的Spring事务管理详解 事务概念回顾 什么是事务? 事务是逻辑上的一组操作,要么都执行,要么都不执行. 事物的特性(ACID): 原子性: 事务是最小的执行单位,不允 ...

  8. 最漂亮的Spring事务管理详解

    SnailClimb 2018年05月21日阅读 7245 可能是最漂亮的Spring事务管理详解 Java面试通关手册(Java学习指南):github.com/Snailclimb/- 微信阅读地 ...

  9. Redis的事务功能详解

    Redis的事务功能详解 MULTI.EXEC.DISCARD和WATCH命令是Redis事务功能的基础.Redis事务允许在一次单独的步骤中执行一组命令,并且可以保证如下两个重要事项: >Re ...

随机推荐

  1. Vue2.0源码阅读笔记(一):选项合并

      Vue本质是上来说是一个函数,在其通过new关键字构造调用时,会完成一系列初始化过程.通过Vue框架进行开发,基本上是通过向Vue函数中传入不同的参数选项来完成的.参数选项往往需要加以合并,主要有 ...

  2. Redis协议规范(RESP)

    Redis 即 REmote Dictionary Server (远程字典服务): 而Redis的协议规范是 Redis Serialization Protocol (Redis序列化协议) 该协 ...

  3. k8s网络之Flannel网络

    k8s网络主题系列: 一.k8s网络之设计与实现 二.k8s网络之Flannel网络 三.k8s网络之Calico网络 简介 Flannel是CoreOS团队针对Kubernetes设计的一个网络规划 ...

  4. ES6躬行记(21)——类的继承

    ES6的继承依然是基于原型的继承,但语法更为简洁清晰.通过一个extends关键字,就能描述两个类之间的继承关系(如下代码所示),在此关键字之前的Man是子类(即派生类),而在其之后的People是父 ...

  5. Data Lake Analytics + OSS数据文件格式处理大全

    0. 前言 Data Lake Analytics是Serverless化的云上交互式查询分析服务.用户可以使用标准的SQL语句,对存储在OSS.TableStore上的数据无需移动,直接进行查询分析 ...

  6. 搞懂Redis RDB和AOF持久化及工作原理

    前言 因为Redis的数据都储存在内存中,当进程退出时,所有数据都将丢失.为了保证数据安全,Redis支持RDB和AOF两种持久化机制有效避免数据丢失问题.RDB可以看作在某一时刻Redis的快照(s ...

  7. Windows环境下安装配置Mosquitto服务及入门操作介绍

    关键字:在windows安装mosquitto,在mosquitto中配置日志,在mosquitto中配置用户账号密码 关于Mosquitto配置的资料网上还是有几篇的,但是看来看去,基本上都是基于L ...

  8. SpringBoot学习笔记(一)入门

    1.重新认识Spring 假如临危受命需要开发一个简单的基于Spring的web程序,你该做什么?可能想到一些基本的需要: 项目结构,其中可选择使用Maven或Gradle构建.其中包含例如Sprin ...

  9. 学习day01

    1.web C/S:Client Server 客户端 服务器 QQ,... B/S:Browser Server 浏览器 服务器 PC机:Personal Computer 个人电脑 2.HTML ...

  10. java基础(四):谈谈java中的IO流

    1.字节流 1.1.字节输出流output 1.1.1.数据写入文件中 通过api查找output.找到很多,其中java.io.OutputStream,OutputStream: 输出字节流的超类 ...