mysql的读分快照读和当前读

快照读 是指写的同时,读不阻塞,达到并发的作用

这时候的读 是 记录的历史版本,存在于undo里,当然回滚时就的也是这个undo

当执行一条update语句时,记录本身保持不变,会再insert一条语句的,新记录的回滚指针指向旧的记录,同时新记录有个新的事务id

当新记录对于其他事务不可见时(也就是该事务的begin时间要早于commit update旧记录的时间),延着回滚指针,找到上一个版本的记录,看该记录 是否能让 该事务看到

delete操作不会直接删除掉,只是在record header中置删除标志位,待purge进程将其真正删除

现在有表mytest

CREATE TABLE `mytest` (
`id` int() NOT NULL AUTO_INCREMENT,
`name` char() NOT NULL,
`age` int() NOT NULL,
PRIMARY KEY (`id`),
KEY `idx_age` (`age`)
) ENGINE=InnoDB

insert into mytest  values ('', 'aaa', 30);

那么这条记录对应的逻辑记录是这样的,(逻辑记录指人类能识别的,非物理记录,即非二进制记录)

          变长字段长度偏移量(逆序)
      null位图
        主键id
        事务id
        回滚id
    aaa的asicii

假设其事务id为1,同时 回滚id 为空

mysql> select * from mytest;
+----+------+-----+
| id | name | age |
+----+------+-----+
| | aaa | |
+----+------+-----+
row in set (0.00 sec)

执行update操作时,并不是直接在相应记录更新,而是先复制一份新的记录 到undo log,然后 再更新,产生新的事务id并且 其 回滚指针 指向 被复制那条旧的undo log

read view 读视图,每开启一个事务时,就会把当前活跃的事务id 收集起来,根据id排列,最大的id为max trx id,最小的id为min trx id (活跃记录就是还没有commit的记录)

那么事务中的select中读取每一天记录时,要取出其trx id 跟 上面的id做比较

if( record_trx_id < min_trx_id){
//记录可见
}else {
if(record_trx_id > max_trx_id ){
//说明这条记录还没有commit, 这条记录不可见,但可通过其记录中的回滚指针,找到相应记录,看能否可见
}else{
if( ! in_array(record_trx_id , array(活跃事务id)){
//可见
}else{
//说明这条记录还没有commit, 这条记录不可见,但可通过其记录中的回滚指针,找到相应记录,看能否可见
}
}
}

两年前在13号线上看这个规则时,怎么想也想不透,前些日子躺在床上翻手机,一个mysql群里,老叶共享一篇微信文章,讲的是mvcc的内容,里面涉及到读视图这部分,终于恍然大悟

1)假设会话b使用自动提交

会话a                          会话b

                            set autocommit=1; //默认自动提交

set autocommit=0;                  select * from mytest; //这个时候 name还是aaa,是因为此时的事务id为2,aaa这条记录的事务id为1,说明aaa该记录已经提交成功,可见

update mytest set name='bb' where id=1;

id不为原来的1了,现在为3,

同时3事务这条记录的回滚指针指向1           select * from mytest; //这个时候 name仍是aaa,由于是自动提交,

                            //那么默认的begin时间明显早于事务a的commit时间,所以只能看到begin时间前的数据

                            //确切来说是 此时新的事务id为4,当分析到aaa该记录时,发现其事务id为3,

commit;

                            select * from mytest; //这个时候 name改成bb了,

                            //因为默认的begin时间明显晚于事务a的commit时间 

2)假设会话b放也是手动提交

                            set autocommit=0;

                            begin;

set autocommit=0; 

begin                         select * from mytest; //这个时候 name还是aaa

update mytest set name='bb' where id=1;

commit;

                            select * from mytest; //这个时候 name仍是aaa 

      

可以看到会话1在更新id=1这条记录时,会话2没有被阻塞,这里用到的是MVCC 多版本一致性控制 技术  

在第二个例子里, 事务b的begin 时间 明显早于事务a的commit,那么 事务a的操作 对于 事务b来说是不可见的,也就是说事务b在执行select * from mytest的时候,选取的数据都是 begin之前的数据,之前的数据对于事务b来说,是可见的

如果使用快照读,读到的可能是老数据,可以使用当前读,

例如 select * from table where id = 1 for update;

默认情况下,innodb对于当前读会加next key lock,当 where条件使用了聚焦索引或唯一索引时,会降级为record lock,只锁id为1的这个记录,应该是索引记录?

由于是X lock,排它锁,其他事务不能读,不能写这条记录,倒是可以使用乐观锁,排它锁可理解为悲观锁,先上一把锁,再操作记录,但性能不太好,乐观锁本身没有用到锁,乐观的认为不用锁,只用个version字段来判断

例如

$sql="select * from table where id=1";
$version = $sql->getRow($sql)['versoin'];
$sql ="update table set name='bb' and version=version+1 where id=1 and version=$version";
$affectRows = $db->getAffectRow($sql);
if(!$affectRows){
再重试几次
}

假设事务 自动开启

 

假设事务a                        事务b

取得$version=100;                   取得$version=100;

然后更新sql , version变成101              更新sql,发现更新失败 0 rows affected,再重试

如果事务 手动执行

begin                                            begin

取得$version=100                                      取得$version=100  

update mytest  set version=version+1, name="dd4" where  version=100 and id=1;   update mytest  set version=version+1,

                                              name="dd4" where  version=100 and id=1; //被阻塞

commit;

                                               //提交了,但0 rows affected

每开启一个事务时,都会有一个trx_id

if( record_trx_id < min_trx_id) 可见

else if (record_trx_id > max_trx_id) 不可见

事务A的三条SQL 结果是一样的

分析:

where id=1 的trx_id为1

执行事务A时的trx_id 为2, 执行事务B时的 trx_id为3

对事务A而言, 能看到trx_id只有2,即自己, oldest_trx_id为1, 且 newest_trx_id也为1

第一条sql: selec * from 表, 里面只有一条记录,且该 记录的 trx_id 为1,  明显小于 2, 即访记录已提交, 其他事务可见

第二条sql: selet * from  表,这个时候, 事务B已经发生了, 且那条记录的 trx_id为3,大于newest_trx_id, 故对事务A来说不可见

第三条sql: select * from  表,虽然事务B已经提交了,但事务A刚begin时,事务b的trx_id大于newest_trx_id, 依然显示id=1的这一条数据

if( ! in_array(record_trx_id , array(活跃事务id)) 可见

else 不可见

事务A  trx_id 2

事务B  trx_id 3

事务C  trx_id 4

事务C中的此时的oldest_trx_id为2, newest_trx_id 4, read view为 2, 3,4

第一个SQL: select * from 表  , id=1的trx_id 为1, 1小于oldest_trx_id, 对于事务C来说 是已经提交过的,对事务C 是可见了的

第二个SQL:  select * from 表, id=2的trx_id为3, 3 在可见视图里,肯定是未提交 ,对于事务不可见

第三个SQL; select * from 表   ,同上, 此时的 事务看见的视图,还是2,3,4

Read Commited  ,Repeatable read 数据可见性判断

Read Commited 和 Repeatable read 采用相同的数据可见性判断逻辑。
那么怎么在相同的判断逻辑下 分别 实现 RC 和 RR 级别的?

  • Read Commited
    在每次语句执行的过程中,都关闭read_view, 重新创建当前的一份新的read_view。
    这样就可以根据当前的全局事务链表创建read_view的事务区间,实现read committed隔离级别。

  • Repeatable read
    在repeatable read的隔离级别下,创建事务trx结构的时候,就生成了当前的global read view。
    使用trx_assign_read_view函数创建,一直维持到事务结束,这样就实现了repeatable read隔离级别。

正是因为Read Commited和 Repeatable read的read view 生成方式和时机不同,导致在不同隔离级别下,read committed 总是读最新一份快照数据,而repeatable read 读事务开始时的行数据版本。

链接:https://www.imooc.com/article/details/id/31277

http://roverll.iteye.com/blog/2048079

对于可见性判断,分配聚集索引和二级索引。聚集索引:

 记录的DATA_TRX_ID < view->up_limit_id:在创建read view时,修改该记录的事务已提交,该记录可见

DATA_TRX_ID >= view->low_limit_id:当前事务启动后被修改,该记录不可见

DATA_TRX_ID 位于(view->up_limit_id,view->low_limit_id):需要在活跃读写事务数组查找trx_id是否存在,如果存在,记录对于当前read view是不可见的。

二级索引:

由于InnoDB的二级索引只保存page最后更新的trx_id,当利用二级索引进行查询的时候,如果page的trx_id小于view->up_limit_id,可以直接判断page的所有记录对于当前view是可见的,否则需要回clustered索引进行判断。

5)如果记录对于view不可见,需要通过记录的DB_ROLL_PTR指针遍历history list构造当前view可见版本数据

6)start transaction和begin语句执行后并没有在innodb层分配事务ID、回滚段、read_view、将事务放到读写事务链表等,这个操作需要第一个SQL语句调用函数trx_start_low来完成,这个需要注意。

mysql 快照读MVCC的更多相关文章

  1. MySQL——一致性非锁定读(快照读)&MVCC

    MySQL--一致性非锁定读(快照读) MySQL数据库中读分为一致性非锁定读.一致性锁定读 一致性非锁定读(快照读),普通的SELECT,通过多版本并发控制(MVCC)实现. 一致性锁定读(当前读) ...

  2. 【MySQL】当前读、快照读、MVCC

    当前读: select...lock in share mode (共享读锁) select...for update update , delete , insert 当前读, 读取的是最新版本, ...

  3. mysql并发控制之快照读和当前读

    上一篇简单的介绍了下MVCC(多版本并发控制)的原理,MVCC会对事物内操作的数据做多版本控制,从而实现并发环境下事物对数据写操作的阻塞不影响读操作的性能.而这个多版本控制的实现是由undo log来 ...

  4. 《快照读、当前读和MVCC》

    1.快照读 快照读是基于 MVCC 和 undo log 来实现的,适用于简单 select 语句,避免了幻读. 读已提交:一个事务内操作一条数据,可以查询到另一个已提交事务操作同一条数据的最新值.( ...

  5. mysql幻读、MVCC、间隙锁、意向锁(IX\IS)

    IO即性能 顺序主键写性能很高,由于B+树的结构,主键如果是顺序的,则磁盘页的数据会按顺序填充,减少数据移动,随机主键则可能由于记录移动产生很多io 查询二级索引时,会再根据主键id获取数据页,产生一 ...

  6. MySQL 一致性读 深入研究

    一致性读,又称为快照读.使用的是MVCC机制读取undo中的已经提交的数据.所以它的读取是非阻塞的. 相关文档:http://dev.mysql.com/doc/refman/5.6/en/innod ...

  7. MySQL 一致性读 深入研究 digdeep博客学习

    http://www.cnblogs.com/digdeep/p/4947694.html 一致性读,又称为快照读.使用的是MVCC机制读取undo中的已经提交的数据.所以它的读取是非阻塞的. 相关文 ...

  8. [MySQL] 一致性读分析

    MySQL MVCC MySQL InnoDB存储引起实现的是基于多版本的并发控制协议---MVCC(Multi-Version Concurrency Control),基于锁的并发控制,Lock- ...

  9. Innodb中的快照读和当前读

    一.前言 上篇文章记录了对MVCC的相关理解,其中有提到快照读.其实在MVCC并发控制中,读操作可以分为两类:快照读(snapshot read)和当前读(current read)   二.什么是快 ...

随机推荐

  1. solr 搭建 (基于solr-5.0.0)

    1)去官网下载solr 2)去官网下载Tomcat 3)在D盘建一个文件夹(我在此建立了一个文件夹(命名为:sorl_lf)) 4)解压Tomcat(如果已经安装了Tomcat,请配置支持多个Tomc ...

  2. xml与java代码相互装换的工具类

    这是一个java操作xml文件的工具类,最大的亮点在于能够通过工具类直接生成xml同样层次结构的java代码,也就是说,只要你定义好了xml的模板,就能一键生成java代码.省下了自己再使用工具类写代 ...

  3. typeof()和instanceof的用法区别

    typeof() typeof() 是一个一元运算,放在一个运算数之前,运算数可以是任意类型.它返回值是一个字符串,该字符串说明运算数的类型.,typeof一般只能返回如下几个结果:number,bo ...

  4. 实践作业4:Web测试实践(小组作业)每日任务记录3

    会议时间:2017年12月23日 会议地点:东九教学楼自习区 主  持  人:王晨懿 参会人员:王晨懿.余晨晨.郑锦波.杨潇.侯欢.汪元 记  录  人:王晨懿 会议议题:小组作业第二阶段 下面是今天 ...

  5. 【转载】Redis的Java客户端Jedis的八种调用方式(事务、管道、分布式…)介绍

    转载地址:http://blog.csdn.net/truong/article/details/46711045 关键字:Redis的Java客户端Jedis的八种调用方式(事务.管道.分布式…)介 ...

  6. Lua中“.”调用方法与“:”调用方法的区别

    Lua中“.”调用方法与“:”调用方法的区别:                                                                             ...

  7. How To Start Building Spatially Aware Apps With Google’s Project Tango

    How To Start Building Spatially Aware Apps With Google’s Project Tango “Tango can enable a whole new ...

  8. SPOJ - AMR11A(DP)

    Thanks a lot for helping Harry Potter in finding the Sorcerer's Stone of Immortality in October. Did ...

  9. GCT感受

    GCT考试已经结束了,但是复习GCT的时候一直没来得及总结点什么,GCT考的比较基础,所以复习起来并不是特别费力,但是还是有一些东西值得我们去学习的. 对于GCT考试,一开始在报名的时候其实心里是挺抵 ...

  10. css中padding和magin的区别

    1.Margin 用来设置页面中一个元素所占空间的边缘到相邻元素之间的距离. 如果提供全部四个参数值,将按上-右-下-左的顺序作用于四边.   如果只提供一个,将用于全部的四边.   如果提供两个,第 ...