MySQL 15 日志相关问题追问
先放一下两阶段提交的图,在后续问题中会用到:

问题
在MySQL 02中,讲到为什么要使用两阶段提交时用的是反证法,说明了如果不使用两阶段提交,会导致MySQL出现主备数据不一致等问题。
那么如果在两阶段提交的不同瞬间,MySQL如果发生异常重启,是怎么保证数据完整性的呢?
如果在图中时刻A,也就是写入redo log后、写binlog前发生了崩溃,由于此时binlog还没写,redo log也还没提交,所以崩溃恢复的时候,该事务会回滚。因为binlog还没写,也不会传到备库。
如果在图中时刻B,也就是binlog写完,redo log还没commit前发送崩溃,会怎么样呢?
先看一下崩溃恢复时的判断规则:
如果redo log里的事务是完整的,也就是已经有commit标识,则直接提交;
如果redo log里的事务只有完整的prepare,则判断对应的事务binlog是否存在并完整:
是,则提交事务;
否,回滚事务。
因此,时刻B崩溃恢复过程中事务会被提交。
追问1:MySQL怎么知道binlog是完整的?
一个事务的binlog有完整的格式:
statement格式的binlog,最后会有COMMIT语句;
row格式的binlog,最后会有一个XID event作为标识。
在MySQL 5.6.2 版本后,还引入了binlog-checksum参数,用来验证binlog内容的正确性。对于binlog日志由于磁盘原因可能在日志中间出错的情况,MySQL可以通过校验该参数的结果来发现。
追问2:redo log和binlog是怎么关联起来的?
两者有一个共同的数据字段XID。崩溃恢复的时候,会按顺序扫描redo log:
如果碰到既有prepare,又有commit的redo log,就直接提交;
如果碰到只有prepare,而没有commit的redo log,就拿着XID去binlog找对应的事务。
追问3:为什么设计为,prepare的redo log+完整binlog,重启就能恢复?
这个问题也与数据与备份的一致性有关。在时刻B,binlog已经写完,之后会被从库使用,因此在主库上也要提交这个事务,才能做到一致性。
追问4:如果这样为什么还要两阶段提交?为什么不先把redo log写完,再写binlog。而等崩溃恢复要求两个日志都完整?
两阶段提交是经典的分布式系统问题,并不是MySQL独有的。如果必须要说明这样设计的原因,那就是事务的持久性问题。
对于InnoDB来说,如果redo log提交完成,事务就不能回滚。而如果redo log直接提交,然后binlog写入失败,InnoDB又无法回滚,那么数据和binlog又不一致了。
追问5:只用binlog来支持崩溃恢复可以吗?
即把流程改为:… -> 数据更新到内存 -> 写binlog -> 提交事务。
答案是不可以的。
从历史原因说,InnoDB不是MySQL的原生存储引擎,而MyISAM设计之初就没有支持崩溃恢复。
从实现上说,如果只用binlog:

如图,假如在binlog2写完但整个事务还没有commit时,MySQL发生crash,重启后引擎内部事务2会回滚,但对于事务1来说,系统认为已经提交完成,不会再应用一次binlog1。
如果InnoDB使用的是WAL技术,执行事务的时候,写完内存和日志,事务就算完成。如果之后崩溃,要依赖日志来恢复数据页。那么这种情况下,由于不应用binlog1,事务1也可能丢失,而且是数据页级别的丢失。此时,binlog里没有记录数据页的更新细节,是补不回来的。
追问6:那能只用redo log,不要binlog吗?
如果只从崩溃恢复的角度来说是可以的。
使用binlog主要是它有着redo log无法替代的功能:
归档。redo log是循环写,历史日志无法保留,起不到归档的作用。
MySQL高可用的基础就是binlog复制。
很多公司有异构系统,这些系统靠消费MySQL的binlog来更新自己的数据。关掉binlog的话,这些下游系统就没法输入。
追问7:redo log一般设置多大?
如果redo log太小,会导致很快写满。
对于几个TB的磁盘,一般将redo log设置为4个文件,每个文件1GB。
追问8:正常运行的实例,数据写入后的最终落盘,是从redo log更新过来的还是从buffer pool更新过来的?
redo log并没有记录数据页的完整数据,所以它并没有能力自己去更新磁盘数据页,也就不存在“数据最终落盘,是由redo log更新过去”的情况。
如果是正常运行的实例,数据页被修改以后,跟磁盘的数据页不一致,称为脏页。最终数据落盘,就是把内存中的数据页写盘;
在崩溃恢复场景,如果一个数据页在崩溃恢复时丢失了更新,InnoDB会将其读到内存,然后让redo log更新内存内容。更新完成后,同上。
追问9:redo log buffer是什么?在写入时,是先修改内存,还是先写redo log文件?
redo log buffer是一块内存,是在事务还没commit时,先保存redo日志内容的。
真正把日志写到redo log文件(文件名为ib_logfile+数字),是在执行commit语句时候完成的。
MySQL 15 日志相关问题追问的更多相关文章
- MySQL的日志相关内容
本篇文章介绍一下mysql的备份和日志,由于备份时需要用到日志,所以在讲备份前,如果日志内容篇幅过长,将会把日志和备份分开单独来讲,先简单介绍一下mysql的日志相关内容. MySQL日志 日志是my ...
- MySQL重做日志相关
Ⅰ.事务的实现 这里我们先抛出答案,通过答案再展开分析 特性 实现 A(原子性) redo C(一致性) undo I(隔离性) lock D(持久性) redo/undo 本节针对redo展开分 ...
- MySQL二进制日志总结
二进制日志简单介绍 MySQL的二进制日志(binary log)是一个二进制文件,主要用于记录修改数据或有可能引起数据变更的MySQL语句.二进制日志(binary log)中记录了对MySQL数据 ...
- mysql慢查询日志相关参数
-- mysql慢查询日志相关参数 -- 慢查询日志时间 show variables like "long_query_time"; -- 将时间设置为2s ; -- 是否开启慢 ...
- MySQL各类日志文件相关变量介绍
文章转自:http://www.ywnds.com/?p=3721 MySQL各类日志文件相关变量介绍 查询所有日志的变量 1 mysql> show global variables li ...
- MySQL的日志(一)
本文目录:1.日志刷新操作2.错误日志3.一般查询日志4.慢查询日志5.二进制日志 5.1 二进制日志文件 5.2 查看二进制日志 5.2.1 mysqlbinlog 5.2.2 show binar ...
- MySQL的日志(二):事务日志
本文目录:1.redo log 1.1 redo log和二进制日志的区别 1.2 redo log的基本概念 1.3 日志块(log block) 1.4 log group和redo log fi ...
- 详细分析MySQL的日志(一)
官方手册:https://dev.mysql.com/doc/refman/5.7/en/server-logs.html 不管是哪个数据库产品,一定会有日志文件.在MariaDB/MySQL中,主要 ...
- 详细分析MySQL事务日志(redo log和undo log)
innodb事务日志包括redo log和undo log.redo log是重做日志,提供前滚操作,undo log是回滚日志,提供回滚操作. undo log不是redo log的逆向过程,其实它 ...
- 【MySQL (六) | 详细分析MySQL事务日志redo log】
Reference: https://www.cnblogs.com/f-ck-need-u/archive/2018/05/08/9010872.html 引言 为了最大程度避免数据写入时 IO ...
随机推荐
- MySQL 的乐观锁和悲观锁是什么?
MySQL 的乐观锁和悲观锁是什么? 在并发环境下,为了避免数据竞争和保证数据一致性,可以使用不同的锁策略.乐观锁和悲观锁是两种常见的并发控制机制,它们在锁定数据时的理念和实现方式上有显著区别. 1. ...
- 使用搜索引擎时如何排除一些垃圾站点,比如csdn.net
使用搜索引擎时需要排除一些垃圾站点,比如csdn.net时,可以在关键词后面加上-site:csdn.net: stable diffusion docker部署TensorFlow 教程 -site ...
- 『Plotly实战指南』--样式定制基础篇
在数据可视化的世界中,一个精心设计的图表不仅能准确传达信息,还能提升整体的专业性和吸引力. 而Plotly作为Python中强大的可视化库,提供了丰富的样式定制功能,帮助我们轻松实现这一目标. 本文从 ...
- 代码随想录第二十五天 | Leecode 491. 非递减子序列、46. 全排列、47. 全排列 II
Leecode 491. 非递减子序列 题目描述 给你一个整数数组 nums ,找出并返回所有该数组中不同的递增子序列,递增子序列中 至少有两个元素 .你可以按 任意顺序 返回答案. 数组中可能含有重 ...
- 【记录】环境|Ubuntu18.04 中搭建 Python 开发和调试环境的完整记录
文章目录 安装Python并切换 1 安装某个版本 方式一:pyenv安装(强烈推荐) 方式二:apt安装(不推荐) Python3 Python2 查看所有apt装上的版本 2 切换python版本 ...
- ArkUI-X跨平台框架接入指南
ArkUI跨平台框架(ArkUI-X)进一步将ArkUI开发框架扩展到了多个OS平台:目前支持OpenHarmony.Android. iOS,后续会逐步增加更多平台支持.开发者基于一套主代码,就可以 ...
- maven安装教程(亲测有用)
先去https://maven.apache.org/download.cgi下第二个: 自己下不下来的,微信搜我公众号[勾玉技术]发送关键字[maven]获取百度云链接下载. 解压到任意文件夹,记得 ...
- 《HelloGitHub》第 110 期
兴趣是最好的老师,HelloGitHub 让你对开源感兴趣! 简介 HelloGitHub 分享 GitHub 上有趣.入门级的开源项目. github.com/521xueweihan/HelloG ...
- 【2020.11.23提高组模拟】徒(walk) 题解
[2020.11.23提高组模拟]徒(walk) 题解 题目描述 给一个简单连通无向图,选一个点为起点,每次选一条没有走过的边走,若无则停止.问是否存在一个起点使得无论如何选择,走出来的路径一定是欧拉 ...
- Spring扩展接口-InstantiationAwareBeanPostProcessor
.markdown-body { line-height: 1.75; font-weight: 400; font-size: 16px; overflow-x: hidden; color: rg ...