MySQL实战—更新过程
和查询流程不同的是,更新流程涉及两个重要的日志模块:redo log(重做日志)和 binlog(二进制日志)。
redo log
redo log通常是物理日志,记录的是数据页的物理修改,而不是某一行或某几行的修改,它用来恢复提交后的物理数据页(恢复数据页,且只能恢复到最后一次提交的位置)。
如果MySQL每一次的更新操作都需要写进磁盘,整个过程IO成本会很高。使用redo log能提升更新效率,即WAL技术。
WAL
- Write-Ahead Logging
- 先写日志,再写磁盘
更新记录
- InnoDB引擎先把记录写到redo log里面,并更新内存
- InnoDB会在适当的时候,比如系统空闲时,将操作记录更新到磁盘里
在相同的数据量下,采用WAL的数据库系统在事务提交时,磁盘写操作只有传统的回滚日志的一半左右,大大提高了数据库磁盘IO操作的效率,从而提高了数据库的性能。
redo log
redo log大小固定,可配
- 是InnoDB引擎的日志
- 比如一组4个文件,每个文件大小1GB
- 从头开始写,写到末尾又回到开始循环写
- write pos是当前记录的位置,一边写一边后移,写到第 3 号文件末尾后就回到 0 号文件开头
- checkpoint是当前要擦除的位置,也是往后推移并且循环的,擦除记录前要把记录更新到数据文件
- write pos和checkpoint之间是可写部分,用来记录新的操作
- 如果write pos追上Checkpoint,表示没有可写位置了,此时不能执行新的更新,需要停下来擦掉一些记录(将记录更新到磁盘),将checkpoint向前推进

crash-safe
- 通过redo log,InnoDB保证即使数据库发生异常重启,之前提交的记录都不会丢失,这个能力称为crash-safe
更新过程
以下述操作为例。
mysql> create table T(ID int primary key, c int);
mysql> update T set c=c+1 where ID=2;
执行器通过引擎取ID=2这一行。
- ID是主键,引擎直接用树搜索找到这一行
- 如果ID=2这一行所在的数据页本来就在内存中,就直接返回给执行器;
- 否则,需要先从磁盘读入内存,然后再返回。
- 执行器将引擎返回的行数据的这个值加1,即N变成N+1,得到新的一行数据,再调用引擎接口写入新行。
- 引擎将这行新数据更新到内存中,同时将这个更新操作记录到redo log里,此时redo log处于prepare状态。然后告知执行器执行完成了,随时可以提交事务。
- 执行器生成这个操作的binlog,并把binlog写入磁盘。
- 执行器调用引擎的提交事务接口,引擎把刚写入的redo log改成提交(commit)状态,更新完成。
执行流程如下图。浅色步骤在InnoDB内部执行,深色步骤在执行器中执行。

binlog
binlog,即二进制日志,是一个二进制文件,记录了对数据库执行更新的所有操作,并且记录了语句发生时间、执行时长、操作数据等信息。但不记录SELECT、SHOW等查询SQL语句。
二进制日志主要用于数据恢复和主从复制,及审计操作。
- max_binlog_size:日志文件大小上限,二进制日志文件后缀名会由 mysql 自动拼接数字,达到此参数设置大小则写入另一个文件,同时后缀 + 1,所以在设置 log-bin 参数时仅填写路径和文件名即可,后缀名省略
是否开启binlog
log-bin:设置日志文件的位置,设置此参数同时开启日志记录,默认放在 mysql data目录下
mysql> show variables like 'log_bin';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| log_bin | ON |
+---------------+-------+
1 row in set (0.02 sec)
查看binlog
binlog不能直接查看。可以通过官方提供的mysqlbinlog工具查看。
- 确认日志位置
mysql> show master logs;
+------------------+-----------+
| Log_name | File_size |
+------------------+-----------+
| mysql-bin.000120 | 47533445 |
| mysql-bin.000121 | 57556996 |
| mysql-bin.000122 | 190963566 |
+------------------+-----------+
3 rows in set (0.01 sec)
mysql>
mysql>
mysql> show master status;
+------------------+-----------+--------------+------------------+--------------------------------------------------------------------------------------------------------------------------------------------------+
| File | Position | Binlog_Do_DB | Binlog_Ignore_DB | Executed_Gtid_Set |
+------------------+-----------+--------------+------------------+--------------------------------------------------------------------------------------------------------------------------------------------------+
| mysql-bin.000122 | 190964654 | | | a30ccda1-22af-11e9-850a-6c92bf668356:4512526-4520657,
df123bc8-3139-11ea-9587-6c92bf9bf658:1-6937,
e001bcc0-3139-11ea-a763-ac853d9f52c8:1-801427 |
+------------------+-----------+--------------+------------------+--------------------------------------------------------------------------------------------------------------------------------------------------+
1 row in set (0.00 sec)
- 输出文件内容
# 直接查看
mysqlbinlog mysql-bin.xxx //xxx表示文件编号
# 输出到指定文件
mysqlbinlog mysql-bin.xxx > mysqllog.log
# 指定时间段输出
mysqlbinlog --start-datetime '2020-01-08 00:00:00' --stop-datetime '2020-01-08 01:00:00' mysql-bin.xxx > mysqllog.log
如果执行过程出现以下提示,可暂时添加--no-defaults参数跳过检查。
mysqlbinlog:[ERROR] unknown variable 'default-character-set=utf8'
更多内容,请参考https://dev.mysql.com/doc/refman/5.7/en/binary-log.html
两阶段提交
写入redo log分为两个步骤
- prepare
- commit
即,两阶段提交。
为什么需要两阶段提交?
redo log和binlog是两个独立的逻辑,如果不用两阶段提交,要么就是先写完redo log再写binlog,要么反过来。
以上述更新为例。假设当前ID=2,字段c的值为0,并假设执行update过程中写完第一个日志后,发生了crash。看看两种方式会发生什么情况。
先写redo log后写binlog
- 假设redo log写完,binlog没有写完的时候,MySQL 进程异常重启
- redo log写完之后,系统即使崩溃,仍然能够把数据恢复回来,所以恢复后这一行c的值是 1
- 但由于binlog没写完就crash了,这时候binlog里面就没有记录这个语句。因此,之后备份日志的时候,存起来的binlog里面就没有这条语句。
- 如果需要用这个binlog来恢复临时库的话,由于这个语句的binlog丢失,这个临时库就会少了这一次更新,恢复出来的这一行c的值就是0,与原库的值不同。
- 出现不一致
先写binlog后写redo log
- 假设binlog写完之后,redo log没有写完的时候crash
- 由于redo log还没写,崩溃恢复以后这个事务无效,所以这一行c的值是0。
- 但是 binlog 里面已经记录了“把c从0改成1”这个日志。
- 后续用binlog恢复的时候就多了一个事务出来,恢复出来的这一行c的值就是 1,与原库的值不同。
- 也出现不一致
可以看出,如果不使用“两阶段提交”,数据库的状态有可能和用binlog恢复出来的库的状态不一致。
MySQL实战—更新过程的更多相关文章
- MySQL实战45讲学习笔记:第十五讲
一.引子 在今天这篇答疑文章更新前,MySQL 实战这个专栏已经更新了 14 篇.在这些文章中,大家在评论区留下了很多高质量的留言.现在,每篇文章的评论区都有热心的同学帮忙总结文章知识点,也有不少同学 ...
- 《MySQL实战45讲》(8-15)笔记
MySQL实战45讲 目录 MySQL实战45讲 第八节: 事务到底是隔离的还是不隔离的? 在MySQL里,有两个"视图"的概念: "快照"在MVCC里是怎么工 ...
- mysql实战之 批量update
mysql实战之批量update 现阶段我们的业务量很小,要对admin_user表中的relationship字段进行更新,指定id是409.已知409是公司内的一服务中心,需要把该服务中心放到区代 ...
- centos mysql 实战 第一节课 安全加固 mysql安装
centos mysql 实战 第一节课 安全加固 mysql安装 percona名字的由来=consultation 顾问+performance 性能=per con a mysql ...
- MySQL实战 | 04 为什么要使用索引?
原文链接:MySQL实战 | 为什么要使用索引? 用过 MySQL 的应该都知道索引是干啥的吧,应该多少都设置过索引,但是若是问你索引是怎么实现的,你能说上来吗? 索引是什么? MySQL 官方对索引 ...
- MySQL实战 | 06/07 简单说说MySQL中的锁
原文链接:MySQL实战 | 06/07 简单说说MySQL中的锁 本文思维导图:https://mubu.com/doc/AOa-5t-IsG 锁是计算机协调多个进程或纯线程并发访问某一资源的机制. ...
- MySQL实战 | 03 - 谁动了我的数据:浅析MySQL的事务隔离级别
原文链接:这一次,带你搞清楚MySQL的事务隔离级别! 使用过关系型数据库的,应该都事务的概念有所了解,知道事务有 ACID 四个基本属性:原子性(Atomicity).一致性(Consistency ...
- MySQL实战 | 01-当执行一条 select 语句时,MySQL 到底做了啥?
原文链接:当执行一条 select 语句时,MySQL 到底做了啥? 也许,你也跟我一样,在遇到数据库问题时,总时茫然失措,想重启解决问题,又怕导致数据丢失,更怕重启失败,影响业务. 就算重启成功了, ...
- 极客时间 Mysql实战45讲 07讲行锁功过:怎么减少行锁对性能的影响笔记 极客时间
极客时间 Mysql实战45讲 07讲行锁功过:怎么减少行锁对性能的影响笔记 极客时间极客时间 Mysql实战45讲 07讲行锁功过:怎么减少行锁对性能的影响笔记 极客时间 笔记体会: 方案一,事务相 ...
- Mysql实战45讲 06讲全局锁和表锁:给表加个字段怎么有这么多阻碍 极客时间 读书笔记
Mysql实战45讲 极客时间 读书笔记 Mysql实战45讲 极客时间 读书笔记 笔记体会: 根据加锁范围:MySQL里面的锁可以分为:全局锁.表级锁.行级锁 一.全局锁:对整个数据库实例加锁.My ...
随机推荐
- Apollo3 Blue SoC 和 Apollo3 Blue Plus SoC的区别
一 芯片简介 1.简介 Apollo3 Blue系列SoC解决方案代表了超低功耗设计的巨大飞跃,其运行模式和睡眠模式下的功耗数值均十分出色,并且具有高性能的处理引擎. Apollo3Blue器件提供了 ...
- Android Studio虚拟机文件默认C盘转移其他盘
原文地址:Android Studio虚拟机文件默认C盘转移其他盘 - Stars-One的杂货小窝 某天发现,新创建的Android13模拟器,把我C盘搞得只剩下9G了,于是折腾了下,把模拟器相关文 ...
- 记springBoot一直报Exception authenticating MongoCredential.
项目场景: 场景:继上回docker安装好了mongo,然后自己本地项目尝试搭建使用连接mongo 问题描述: 按照别人写的文章教程一步步操作,最后自己本地尝试连接查询,跳出这个用户权限不够,发生了套 ...
- [极客大挑战 2019]web部分题解(sql部分已完结,其他部分正在更新,出去吃个饭先)
[极客大挑战 2019]BabySQL 打开环境后有登录界面◕‿◕ 一眼注入,后先试试万能密码: username:admin' or '1'='1 password:1 GG,出大问题,我就会这一招 ...
- 浅析倾斜摄影三维模型(3D)几何坐标精度偏差的几个因素
浅析倾斜摄影三维模型(3D)几何坐标精度偏差的几个因素 倾斜摄影是一种通过倾斜角度较大的相机拍摄建筑物.地形等场景,从而生成高精度的三维模型的技术.然而,在进行倾斜摄影操作时,由于多种因素的影响,导致 ...
- B站框框老师+宋浩老师概率论视频课笔记,宋浩老师数理统计视频课笔记
只做理解类记录,哪个知识点忘了去看视频.前四章是概率,看的框框老师. 概率论 1.随机试验:可重复性.可预知性.不确定性 2.样本空间:随机试验E的所有可能结果,记为S或Ω 3.样本点:样本空间中的每 ...
- 《.NET内存管理宝典 》(Pro .NET Memory Management) 阅读指南 - 第2章
本章勘误: 暂无,等待细心的你告诉我哦. 本章注解: 出处:2.2.6 Windows内存布局 原文: segment heap:用于Universal Windows Platform程序,它提供了 ...
- KingbaesES数据库查看阻止vacuum的常用语句
KingbaesES数据库中遇到表膨胀,有时碰到vacuum失效的场景.最常见的原因如下. 以下测试基于有关analyze和autovacuum的默认阈值触发条件. 1.autovacuum是否运行, ...
- 巧用dblink 实现多进程并行查询
概述 对于分区表的大数据统计分析,由于数据量巨大,往往需要采用并行.但是数据库并行的效率相比分进程分表统计还是有比较大的差距.本文通过巧用dblink,实现分进程分分区统计数据. 例子 kingbas ...
- KingbaseES Json 系列四:Json数据操作函数二
KingbaseES Json 系列四--Json数据操作函数二(JSONB_PRETTY,JSONB_STRIP_NULLS,JSON_OBJECTAGG,JSON_EQUAL,JSON_EXIST ...