MySQL源码之两阶段提交
在双1的情况下,两阶段提交的过程
环境准备:mysql 5.5.18, innodb 1.1 version
配置:
sync_binlog=1
innodb_flush_log_at_trx_commit=1
autocommit=0
设置断点:
sql_parse.cc::dispatch_command --命令跳转入口
sql_parse.cc::mysql_parse
sql_parse.cc::mysql_execute_command
sql_parse.cc::trans_commit_stmt --语句commit入口
handler.cc::ha_commit_trans --commit入口
log.cc::binlog_prepare --binlog prepare入口
Ha_innodb.cc::innobase_xa_prepare --innodb prepare入口
log.cc::binlog_commit --binlog commit入口
Ha_innodb.cc::innobase_commit --innodb commit入口
实验步骤
步骤1:
use test;
create table xpchild(id int auto_increment primary key, name varchar(100));
insert into xpchild(1,'xpchild');
步骤1过程:
1. dispatch_command:
command = COM_QUERY
inc_thread_running():增加thread running
statistic_increment:增加计数
switch (command):跳转命令
2. mysql_execute_command:
解析命令为:SQLCOM_INSERT
3. mysql_insert:
跳转到真正的insert
bool log_on= (thd->variables.option_bits & OPTION_BIN_LOG):判断是否打开了binlog
open_and_lock_tables(thd, table_list, TRUE, 0):打开table并锁表
4. trans_commit_stmt:
语句级别的提交
if (thd->transaction.stmt.ha_list)
res= ha_commit_trans(thd, FALSE);
针对语句所有参与的引擎进行提交, 但这里all的参数是false,说明是语句的提交动作,而非真正的事务commit。
5. ha_commit_trans:
这里trans=all ? &thd->transaction.all : &thd->transaction.stmt,说明是stmt的transaction。
ha_check_and_coalesce_trx_read_only:判断事务是否需要两阶段提交
for (Ha_trx_info *hi= ha_info; hi; hi= hi->next())
一共有两个引擎参与:binlog&&innodb
进入prepare阶段:
5.1. binlog_prepare:
直接返回什么也没有做
5.2. innobase_xa_prepare:
all参数是false,innodb认为是语句级别的提交,就只做如下的事情:
row_unlock_table_autoinc_for_mysql(trx);释放语句hold的auto_increment锁
trx_mark_sql_stat_end(trx);记录本语句的undo信息,以便语句级的回滚
进入提交阶段:
commit_one_phase_low(thd, all, trans, is_real_trans);
5.3. binlog_commit
只是cache了statement的binlog,没有做flush操作
5.4. innobase_commit
row_unlock_table_autoinc_for_mysql(trx);释放了自增锁
trx_mark_sql_stat_end(trx);记录本语句的undo信息
这个地方做的事情和prepare阶段一样,多做虽然没有坏处,但也没有看到有什么意义
srv_active_wake_master_thread:给主线程发信号唤醒,就结束
6. close_thread_tables(thd)
在mysql_execute_command中close table,然后这次命令就结束了。
步骤2:
commit
1. 前面的步骤都相似:
mysql_execute_command函数中跳转到trans_commit进行真正的提交。
2. ha_commit_trans
进入commit函数,传入参数all=true,为真正的提交动作。
检查rw_ha_count= ha_check_and_coalesce_trx_read_only(thd, ha_info, all)
rw_ha_count=2 代表binlog引擎和innodb引擎
is_real_trans=true
进入两阶段提交过程:
3. binlog_prepare:
直接return 0;
4. innobase_xa_prepare:
trx_prepare_off_kernel:
mutex_enter(&(rseg->mutex));锁住undo segment的mutex
trx_undo_set_state_at_prepare;设置这个insert语句所对应的undo的状态从TRX_UNDO_ACTIVE-》TRX_UNDO_PREPARED。
mutex_exit(&(rseg->mutex));释放mutex
mtr_commit(&mtr): 对于本次的内存更改,因为非原子操作,所以也对应一个提交动作
lsn = mtr.end_lsn:或者最后的lsn后,flush的时候要保证大于或者等于lsn。
if flush_log_at_trx_commit=1
log_write_up_to(lsn, LOG_WAIT_ONE_GROUP, TRUE); 参数flush_to_disk=true表示flush log到disk中。
5. tc_log->log_and_order:这里做了大部分的commit的工作,包括:
binlog_commit_flush_trx_cache:刷新binlog到disk
TC_LOG::run_commit_ordered:
对binlog进行group commit操作
innodb::innobase_commit_ordered:
trx_commit_off_kernel:
标记事务为TRX_COMMITTED_IN_MEMORY,
如果是insert undo,直接purge掉。
trx->flush_log_later=true,所以这里并不进行flush,只是记录了commit的lsn,flush的动作放在了提交阶段。
trx_roll_free_all_savepoints:释放所有的save_point.
事务的标记最终为: trx->conc_state = TRX_NOT_STARTED
进入最终提交阶段:
commit_one_phase_low(thd, all, trans, is_real_trans):
binlog_commit:这里貌似什么都没有做,直接进入
if (cache_mngr->trx_cache.empty())
cache_mngr->reset_cache(&cache_mngr->trx_cache)
所以binlog commit并不是真正flush log的地方,而是在ha_commit_trans函数中,完成prepare过程后,commit提交前做了:
cookie= tc_log->log_and_order(thd, xid, all, need_commit_ordered);
所以,其实binlog已经提交了,只不过位置不在这里,不过,不妨碍一致性,因为都是在一阶段完成后。
innobase_commit:
trx_commit_complete_for_mysql:
log_write_up_to(lsn, LOG_WAIT_ONE_GROUP, TRUE);刷新log到disk中,这里的lsn是commit_lsn.
到这里commit完整结束。
MySQL源码之两阶段提交的更多相关文章
- mysql源码解读之事务提交过程(二)
上一篇文章我介绍了在关闭binlog的情况下,事务提交的大概流程.之所以关闭binlog,是因为开启binlog后事务提交流程会变成两阶段提交,这里的两阶段提交并不涉及分布式事务,当然mysql把它称 ...
- mysql源码解读之事务提交过程(一)
mysql是一种关系型数据库,关系型数据库一个重要的特性就是支持事务,这是区别于no-sql产品的一个核心特性.当然了,no-sql产品支持键值查询,不能支持sql语句,这也是一个区别.今天主要讨论下 ...
- 聊一聊 MySQL 中的数据编辑过程中涉及的两阶段提交
MySQL 数据库中的两阶段提交,不知道您知道不?这篇文章就简单的聊一聊 MySQL 数据库中的两阶段提交,两阶段提交发生在数据变更期间(更新.删除.新增等),两阶段提交过程中涉及到了 MySQL 数 ...
- Flink EOS如何防止外部系统乱入--两阶段提交源码
一.前言 根据维基百科的定义,两阶段提交(Two-phase Commit,简称2PC)是巨人们用来解决分布式系统架构下的所有节点在进行事务提交时保持一致性问题而设计的一种算法,也可称之为协议. 在F ...
- flink-----实时项目---day07-----1.Flink的checkpoint原理分析 2. 自定义两阶段提交sink(MySQL) 3 将数据写入Hbase(使用幂等性结合at least Once实现精确一次性语义) 4 ProtoBuf
1.Flink中exactly once实现原理分析 生产者从kafka拉取数据以及消费者往kafka写数据都需要保证exactly once.目前flink中支持exactly once的sourc ...
- MySQL binlog 组提交与 XA(两阶段提交)
1. XA-2PC (two phase commit, 两阶段提交 ) XA是由X/Open组织提出的分布式事务的规范(X代表transaction; A代表accordant?).XA规范主要定义 ...
- MySQL binlog 组提交与 XA(分布式事务、两阶段提交)【转】
概念: XA(分布式事务)规范主要定义了(全局)事务管理器(TM: Transaction Manager)和(局部)资源管理器(RM: Resource Manager)之间的接口.XA为了实现分布 ...
- MySQL binlog 组提交与 XA(两阶段提交)--1
参考了网上几篇比较靠谱的文章 http://www.linuxidc.com/Linux/2015-11/124942.htm http://blog.csdn.net/woqutechteam/ar ...
- 使用golang理解mysql的两阶段提交
使用golang理解mysql的两阶段提交 文章源于一个问题:如果我们现在有两个mysql实例,在我们要尽量简单地完成分布式事务,怎么处理? 场景重现 比如我们现在有两个数据库,mysql3306和m ...
随机推荐
- store procedure 翻页
store procedure 翻页例子 .turn page CREATE PROCEDURE pageTest --用于翻页的测试 --需要把排序字段放在第一列 ( )=null, --当前页面里 ...
- Android colors.xml
<?xml version="1.0" encoding="utf-8"?><resources> <color name=&qu ...
- Ztree使用
基础: <link rel="stylesheet" href="../../../css/zTreeStyle/zTreeStyle.css" type ...
- MVVM学习笔记
MVVM学习笔记 1.MVVM的简介 MVVM模式是Model-View-ViewModel模式的简称,也就是由模型(Model).视图(View).视图模型(ViewModel),其目的是为了实现将 ...
- javascript dom编程艺术笔记之图片库的改进
dom的操作要遵守的原则 1.平稳退化 2.分离javascript 3.向后兼容 4.性能考虑 改进后的显示图片方法 function showpic(whichpic){ if(!document ...
- HDU 3008 Warcraft(DP)
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=3008 题目大意:人有100血和100魔法,每秒增加 t 魔法(不能超过100).n个技能,每个技能消耗 ...
- 九度OJ 1019 简单计算器 -- 2006年浙江大学计算机及软件工程研究生机试真题
题目地址:http://ac.jobdu.com/problem.php?pid=1019 题目描述: 读入一个只包含 +, -, *, / 的非负整数计算表达式,计算该表达式的值. 输入: ...
- ASP.Net大文件上传组件详解
首先右键单击网站根目录,在弹出的快捷菜单中,选择"添加引用"菜单项,弹出"添加引用",切换到"浏览"找到组件的Dll文件"Best ...
- python 自动化之路 day 06
ATM作业讲解: 数据访问层 业务逻辑层 time & datetime模块 import time # print(time.clock()) #返回处理器时间,3.3开始已废弃 , 改成了 ...
- sqlserver字符串转日期
declare @str varchar(15) declare @dt datetime select @str='2005-8-26' set @d ...