https://mp.weixin.qq.com/s/2obpN57D8hyorCMnIu_YAg

死锁案例八

文 | 杨一 on 运维

转 | 来源:公众号yangyidba

一、前言

死锁其实是一个很有意思也很有挑战的技术问题,大概每个 DBA 和部分开发朋友都会在工作过程中遇见。关于死锁我会持续写一个系列的案例分析,希望能够对想了解死锁的朋友有所帮助。

二、案例分析

2.1 业务场景

业务上的主要逻辑:

首先执行插入数据,如果插入成功,则提交。如果插入的时候报唯一键冲突,则执行更新。 如果同时出现三个并发在执行数据初始化动作,sess1 插入成功,sess2 和 sess3 插入遇到唯一键冲突,插入失败,则都执行执行更新,于是出现死锁。

2.2 环境准备

MySQL 5.6.24 事务隔离级别为 RR

  1. create table ty (

  2. id int not null primary key auto_increment ,

  3. c1 int not null default 0,

  4. c2 int not null default 0,

  5. c3 int not null default 0,

  6. unique key uc1(c1),

  7. unique key uc2(c2)

  8. ) engine=innodb ;

  9. insert into ty(c1,c2,c3) values(1,3,4),(6,6,10),(9,9,14);

2.3 测试用例

为了方便分析死锁日志,三个会话插入的 c3 的值分别为1 2 3 ,生产上其实是相同的值。

2.4 死锁日志

  1. 2018-03-28 10:04:52 0x7f75bf2d9700

  2. *** (1) TRANSACTION:

  3. TRANSACTION 1870, ACTIVE 76 sec starting index read

  4. mysql tables in use 1, locked 1

  5. LOCK WAIT 3 lock struct(s), heap size 1136, 2 row lock(s)

  6. MySQL thread id 399265, OS thread handle 12, query id 9 localhost root updating

  7. update ty set c3=5 where c1=4

  8. *** (1) WAITING FOR THIS LOCK TO BE GRANTED:

  9. RECORD LOCKS space id 28 page no 4 n bits 72 index uc1 of table `test`.`ty` trx id 1870 lock_mode X locks rec but not gap waiting

  10. *** (2) TRANSACTION:

  11. TRANSACTION 1871, ACTIVE 32 sec starting index read, thread declared inside InnoDB 5000

  12. mysql tables in use 1, locked 1

  13. 3 lock struct(s), heap size 1136, 2 row lock(s)

  14. MySQL thread id 399937, OS thread handle 16, query id 3 localhost root updating

  15. update ty set c3=5 where c1=4

  16. *** (2) HOLDS THE LOCK(S):

  17. RECORD LOCKS space id 28 page no 4 n bits 72 index uc1 of table `test`.`ty` trx id 1871 lock mode S

  18. *** (2) WAITING FOR THIS LOCK TO BE GRANTED:

  19. RECORD LOCKS space id 28 page no 4 n bits 72 index uc1 of table `test`.`ty` trx id 1871 lock_mode X locks rec but not gap waiting

  20. *** WE ROLL BACK TRANSACTION (2)

其实单单从日志上查看只看到两个事务的 update 相互竞争,在缺乏业务逻辑场景的情况下,很难得到有效思路。

2.5 分析死锁日志

T2 s1 执行 insert 操作,检查唯一性且插入成功,持有 c1=4 记录行的行锁。

T3 s2 insert遇到唯一键冲突,申请加锁 Lock S Next-key Lock 日志显示为 index uc1 of table test.ty trx id 1870 lock mode S waiting

T4 与 s2 相同, s3 insert 遇到唯一键冲突,申请加锁 Lock S Next-key Lock 日志显示为 index uc1 of table test.ty trx id 1870 lock mode S waiting

T5 sess1 执行 commit 操作, 此时 sess2 和 sess3 同时获取 Lock S Next-key Lock。

T6 应用收到唯一键冲突,sess2 执行 update 操作需要申请 c=4 的行锁,与 sess3的持有的 Lock S Next-key Lock 不兼容,等待 sess3 释放Lock S Next-key Lock。

T7 与sess2 类似 sess3 执行update 操作需要申请 c=4 的行锁,与 sess2 的持有的 Lock S Next-key Lock 不兼容,等待 sess2 释放 Lock S Next-key Lock 。出现循环等待,发生死锁。

2.6 解决方法

本案例的解决方式其实和前文 死锁案例之七 一致,使用 insert on duplicate key。案例七与本案例导致死锁业务逻辑极为相似,为什么呢?因为都是同一组开发哥哥写的。

三、小结

导致死锁的根本原因是不同事务申请锁的顺序不一样出现循环等待,开发同学在设计高并发的业务场景时,需要着重思考这一点,并且尽量规避业务场景设计不合理导致死锁。

另外就是 insert 的加锁机制相对 update 其实比较复杂,需要多动手实践,理清加锁流程。

扩展阅读

1. 漫谈死锁

2. 如何阅读死锁日志

3. 死锁案例一

4. 死锁案例二

5. 死锁案例三

6. 死锁案例四

7. 死锁案例五

8. 死锁案例六

9. 死锁案例七

https://mp.weixin.qq.com/s/ZknxiA5RuRZpefbF1bM82Q

死锁案例七

一、前言

死锁,其实是一个很有意思也很有挑战的技术问题,大概每个 DBA 和部分开发同学都会在工作过程中遇见 。关于死锁我会持续写一个系列的案例分析,希望能够对想了解死锁的朋友有所帮助。

二、案例分析

2.1 业务场景

业务开发同学想同步数据,他们的逻辑是通过 update 更新操作,如果更新记录返回的 affect_rows为0,然后就调用 insert 语句进行插入初始化。如果插入失败则再进行更新操作,多个会话并发操作的情况下就出现死锁。

2.2 环境说明

MySQL 5.6.24 事务隔离级别为 RR

  1. create table ty (

  2. id int not null primary key auto_increment ,

  3. c1 int not null default 0,

  4. c2 int not null default 0,

  5. c3 int not null default 0,

  6. unique key uc1(c1),

  7. unique key uc2(c2)

  8. ) engine=innodb ;

  9. insert into ty(c1,c2,c3)

  10. values(1,3,4),(6,6,10),(9,9,14);

2.3 测试用例

2.4 死锁日志

  1. 2018-03-27 17:59:23 0x7f75bf39d700

  2. *** (1) TRANSACTION:

  3. TRANSACTION 1863, ACTIVE 76 sec inserting

  4. mysql tables in use 1, locked 1

  5. LOCK WAIT 4 lock struct(s), heap size 1136, 3 row lock(s), undo log entries 1

  6. MySQL thread id 382150, OS thread handle 56640, query id 28 localhost root update

  7. insert into ty (c1,c2,c3) values(3,4,2)

  8. *** (1) WAITING FOR THIS LOCK TO BE GRANTED:

  9. RECORD LOCKS space id 28 page no 5 n bits 72 index uc2 of table `test`.`ty` trx id 1863 lock_mode X locks gap before rec insert intention waiting

  10. *** (2) TRANSACTION:

  11. TRANSACTION 1864, ACTIVE 65 sec inserting, thread declared inside InnoDB 5000

  12. mysql tables in use 1, locked 1

  13. 3 lock struct(s), heap size 1136, 2 row lock(s), undo log entries 1

  14. MySQL thread id 382125, OS thread handle 40032, query id 62 localhost root update

  15. insert into ty (c1,c2,c3) values(3,4,2)

  16. *** (2) HOLDS THE LOCK(S):

  17. RECORD LOCKS space id 28 page no 5 n bits 72 index uc2 of table `test`.`ty` trx id 1864 lock_mode X locks gap before rec

  18. *** (2) WAITING FOR THIS LOCK TO BE GRANTED:

  19. RECORD LOCKS space id 28 page no 4 n bits 72 index uc1 of table `test`.`ty` trx id 1864 lock mode S waiting

  20. *** WE ROLL BACK TRANSACTION (2)

2.5 分析死锁日志

首先我们要再次强调 insert 插入操作的加锁逻辑。

第一阶段: 唯一性约束检查,先申请 LOCK_S + LOCK_ORDINARY

第二阶段: 获取阶段一的锁并且 insert 成功之后,插入的位置有 GAP 锁:LOCK_INSERT_INTENTION,为了防止其他 insert 唯一键冲突。

新数据插入完成之后:LOCK_X + LOCK_REC_NOT_GAP

对于 insert 操作来说,若发生唯一约束冲突,则需要对冲突的唯一索引加上 S Next-key Lock。从这里会发现,即使是 RC 事务隔离级别,也同样会存在 Next-Key Lock 锁,从而阻塞并发。然而,文档没有说明的是,对于检测到冲突的唯一索引,等待线程在获得 S Lock 之后,还需要对下一个记录进行加锁,在源码中由函数row_ins_scan_sec_index_for_duplicate 进行判断.

其次 我们需要了解锁的兼容性矩阵。

从兼容性矩阵我们可以得到如下结论:

INSERT 操作之间不会有冲突。

GAP,Next-Key 会阻止 Insert。

GAP 和 Record,Next-Key 不会冲突。

Record 和 Record、Next-Key 之间相互冲突。

已有的 Insert 锁不阻止任何准备加的锁。

已经持有的 GAP 锁会阻塞插入意向锁 INSERT_INTENTION。

另外 对于通过唯一索引更新或者删除不存在的记录,会申请加上 GAP 锁。

分析

了解上面的基础知识,我们开始对死锁日志进行分析:

T1: sess1 通过唯一键更新数据,由于 c2=4 不存在,返回 affect row 为 0,MySQL 会申请(3,6)之间的 GAP 锁。

T2: sess2 的情况和 sess1 类似,也会申请(3,6)之间的 GAP 锁,从上面的兼容性矩阵来看两个 GAP 锁并不会冲突。

T3: sess1 根据 update 语句返回 affect row 为 0,执行 insert 操作,此时需要申请插入意向锁,sess2 会话持有的 GAP 锁和 sess1 申请的插入意向锁冲突,出现等待。

index uc2 of table test.ty trx id 1863 lock_mode X locks gap before rec insert intention waiting

T4:sess2 与 sess1类似,根据 update 语句返回 affect row 为 0,执行 insert 操作。 申请的插入意向锁与sess1 的 update 语句持有的 GAP 锁冲突。sess1(持有 GAP 锁),sess2(持有 GAP 锁),sess1(插入意向锁等待 sess2 的 GAP 锁释放) sess2(插入意向锁等待 sess1 的 GAP 锁释放) 构成循环等待,进而导致死锁。

2.6 解决方法

从业务场景的处理逻辑上看,业务需要发送两次请求一次 update,一次 insert 才能完成业务逻辑,不够友好和优化。

其实我们可以和开发同学沟通好,确认业务的幂等性,使用 insert on duplicate key的方式,没有就插入,存在就更新,一次调用即可完成之前 2 次操作的功能,提高性能。

三、小结

最后想说关于解决死锁问题的思路:

1. 具备扎实的锁相关的基础知识。

2. 单单根据死锁日志其实比较难以判断具体的 sql 执行情况,需要和开发同学沟通好,理清业务执行 sql 的逻辑,然后去模拟测试。

死锁案例 GAP 锁 没有就插入,存在就更新的更多相关文章

  1. InnoDB的锁机制浅析(二)—探索InnoDB中的锁(Record锁/Gap锁/Next-key锁/插入意向锁)

    Record锁/Gap锁/Next-key锁/插入意向锁 文章总共分为五个部分: InnoDB的锁机制浅析(一)-基本概念/兼容矩阵 InnoDB的锁机制浅析(二)-探索InnoDB中的锁(Recor ...

  2. Gap 锁

    14.3.1 InnoDB Locking InnoDB 锁 本章节描述InnoDB 使用的锁类型: Shared and Exclusive Locks Intention Locks Record ...

  3. MySQL死锁案例分析与解决方案

    MySQL死锁案例分析与解决方案 现象: 数据库查询: SQL语句分析:  mysql. 并发delete同一行记录,偶发死锁.   delete from x_table where id=?   ...

  4. Mysql加锁过程详解(7)-初步理解MySQL的gap锁

    Mysql加锁过程详解(1)-基本知识 Mysql加锁过程详解(2)-关于mysql 幻读理解 Mysql加锁过程详解(3)-关于mysql 幻读理解 Mysql加锁过程详解(4)-select fo ...

  5. Python并发编程-进程 线程 同步锁 线程死锁和递归锁

    进程是最小的资源单位,线程是最小的执行单位 一.进程 进程:就是一个程序在一个数据集上的一次动态执行过程. 进程由三部分组成: 1.程序:我们编写的程序用来描述进程要完成哪些功能以及如何完成 2.数据 ...

  6. GIL、死锁与递归锁

    一.互斥锁 用互斥锁,目的:局部串行(保护自己的数据 进程之间数据不共享,但是共享同一套文件系统,所以访问同一个文件,或同一个打印终端,是没有问题的,竞争带来的结果就是错乱,如何控制,就是加锁处理(即 ...

  7. Python3 进程 线程 同步锁 线程死锁和递归锁

    进程是最小的资源单位,线程是最小的执行单位 一.进程 进程:就是一个程序在一个数据集上的一次动态执行过程. 进程由三部分组成: 1.程序:我们编写的程序用来描述进程要完成哪些功能以及如何完成 2.数据 ...

  8. [并发编程 - 多线程:信号量、死锁与递归锁、时间Event、定时器Timer、线程队列、GIL锁]

    [并发编程 - 多线程:信号量.死锁与递归锁.时间Event.定时器Timer.线程队列.GIL锁] 信号量 信号量Semaphore:管理一个内置的计数器 每当调用acquire()时内置计数器-1 ...

  9. 26 python 初学(线程、同步锁、死锁和递归锁)

    参考博客: www.cnblogs.com/yuanchenqi/articles/5733873.html 并发:一段时间内做一些事情 并行:同时做多件事情 线程是操作系统能够进行运算调度的基本单位 ...

随机推荐

  1. 7.mysql8.0版本MGR搭建

    搭建MGR 1.配置文件 loose-group_replication_ip_whitelist = 192.168.124.0/24 loose-group_replication_start_o ...

  2. 如何将离线计算业务的成本降低65%——弹性容器服务EKS「竞价实例」上线

    在容器化的应用场景中,大数据计算是其中很大并且业务应用在逐渐增加的一个热门领域,包括越来越多的人工智能企业,都在使用容器技术来支持业务中的大量计算任务.降低成本.提升资源利用率也是当前这部分用户非常期 ...

  3. 自动化运维工具-Ansible之1-基础

    自动化运维工具-Ansible之1-基础 目录 自动化运维工具-Ansible之1-基础 Ansible 基本概述 定义 特点 架构 工作原理 任务执行模式 命令执行过程 Ansible 安装 Ans ...

  4. 简谈python从Oracle读取数据生成图形

    初次学习python,连接Oracle数据库,导出数据到Excel,再从Excel里面读取数据进行绘图,生成png保存出来. 1.涉及到的python模块(模块安装就不进行解释了): 1 import ...

  5. SpringBoot 集成Elasticsearch进行简单增删改查

    一.引入的pom文件 <?xml version="1.0" encoding="UTF-8"?> <project xmlns=" ...

  6. 进制及其字符串之间互转——C#

    本文介绍进制数转进制数,及每个进制对应的字符串 一.首先进制数转进制数(int-->int) 1.二进制数与十进制数互转: (1)二进制数转十进制数:还没找到 (2)十进制数转二进制数:目前还没 ...

  7. Vue自动化路由(基于Vue-Router)开篇

    vue自动化路由 好久不见~ 若羽又开篇Vue的内容了. 年初的时候发布了第一版的ea-router自动化路由库,欢迎大家安装使用.[Github地址] [npm地址] 经历一年的使用.还是发现了不少 ...

  8. 3.k8s存储之ConfigMap、Secret

    1.ConfigMap ConfigMap 功能在 Kubernetes1.2 版本中引入,许多应用程序会从配置文件.命令行参数或环境变量中读取配置信息.ConfigMap API 给我们提供了向容器 ...

  9. ASP.NET Core 上传文件到共享文件夹

    参考资料:ASP.NET 上传文件到共享文件夹 创建共享文件夹参考资料:https://www.cnblogs.com/dansediao/p/5712657.html 一.配置上传文件相关参数并读取 ...

  10. 十一:WEB渗透必懂知识点

    简述WEB层面上的漏洞以及类型,具体漏洞的危害等级, 如何形成以及如何发现 右边权重大于左边 CTF,SRC,红蓝对抗,实战 简要说明以上漏洞危害 简要说课以上漏洞等级划分 简要说明以上漏洞重点内容 ...