水稻:最近有个朋友生产环境出现MySQL死锁问题,一听是死锁,那必须去看看啊,于是饶(si)有(qu)兴(huo)致(lai)的研究了好几天

菜瓜:MySQL死锁,赶紧分享一下

水稻:能否先让我装完X,我从朋友那里拿到数据结构,复现,分析,查资料,总。。。

菜瓜:今天的菜真香

水稻:。。。好吧,进入正题(数据已加工处理)

  • 一开始朋友拿出了死锁日志中记录的两条SQL语句(暂且把第一条SQL叫SQL1,第二条SQL2)

    • -- 两句SQL结构一致,只是参数不一样。
      explain
      update `deadlock` set `status` = 1,`expired` = CURRENT_TIMESTAMP
      where `id` <= 35610745 and `from` = '' and `to` = 'c' ; explain
      update `deadlock` set `status` = 1,`expired` = CURRENT_TIMESTAMP
      where `id` <= 35611183 and `from` = '' and `to` = '' ;
  • 然后是表结构和数据 (这里只录入模拟数据,数据量并不是这次分析的关键原因)
    • CREATE TABLE `deadlock` (
      `id` int(11) NOT NULL AUTO_INCREMENT,
      `from` varchar(64) CHARACTER SET utf8mb4 DEFAULT '',
      `to` varchar(64) CHARACTER SET utf8mb4 DEFAULT '',
      `status` int(11) DEFAULT NULL,
      `expired` datetime DEFAULT NULL,
      PRIMARY KEY (`id`),
      KEY `idx_from` (`from`),
      KEY `idx_to` (`to`)
      ) ENGINE=InnoDB AUTO_INCREMENT=35611184 DEFAULT CHARSET=utf8; INSERT INTO `deadlock` (`id`, `from`, `to`, `status`, `expired`)
      VALUES
      (5681309, '', 'b', NULL, NULL),
      (5681310, 'b', '', NULL, NULL),
      (5681311, '', 'b', NULL, NULL),
      (5681312, '', 'f', NULL, NULL),
      (5681313, '', 'f', NULL, NULL),
      (5681314, '', 'f', NULL, NULL),
      (5681315, 'f', '', NULL, NULL),
      (35610742, '', 'c', 1, '2020-07-07 02:03:58'),
      (35610744, '', 'c', 1, '2020-07-07 02:03:58'),
      (35610745, '', 'c', 1, '2020-07-07 02:03:58'),
      (35611180, '', '', 1, '2020-07-07 02:03:58'),
      (35611182, '', '', 1, '2020-07-07 02:03:58'),
      (35611183, '', '', 1, '2020-07-07 02:03:58');
  • 两条SQL命中的记录各三条。一看是死锁,第一反应是发生记录资源互斥等待。猜想会不会是这6行记录在执行update的时候SQL1和SQL2修改的记录发生了互斥

菜瓜:所以你最开始想的是更新时两条SQL获取记录的顺序反了,譬如说SQL1先拿35610742,再拿35610744前,SQL2先把35610744拿到了且它要拿35610742在阻塞

水稻:是的,但是很快发现这个思路很离谱,我们说锁的时候应该是和索引联系起来,分析记录就有点偏了。而且按记录来看,两个SQL命中的记录都不一样。于是回到索引上,就能说通他们都命中了from='1'这个条件,在idx_from上发生了互斥。

菜瓜:soga,真实情况呢

水稻:事情如果这么简单我就不会研究它好几天了。分析完了之后开始准备复现死锁。思路很简单,因为SQL只有一句,要模拟出来就用多线程并发执行

  • Java Code

    •     @Resource
      private DeadlockMapper deadlockMapper; @Resource
      ThreadPoolTaskExecutor threadPoolTaskExecutor; @Test
      public void deadlock() {
      for (; ; ) {
      threadPoolTaskExecutor.execute(() -> {
      try {
      Long id = 35611183L;
      String from = "1";
      String to = "2";
      deadlockMapper.updateDeadlock(id, from, to);
      } catch (Exception e) {
      System.out.println("transaction tututu");
      e.printStackTrace();
      System.exit(0);
      }
      });
      threadPoolTaskExecutor.execute(() -> {
      try {
      Long id = 35610745L;
      String from = "1";
      String to = "c";
      deadlockMapper.updateDeadlock(id, from, to);
      } catch (Exception e) {
      System.out.println("transaction kakaka");
      e.printStackTrace();
      System.exit(0);
      }
      });
      System.out.println("once loop finish ...");
      }
      }
  • MyBatis Code
    • public interface DeadlockMapper extends Mapper<Deadlock> {
      
          int updateDeadlock(@Param("id") Long id,
      @Param("from") String from,
      @Param("to") String to);
      } <update id="updateDeadlock">
      update `deadlock`
      set `status` = 1,`expired` = CURRENT_TIMESTAMP
      where `id` <![CDATA[<=]]> #{id}
      and `from` = #{from}
      and `to` = #{to}
      </update>
  • 执行结果
    • once loop finish ...
      once loop finish ...
      transaction tututu
      transaction tututu
      org.springframework.dao.DeadlockLoserDataAccessException:
      ### Error updating database. Cause: com.mysql.cj.jdbc.exceptions.MySQLTransactionRollbackException: Deadlock found when trying to get lock; try restarting transaction
      ### The error may involve defaultParameterMap
      ### The error occurred while setting parameters
      ### SQL: update `deadlock` set `status` = 1,`expired` = CURRENT_TIMESTAMP where `id` <= ? and `from` = ? and `to` = ?
      ### Cause: com.mysql.cj.jdbc.exceptions.MySQLTransactionRollbackException: Deadlock found when trying to get lock; try restarting transaction
      。。。
  • 死锁日志 - show engine innodb status;
    • LATEST DETECTED DEADLOCK
      ------------------------
      2020-07-07 08:00:54 0x7f2c38b6a700
      *** (1) TRANSACTION:
      TRANSACTION 61382, ACTIVE 0 sec starting index read
      mysql tables in use 3, locked 3
      LOCK WAIT 4 lock struct(s), heap size 1136, 3 row lock(s)
      MySQL thread id 147, OS thread handle 139827907593984, query id 22005 101.68.68.234 root updating
      update `deadlock`
      set `status` = 1,`expired` = CURRENT_TIMESTAMP
      where `id` <= 35611183
      and `from` = ''
      and `to` = ''
      *** (1) WAITING FOR THIS LOCK TO BE GRANTED:
      RECORD LOCKS space id 66 page no 4 n bits 80 index idx_from of table `qc`.`deadlock` trx id 61382 lock_mode X waiting
      Record lock, heap no 2 PHYSICAL RECORD: n_fields 2; compact format; info bits 0
      0: len 1; hex 31; asc 1;;
      1: len 4; hex 821f6076; asc `v;; *** (2) TRANSACTION:
      TRANSACTION 61381, ACTIVE 0 sec fetching rows
      mysql tables in use 3, locked 3
      5 lock struct(s), heap size 1136, 11 row lock(s)
      MySQL thread id 150, OS thread handle 139827906782976, query id 22004 101.68.68.234 root updating
      update `deadlock`
      set `status` = 1,`expired` = CURRENT_TIMESTAMP
      where `id` <= 35610745
      and `from` = ''
      and `to` = 'c'
      *** (2) HOLDS THE LOCK(S):
      RECORD LOCKS space id 66 page no 4 n bits 80 index idx_from of table `qc`.`deadlock` trx id 61381 lock_mode X
      Record lock, heap no 2 PHYSICAL RECORD: n_fields 2; compact format; info bits 0
      0: len 1; hex 31; asc 1;;
      1: len 4; hex 821f6076; asc `v;; Record lock, heap no 3 PHYSICAL RECORD: n_fields 2; compact format; info bits 0
      0: len 1; hex 31; asc 1;;
      1: len 4; hex 821f6078; asc `x;; Record lock, heap no 4 PHYSICAL RECORD: n_fields 2; compact format; info bits 0
      0: len 1; hex 31; asc 1;;
      1: len 4; hex 821f6079; asc `y;; Record lock, heap no 5 PHYSICAL RECORD: n_fields 2; compact format; info bits 0
      0: len 1; hex 31; asc 1;;
      1: len 4; hex 821f622c; asc b,;; *** (2) WAITING FOR THIS LOCK TO BE GRANTED:
      RECORD LOCKS space id 66 page no 3 n bits 80 index PRIMARY of table `qc`.`deadlock` trx id 61381 lock_mode X locks rec but not gap waiting
      Record lock, heap no 12 PHYSICAL RECORD: n_fields 7; compact format; info bits 0
      0: len 4; hex 821f622c; asc b,;;
      1: len 6; hex 00000000e962; asc b;;
      2: len 7; hex 27000001d901fd; asc ' ;;
      3: len 1; hex 31; asc 1;;
      4: len 1; hex 32; asc 2;;
      5: len 4; hex 80000001; asc ;;
      6: len 5; hex 99a6ce7d03; asc } ;; *** WE ROLL BACK TRANSACTION (1)

菜瓜:这不是很顺利吗

水稻:我会告诉你在我本地环境中一直没有复现出来吗?我会告诉你我找了一天才找到原因是因为MySQL配置问题(需要开启bin log,开启成功后执行 select version() 会看到 5.7.30-log)?我会告诉你这过程中我放弃了好几次又决定再看看吗?当然不会

菜瓜:好厉害哦!那你很棒棒哦!

水稻:。。。来,进入分析环节

  • 两个SQL语句的explain执行计划

    • explain
      update `deadlock` set `status` = 1,`expired` = CURRENT_TIMESTAMP
      where `id` <= 35610745 and `from` = '' and `to` = 'c' ;
      -- Using intersect(idx_from,idx_to); Using where explain
      update `deadlock` set `status` = 1,`expired` = CURRENT_TIMESTAMP
      where `id` <= 35611183 and `from` = '' and `to` = '' ;
      -- Using intersect(idx_to,idx_from); Using where
    • 可以看到执行这两个SQL的时候命中的索引竟然是NB的Merge Index(鬼知道这是啥),而且它两顺序还不一致(有兴趣的朋友可以上搜索一下这个玩意)
    • Merge Index 索引合并技术是MySQL的一个优化,会将两个独立的索引扫描的结果进行取交集或者并集来加快数据的检索。
    • 这里的关键点是它会导致MySQL在拿锁的顺序上不一致

菜瓜:你这个铺垫太多了,我已经记不清楚前面那么多东西了,请直接上结论吧

水稻:好的,前面的code是方便您自己下去复现的,对于动手党有用。您可以直接忽略

  • 这里原因的解析只需要注意死锁日志和最后的explain执行计划结果
  • 事务Transaction1
  • 事务Transaction2

  • 结论就是:id为35610742记录上的索引顺序不一致出现了死锁

    • SQL1(事务2)持有idx_from,在等待主键primary key。执行计划中它命中索引 intersect(idx_from,idx_to) ,非聚簇索引除了拿到自己的索引之外还要获取主键索引,所以它拿锁的顺序是先获取idx_from,再获取primary key,最后获取idx_to,再primary key

    • SQL2(事务1)持有primary key,在等待idx_from。同理它命中索引intersect(idx_to,idx_from),它拿锁的顺序是先获取idx_to,再获取primary key,最后获取idx_from,再primary key
      (日志里面看不出来SQL2持有主键索引,这里是根据出现死锁的互斥条件得出它持有主键索引)

菜瓜:这是何等的wocao!!!

水稻:解决这个问题只要把两个单个索引改成联合索引即可

总结:

  • 单行update语句引发的死锁问题
  • 单行记录拿锁顺序不一致出现死锁
  • 索引合并Merge Index 导致获取锁顺序不一致
  • 场景复现需要把log_bin日志打开,注意查看select version()
  • 多线程模拟并发场景
  • 死锁日志分析

【MySQL】Merge Index导致死锁的更多相关文章

  1. [经验分享] MySQL Innodb表导致死锁日志情况分析与归纳【转,纯学习】

    在定时脚本运行过程中,发现当备份表格的sql语句与删除该表部分数据的sql语句同时运行时,mysql会检测出死锁,并打印出日志. 两个sql语句如下: (1)insert into backup_ta ...

  2. MySQL Innodb表导致死锁日志情况分析与归纳

    发现当备份表格的sql语句与删除该表部分数据的sql语句同时运行时,mysql会检测出死锁,并打印出日志   案例描述在定时脚本运行过程中,发现当备份表格的sql语句与删除该表部分数据的sql语句同时 ...

  3. mysql force index() 强制索引的使用

    mysql force index() 强制索引的使用 之前跑了一个SQL,由于其中一个表的数据量比较大,而在条件中有破坏索引或使用了很多其他索引,就会使得sql跑的非常慢... 那我们怎么解决呢? ...

  4. 解决Android Studio 3.0导入module依赖后unable to merge index

    解决Android Studio 3.0导入module依赖后unable to merge index 项目需要使用im, 在项目里导入了腾讯im的几个module依赖, 项目无法编译, 报错una ...

  5. MySQL 性能优化-数据库死锁监控

    MySQL性能优化-数据库死锁监控 by:授客 QQ:1033553122 1)表锁定 通过检查 table_locks_waited 和 table_locks_immediate 状态变量来分析表 ...

  6. Mysql索引引起的死锁

    提到索引,首先想到的是效率提高,查询速度提升,不知不觉都会有一种心理趋向,管它三七二十一,先上个索引提高一下效率..但是索引其实也是暗藏杀机的... 今天压测带优化项目,开着Jmeter高并发访问项目 ...

  7. MySQL MERGE存储引擎 简介及用法

    MERGE存储引擎把一组MyISAM数据表当做一个逻辑单元来对待,让我们可以同时对他们进行查询.构成一个MERGE数据表结构的各成员MyISAM数据表必须具有完全一样的结构.每一个成员数据表的数据列必 ...

  8. MySQL Online DDL导致全局锁表案例分析

    MySQL Online DDL导致全局锁表案例分析 我这边遇到了什么问题? 线上给某个表执行新增索引SQL, 然后整个数据CPU打到100%, 连接数暴增到极限, 最后导致所有访问数据库的应用都奔溃 ...

  9. Mysql force index和ignore index 使用实例

    前几天统计一个sql,是一个人提交了多少工单,顺便做了相关sql优化.数据大概2000多w. select CustName,count(1) c from WorkOrder where Creat ...

随机推荐

  1. Okapi BM25算法

    引言 Okapi BM25,一般简称 BM25 算法,在 20 世纪 70 年代到 80 年代,由英国一批信息检索领域的计算机科学家发明.这里的 BM 是"最佳匹配"(Best M ...

  2. C#基础篇——委托

    前言 在本章中,主要是借机这个C#基础篇的系列整理过去的学习笔记.归纳总结并更加理解透彻. 在.Net开发中,我们经常会遇到并使用过委托,如果能灵活的掌握并加以使用会使你在编程中游刃有余,然后对于很多 ...

  3. 重学 Java 设计模式:实战组合模式(营销差异化人群发券,决策树引擎搭建场景)

    作者:小傅哥 博客:https://bugstack.cn 沉淀.分享.成长,让自己和他人都能有所收获! 一.前言 小朋友才做选择题,成年人我都要 头几年只要群里一问我该学哪个开发语言,哪个语言最好. ...

  4. Clear Writer v1.7 更新

    拖更了这么久了的我终于来更新了--这可能是今年上半年最后一次更新了-- 这次我打算把 Clear Writer 公开发布了. 下载链接 下载链接在这里. (这次用蓝奏,不用奶牛快传了) Clear W ...

  5. 最全面的SourceTree账号注册教程

    前言: 作为一个国内开发者而言使用Git操作神器SoureTree最大的问题就是账号注册问题,因为注册账号的链接在不翻墙的情况下基本上是打不开的(弄过的童鞋应该都体会过),所以有的时候我们需要借助一些 ...

  6. Codeforces Round #647 (Div. 2)

    Problem A https://codeforces.com/contest/1362/problem/A 判断x/y是不是2的k次方, 如果是 k/3 + (k%3)/2 + (k%3%2)即为 ...

  7. LR脚本信息函数-lr_start_timer和lr_end_timer

    为了计算时间更加精确,可以用这个函数去掉LR自身的检查点所浪费的时间.如text check and image time Action() { double time_elapsed, durati ...

  8. 域名注册诈骗邮件We are an agency engaging in registering brand name and domain names

    最近收到了一封自称是某公司的邮件,说有人要注册我已经申请的域名,需要我回复确认,看邮件发件人是个人邮箱,通篇没有提到公司,也不是什么正规机构,大概率就是诈骗邮件了. 为了完全确认这封诈骗邮件,我登陆了 ...

  9. 【JMeter_11】JMeter逻辑控制器__Switch控制器<Switch Controller>

    Switch控制器<Switch Controller> 业务逻辑: 取得switch value的值,通过对节点下所有取样器.逻辑控制器的下标.名称匹配去执行,switch value的 ...

  10. SQLserver 的分页存储过程

      -- 1.建立修改学生数据的存储过程 -- 2.建立根据班级Id和学生姓名模糊查询的分页存储过程,要求正确输出总记录数,总页数-- (输入班学生姓名 计算总记录数 计算总页数) -- @name ...