水稻:最近有个朋友生产环境出现MySQL死锁问题,一听是死锁,那必须去看看啊,于是饶(si)有(qu)兴(huo)致(lai)的研究了好几天

菜瓜:MySQL死锁,赶紧分享一下

水稻:能否先让我装完X,我从朋友那里拿到数据结构,复现,分析,查资料,总。。。

菜瓜:今天的菜真香

水稻:。。。好吧,进入正题(数据已加工处理)

  • 一开始朋友拿出了死锁日志中记录的两条SQL语句(暂且把第一条SQL叫SQL1,第二条SQL2)

    • -- 两句SQL结构一致,只是参数不一样。
      explain
      update `deadlock` set `status` = 1,`expired` = CURRENT_TIMESTAMP
      where `id` <= 35610745 and `from` = '' and `to` = 'c' ; explain
      update `deadlock` set `status` = 1,`expired` = CURRENT_TIMESTAMP
      where `id` <= 35611183 and `from` = '' and `to` = '' ;
  • 然后是表结构和数据 (这里只录入模拟数据,数据量并不是这次分析的关键原因)
    • CREATE TABLE `deadlock` (
      `id` int(11) NOT NULL AUTO_INCREMENT,
      `from` varchar(64) CHARACTER SET utf8mb4 DEFAULT '',
      `to` varchar(64) CHARACTER SET utf8mb4 DEFAULT '',
      `status` int(11) DEFAULT NULL,
      `expired` datetime DEFAULT NULL,
      PRIMARY KEY (`id`),
      KEY `idx_from` (`from`),
      KEY `idx_to` (`to`)
      ) ENGINE=InnoDB AUTO_INCREMENT=35611184 DEFAULT CHARSET=utf8; INSERT INTO `deadlock` (`id`, `from`, `to`, `status`, `expired`)
      VALUES
      (5681309, '', 'b', NULL, NULL),
      (5681310, 'b', '', NULL, NULL),
      (5681311, '', 'b', NULL, NULL),
      (5681312, '', 'f', NULL, NULL),
      (5681313, '', 'f', NULL, NULL),
      (5681314, '', 'f', NULL, NULL),
      (5681315, 'f', '', NULL, NULL),
      (35610742, '', 'c', 1, '2020-07-07 02:03:58'),
      (35610744, '', 'c', 1, '2020-07-07 02:03:58'),
      (35610745, '', 'c', 1, '2020-07-07 02:03:58'),
      (35611180, '', '', 1, '2020-07-07 02:03:58'),
      (35611182, '', '', 1, '2020-07-07 02:03:58'),
      (35611183, '', '', 1, '2020-07-07 02:03:58');
  • 两条SQL命中的记录各三条。一看是死锁,第一反应是发生记录资源互斥等待。猜想会不会是这6行记录在执行update的时候SQL1和SQL2修改的记录发生了互斥

菜瓜:所以你最开始想的是更新时两条SQL获取记录的顺序反了,譬如说SQL1先拿35610742,再拿35610744前,SQL2先把35610744拿到了且它要拿35610742在阻塞

水稻:是的,但是很快发现这个思路很离谱,我们说锁的时候应该是和索引联系起来,分析记录就有点偏了。而且按记录来看,两个SQL命中的记录都不一样。于是回到索引上,就能说通他们都命中了from='1'这个条件,在idx_from上发生了互斥。

菜瓜:soga,真实情况呢

水稻:事情如果这么简单我就不会研究它好几天了。分析完了之后开始准备复现死锁。思路很简单,因为SQL只有一句,要模拟出来就用多线程并发执行

  • Java Code

    •     @Resource
      private DeadlockMapper deadlockMapper; @Resource
      ThreadPoolTaskExecutor threadPoolTaskExecutor; @Test
      public void deadlock() {
      for (; ; ) {
      threadPoolTaskExecutor.execute(() -> {
      try {
      Long id = 35611183L;
      String from = "1";
      String to = "2";
      deadlockMapper.updateDeadlock(id, from, to);
      } catch (Exception e) {
      System.out.println("transaction tututu");
      e.printStackTrace();
      System.exit(0);
      }
      });
      threadPoolTaskExecutor.execute(() -> {
      try {
      Long id = 35610745L;
      String from = "1";
      String to = "c";
      deadlockMapper.updateDeadlock(id, from, to);
      } catch (Exception e) {
      System.out.println("transaction kakaka");
      e.printStackTrace();
      System.exit(0);
      }
      });
      System.out.println("once loop finish ...");
      }
      }
  • MyBatis Code
    • public interface DeadlockMapper extends Mapper<Deadlock> {
      
          int updateDeadlock(@Param("id") Long id,
      @Param("from") String from,
      @Param("to") String to);
      } <update id="updateDeadlock">
      update `deadlock`
      set `status` = 1,`expired` = CURRENT_TIMESTAMP
      where `id` <![CDATA[<=]]> #{id}
      and `from` = #{from}
      and `to` = #{to}
      </update>
  • 执行结果
    • once loop finish ...
      once loop finish ...
      transaction tututu
      transaction tututu
      org.springframework.dao.DeadlockLoserDataAccessException:
      ### Error updating database. Cause: com.mysql.cj.jdbc.exceptions.MySQLTransactionRollbackException: Deadlock found when trying to get lock; try restarting transaction
      ### The error may involve defaultParameterMap
      ### The error occurred while setting parameters
      ### SQL: update `deadlock` set `status` = 1,`expired` = CURRENT_TIMESTAMP where `id` <= ? and `from` = ? and `to` = ?
      ### Cause: com.mysql.cj.jdbc.exceptions.MySQLTransactionRollbackException: Deadlock found when trying to get lock; try restarting transaction
      。。。
  • 死锁日志 - show engine innodb status;
    • LATEST DETECTED DEADLOCK
      ------------------------
      2020-07-07 08:00:54 0x7f2c38b6a700
      *** (1) TRANSACTION:
      TRANSACTION 61382, ACTIVE 0 sec starting index read
      mysql tables in use 3, locked 3
      LOCK WAIT 4 lock struct(s), heap size 1136, 3 row lock(s)
      MySQL thread id 147, OS thread handle 139827907593984, query id 22005 101.68.68.234 root updating
      update `deadlock`
      set `status` = 1,`expired` = CURRENT_TIMESTAMP
      where `id` <= 35611183
      and `from` = ''
      and `to` = ''
      *** (1) WAITING FOR THIS LOCK TO BE GRANTED:
      RECORD LOCKS space id 66 page no 4 n bits 80 index idx_from of table `qc`.`deadlock` trx id 61382 lock_mode X waiting
      Record lock, heap no 2 PHYSICAL RECORD: n_fields 2; compact format; info bits 0
      0: len 1; hex 31; asc 1;;
      1: len 4; hex 821f6076; asc `v;; *** (2) TRANSACTION:
      TRANSACTION 61381, ACTIVE 0 sec fetching rows
      mysql tables in use 3, locked 3
      5 lock struct(s), heap size 1136, 11 row lock(s)
      MySQL thread id 150, OS thread handle 139827906782976, query id 22004 101.68.68.234 root updating
      update `deadlock`
      set `status` = 1,`expired` = CURRENT_TIMESTAMP
      where `id` <= 35610745
      and `from` = ''
      and `to` = 'c'
      *** (2) HOLDS THE LOCK(S):
      RECORD LOCKS space id 66 page no 4 n bits 80 index idx_from of table `qc`.`deadlock` trx id 61381 lock_mode X
      Record lock, heap no 2 PHYSICAL RECORD: n_fields 2; compact format; info bits 0
      0: len 1; hex 31; asc 1;;
      1: len 4; hex 821f6076; asc `v;; Record lock, heap no 3 PHYSICAL RECORD: n_fields 2; compact format; info bits 0
      0: len 1; hex 31; asc 1;;
      1: len 4; hex 821f6078; asc `x;; Record lock, heap no 4 PHYSICAL RECORD: n_fields 2; compact format; info bits 0
      0: len 1; hex 31; asc 1;;
      1: len 4; hex 821f6079; asc `y;; Record lock, heap no 5 PHYSICAL RECORD: n_fields 2; compact format; info bits 0
      0: len 1; hex 31; asc 1;;
      1: len 4; hex 821f622c; asc b,;; *** (2) WAITING FOR THIS LOCK TO BE GRANTED:
      RECORD LOCKS space id 66 page no 3 n bits 80 index PRIMARY of table `qc`.`deadlock` trx id 61381 lock_mode X locks rec but not gap waiting
      Record lock, heap no 12 PHYSICAL RECORD: n_fields 7; compact format; info bits 0
      0: len 4; hex 821f622c; asc b,;;
      1: len 6; hex 00000000e962; asc b;;
      2: len 7; hex 27000001d901fd; asc ' ;;
      3: len 1; hex 31; asc 1;;
      4: len 1; hex 32; asc 2;;
      5: len 4; hex 80000001; asc ;;
      6: len 5; hex 99a6ce7d03; asc } ;; *** WE ROLL BACK TRANSACTION (1)

菜瓜:这不是很顺利吗

水稻:我会告诉你在我本地环境中一直没有复现出来吗?我会告诉你我找了一天才找到原因是因为MySQL配置问题(需要开启bin log,开启成功后执行 select version() 会看到 5.7.30-log)?我会告诉你这过程中我放弃了好几次又决定再看看吗?当然不会

菜瓜:好厉害哦!那你很棒棒哦!

水稻:。。。来,进入分析环节

  • 两个SQL语句的explain执行计划

    • explain
      update `deadlock` set `status` = 1,`expired` = CURRENT_TIMESTAMP
      where `id` <= 35610745 and `from` = '' and `to` = 'c' ;
      -- Using intersect(idx_from,idx_to); Using where explain
      update `deadlock` set `status` = 1,`expired` = CURRENT_TIMESTAMP
      where `id` <= 35611183 and `from` = '' and `to` = '' ;
      -- Using intersect(idx_to,idx_from); Using where
    • 可以看到执行这两个SQL的时候命中的索引竟然是NB的Merge Index(鬼知道这是啥),而且它两顺序还不一致(有兴趣的朋友可以上搜索一下这个玩意)
    • Merge Index 索引合并技术是MySQL的一个优化,会将两个独立的索引扫描的结果进行取交集或者并集来加快数据的检索。
    • 这里的关键点是它会导致MySQL在拿锁的顺序上不一致

菜瓜:你这个铺垫太多了,我已经记不清楚前面那么多东西了,请直接上结论吧

水稻:好的,前面的code是方便您自己下去复现的,对于动手党有用。您可以直接忽略

  • 这里原因的解析只需要注意死锁日志和最后的explain执行计划结果
  • 事务Transaction1
  • 事务Transaction2

  • 结论就是:id为35610742记录上的索引顺序不一致出现了死锁

    • SQL1(事务2)持有idx_from,在等待主键primary key。执行计划中它命中索引 intersect(idx_from,idx_to) ,非聚簇索引除了拿到自己的索引之外还要获取主键索引,所以它拿锁的顺序是先获取idx_from,再获取primary key,最后获取idx_to,再primary key

    • SQL2(事务1)持有primary key,在等待idx_from。同理它命中索引intersect(idx_to,idx_from),它拿锁的顺序是先获取idx_to,再获取primary key,最后获取idx_from,再primary key
      (日志里面看不出来SQL2持有主键索引,这里是根据出现死锁的互斥条件得出它持有主键索引)

菜瓜:这是何等的wocao!!!

水稻:解决这个问题只要把两个单个索引改成联合索引即可

总结:

  • 单行update语句引发的死锁问题
  • 单行记录拿锁顺序不一致出现死锁
  • 索引合并Merge Index 导致获取锁顺序不一致
  • 场景复现需要把log_bin日志打开,注意查看select version()
  • 多线程模拟并发场景
  • 死锁日志分析

【MySQL】Merge Index导致死锁的更多相关文章

  1. [经验分享] MySQL Innodb表导致死锁日志情况分析与归纳【转,纯学习】

    在定时脚本运行过程中,发现当备份表格的sql语句与删除该表部分数据的sql语句同时运行时,mysql会检测出死锁,并打印出日志. 两个sql语句如下: (1)insert into backup_ta ...

  2. MySQL Innodb表导致死锁日志情况分析与归纳

    发现当备份表格的sql语句与删除该表部分数据的sql语句同时运行时,mysql会检测出死锁,并打印出日志   案例描述在定时脚本运行过程中,发现当备份表格的sql语句与删除该表部分数据的sql语句同时 ...

  3. mysql force index() 强制索引的使用

    mysql force index() 强制索引的使用 之前跑了一个SQL,由于其中一个表的数据量比较大,而在条件中有破坏索引或使用了很多其他索引,就会使得sql跑的非常慢... 那我们怎么解决呢? ...

  4. 解决Android Studio 3.0导入module依赖后unable to merge index

    解决Android Studio 3.0导入module依赖后unable to merge index 项目需要使用im, 在项目里导入了腾讯im的几个module依赖, 项目无法编译, 报错una ...

  5. MySQL 性能优化-数据库死锁监控

    MySQL性能优化-数据库死锁监控 by:授客 QQ:1033553122 1)表锁定 通过检查 table_locks_waited 和 table_locks_immediate 状态变量来分析表 ...

  6. Mysql索引引起的死锁

    提到索引,首先想到的是效率提高,查询速度提升,不知不觉都会有一种心理趋向,管它三七二十一,先上个索引提高一下效率..但是索引其实也是暗藏杀机的... 今天压测带优化项目,开着Jmeter高并发访问项目 ...

  7. MySQL MERGE存储引擎 简介及用法

    MERGE存储引擎把一组MyISAM数据表当做一个逻辑单元来对待,让我们可以同时对他们进行查询.构成一个MERGE数据表结构的各成员MyISAM数据表必须具有完全一样的结构.每一个成员数据表的数据列必 ...

  8. MySQL Online DDL导致全局锁表案例分析

    MySQL Online DDL导致全局锁表案例分析 我这边遇到了什么问题? 线上给某个表执行新增索引SQL, 然后整个数据CPU打到100%, 连接数暴增到极限, 最后导致所有访问数据库的应用都奔溃 ...

  9. Mysql force index和ignore index 使用实例

    前几天统计一个sql,是一个人提交了多少工单,顺便做了相关sql优化.数据大概2000多w. select CustName,count(1) c from WorkOrder where Creat ...

随机推荐

  1. Volley框架学习资料汇总

    Android Volley完全解析(一),初识Volley的基本用法(http://blog.csdn.net/guolin_blog/article/details/17482095/)

  2. 括号匹配-算法详细题解LeetCode

    题目:有效的括号 给定一个只包括 '(',')','{','}','[',']' 的字符串,判断字符串是否有效. 有效字符串需满足: 左括号必须用相同类型的右括号闭合. 左括号必须以正确的顺序闭合. ...

  3. 网络聚合Network Teaming

    team是新的聚合软件,依赖于安装包teamd,可以通过nmcli管理. team和bond的区别在于,支持hash加密,支持负载均衡,支持8块网卡,更好地支持IPV6,总之要取代bond. 1. 添 ...

  4. @bzoj - 1921@ [ctsc2010]珠宝商

    目录 @description@ @solution@ @accepted code@ @details@ @description@ 简述版题意:给定字符串 S 与一棵树 T,树上每个点有一个字符. ...

  5. HTML常用API(位置信息、音频视频)

    感谢:链接(讲解的很详细) 位置信息 1.代码: <script type="text/javascript"> navigator.geolocation.getCu ...

  6. IP地址、计算机名称、MAC地址如何获取

    以下的操作都在“命令提示窗口”中操作. 已知IP,如何获得计算机名称 方法(1): 使用ping -i ip地址 例如已知地址为192.168.1.168. 那么使用ping -i 192.168.1 ...

  7. C/C++语言的学习方向

    这个世界上有太多的坑,如果我们不具备查阅资料的能力和对现实世界的思考能力,入坑是大概率的事情. C/C++语言能做什么?C/C++程序员在做什么?企业需要什么样的C/C++程序员?对初学者来说,要搞清 ...

  8. 一分钟开始持续集成之旅系列之:C 语言 + Makefile

    作者:CODING - 朱增辉 前言 make 工具非常强大,配合 makefile 文件可以实现软件的自动化构建,但是执行 make 命令依然需要经历手动输入执行.等待编译完成.将目标文件转移到合适 ...

  9. 使用JUnit 和Jacoco进行单元测试

    Jacoco配置 <dependency> <groupId>org.jacoco</groupId> <artifactId>jacoco-maven ...

  10. git提交时报错:Updates were rejected because the tip of your current branch is behind

    有如下3种解决方法: 1.使用强制push的方法:git push -u origin master -f这样会使远程修改丢失,一般是不可取的,尤其是多人协作开发的时候. 2.push前先将远程rep ...