日常问题: SQL优化

日常开发中，除了开辟新项目，业务需求开发，一般还要做负责系统的日常运维。比如线上告警了，出bug了，必须及时修复。这天，运维反馈mysql cpu告警了，然后抓了该时间节点的慢sql日志，要开发分析解决。

拿到的慢sql日志：

# Query 1: 1.16 QPS, 1.96x concurrency, ID 0x338A0AEE1CFE3C1D at byte 7687104

# This item is included in the report because it matches --limit.

# Scores: V/M = 0.02

# Time range: 2022-08-12T16:30:00 to 2022-08-12T17:11:32

# Attribute    pct   total     min     max     avg     95%  stddev  median

# ============ === ======= ======= ======= ======= ======= ======= =======

# Count         99    2880

# Exec time     99   4893s      1s      2s      2s      2s   172ms      2s

# Lock time     99   187ms    52us   343us    64us    84us    11us    60us

# Rows sent     97     248       0       1    0.09    0.99    0.28       0

# Rows examine  96 871.46M 308.56k 311.13k 309.85k 298.06k       0 298.06k

# Query size    99 812.81k     289     289     289     289       0     289

# String:

# Hosts        10.22.9.183 (742/25%), 10.26.9.126 (730/25%)... 2 more

# Users        order

# Query_time distribution

#   1us

#  10us

# 100us

#   1ms

#  10ms

# 100ms

#    1s  ################################################################

#  10s+

# Tables

#    SHOW TABLE STATUS LIKE 'serial_number_store'\G

#    SHOW CREATE TABLE `serial_number_store`\G

# EXPLAIN /*!50100 PARTITIONS*/

select *

        from serial_number_store sn

        where 1=1

          and company_code = '8511378117'

          and warehouse_code = '851'

          and sku_no = '6902952880'

          and (serial_no = '5007894' or sub_serial_no = 'v')\G

查询数据库定义，发现定义了几个index

  PRIMARY KEY (`ID`),

  KEY `IDX_SERIAL_NUMBER_2` (`WAREHOUSE_CODE`),

  KEY `IDX_SERIAL_NUMBER_3` (`SKU_NO`),

  KEY `IDX_SERIAL_NUMBER_4` (`SERIAL_NO`),

  KEY `IDX_SERIAL_NUMBER_5` (`SUB_SERIAL_NO`),

  KEY `IDX_SERIAL_NUMBER_6` (`SKU_NAME`),

  KEY `IDX_SERIAL_NUMBER_1` (`COMPANY_CODE`,`WAREHOUSE_CODE`,`SKU_NO`,`SERIAL_NO`) USING BTREE

按最左匹配原则，这条sql应该只会命中一个索引。因为or的另一半无法match。

explain发现实际执行计划：

key: IDX_SERIAL_NUMBER_3

key_len: 259

ref: const

rows: 45864

filtered:  0.95

Extra: Using where

表总数量： 13658763

or的优化技巧之一就是拆成2个可以命中索引的sql, 然后union all.

优化为union all

 explain select *

        from  serial_number_store sn

        where  company_code = '9311046897'

          and warehouse_code = '931DCA'

          and sku_no = '6935117818696'

          and serial_no = '862517054251459'

		  union all

		  select *

        from  serial_number_store sn

        where  company_code = '9311046897'

          and warehouse_code = '931DCA'

          and sku_no = '6935117818696'

          and sub_serial_no = '862517054251459';

最终explain

key:  IDX_SERIAL_NUMBER_4  IDX_SERIAL_NUMBER_5

ref: const        const

rows: 1     1

filtered: 5.0    5.0

extra: using where

正常到这里，找到解决方案，就算完事了。但作为线上问题的处理，你得分析为啥以前没事，现在出问题了。

查询对应的链路追踪情况：

和猜测一致，短时间内批量查询。几乎每条sql2s多耗时。虽然是后台任务，但数据量太大导致cpu 100%.

定位实际的代码，mybatis是这么写：

    <sql id="servialNumberStoreEntityParams">

    	<if test="id!=null and id!=''"> and ID = #{id}</if>

        <if test="companyCode!=null and companyCode!=''"> and company_code = #{companyCode}</if>

        <if test="warehouseCode!=null and warehouseCode!=''"> and warehouse_code = #{warehouseCode}</if>

        <if test="sku!=null and sku!=''"> and sku_no = #{sku}</if>

        <if test="serialNo!=null and serialNo!=''"> and (serial_no = #{serialNo} or sub_serial_no = #{serialNo})</if>

        <if test="lotNum!=null and lotNum!=''"> and lot_num = #{lotNum}</if>

    </sql>

这个查询片段有多个sql引用了。比如

select *

from serial_number_store sn

where 1=1

<include refid="servialNumberStoreEntityParams" />

改造成union也不是不行，比如

select *

        from  serial_number_store sn

        where 1=1

        <include refid="servialNumberStoreEntityParams" />

        <if test="serialNo!=null and serialNo!=''">

            and serial_no = #{serialNo}

            union all

            select *

            from cwsp_tb_serial_number_store sn

            where 1=1

            <include refid="servialNumberStoreEntityParams" />

            and sub_serial_no = #{serialNo}

        </if>

但前面说了多个片段引用了，对应多个sql查询方法，然后这多个sql查询方法又会对应多个业务调用。那问题来了，如果改完要测的话，业务场景该怎么测？一时犹豫了，要不要再花额外的时间去搞回归测试，验证。

和运维小哥说，反正是个后台任务，先不改吧。运维看没影响到业务(没人投诉)也就不管了。

然后第二天上班又收到了告警。逃不掉了。

定位代码的时候，发现有个update

<update id="update">

        update serial_number_store

        <set>

            <if test="companyCode!=null and companyCode!=''">  COMPANY_CODE = #{companyCode},</if>

            <if test="warehouseCode!=null and warehouseCode!=''">  WAREHOUSE_CODE = #{warehouseCode},</if>

            <if test="sku!=null and sku!=''">  SKU_NO = #{sku},</if>

            <if test="serialNo!=null and serialNo!=''">  SERIAL_NO = #{serialNo},</if>

            <if test="subSerialNo!=null and subSerialNo!=''">  SUB_SERIAL_NO = #{subSerialNo},</if>

            <if test="erpno!=null and erpno!=''">  ERP_ORDER = #{erpno},</if>

            <if test="docType!=null and docType!=''">  DOCTYPE = #{docType},</if>

            <if test="editTime!=null and editTime!=''">  EDITTM = #{editTime},</if>

            <if test="editWho!=null and editWho!=''">  EDITEMP = #{editWho},</if>

           </set>

        where 1=1

        <include refid="servialNumberStoreEntityParams" />

    </update>

这种sql，假如参数没传，岂不是全表被覆盖？当然，也能改。前提是梳理调用链路，把这些sql引用的业务场景梳理一遍，确定入参场景，然后修改，然后再模拟场景做测试。想想整个流程，1天不知道搞不搞的定，测试上线等等，还有更长的流程。

这种在设计之初就应该做好优化设计而不是出了问题再改，但当接手古老系统的时候，开发可能换了一波又一波了，这时候除了吐槽之外，只能填坑。与此同时，自己所开发的代码，在若干时间后，也许会被另外一个人吐槽(如果自己发现的坑是自己挖的，自然不会吐槽自己)

日常问题: SQL优化的更多相关文章

SQL优化之【类型转换】
DBA的日常工作中SQL优化占大半的时间,通常都是SQL语句性能问题或者schema设计有问题,最近遇到一个类型转换的问题,所以在这里分享一下,废话不多说了,直接建表进行测试. mysql), key ...
《高性能SQL调优精要与案例解析》一书谈SQL调优（SQL TUNING或SQL优化）学习
<高性能SQL调优精要与案例解析>一书上市发售以来,很多热心读者就该书内容及一些具体问题提出了疑问,因读者众多外加本人日常工作的繁忙 ,在这里就SQL调优学习进行讨论并对热点问题统一作答. ...
SQL优化之count(*),count(列)
一.count各种用法的区别 1.count函数是日常工作中最常用的函数之一,用来统计表中数据的总数,常用的有count(*),count(1),count(列).count(*)和count(1)是 ...
SQL优化的一些总结 SQL编写一般要求
SQL编写一般要求---SQL语句尽可能简单---分解联接保证高并发---同数据类型的列值比较---不在索引列做运算---禁止使用SELECT *---避免负向查询和%前缀模糊查询---保持事务(连接 ...
梁敬彬老师的《收获，不止SQL优化》，关于如何缩短SQL调优时间，给出了三个步骤，
梁敬彬老师的<收获,不止SQL优化>,关于如何缩短SQL调优时间,给出了三个步骤, 1. 先获取有助调优的数据库整体信息 2. 快速获取SQL运行台前信息 3. 快速获取SQL关联幕后信息 ...
sql优化-派生表与inner-join
首先来说明一下派生表? 外部的表查询的结果集是从子查询中生成的.如下形式: select ... from (select ....) dt 如上形式中括号中的查询的结果作为外面select语句的查询 ...
基于MySQL 的 SQL 优化总结
文章首发于我的个人博客,欢迎访问.https://blog.itzhouq.cn/mysql1 基于MySQL 的 SQL 优化总结在数据库运维过程中,优化 SQL 是 DBA 团队的日常任务.例行 ...
BATJ解决千万级别数据之MySQL 的 SQL 优化大总结
引用在数据库运维过程中,优化 SQL 是 DBA 团队的日常任务.例行 SQL 优化,不仅可以提高程序性能,还能减低线上故障的概率. 目前常用的 SQL 优化方式包括但不限于:业务层优化.SQL 逻 ...
（4）MySQL进阶篇SQL优化（常用SQL的优化）
1.概述前面我们介绍了MySQL中怎么样通过索引来优化查询.日常开发中,除了使用查询外,我们还会使用一些其他的常用SQL,比如 INSERT.GROUP BY等.对于这些SQL语句,我们该怎么样进行 ...

随机推荐

【生成对抗网络学习其三】BiGAN论文阅读笔记及其原理理解
参考资料: 1.https://github.com/dragen1860/TensorFlow-2.x-Tutorials 2.<Adversarial Feature Learning> ...
000 上传本地库到Github远程库过程全记录
20220613 Github上新创建了一个CsImage库,之后本地创建了一个对应名称的目录,并创建本地库,进行了上传操作,记录一下过程 1.Github上CsImage库创建完成 Github上创 ...
LVGL库入门教程01-移植到STM32（触摸屏）
LVGL库移植STM32 LVGL库简介 LVGL(Light and Versatile Graphics Library)是一个免费.开源的嵌入式图形库,可以创建丰富.美观的界面,具有许多可以自定 ...
C#中常用的目录|文件|路径信息操作
更新记录本文迁移自Panda666原博客,原发布时间:2021年5月16日. 说明 .NET的类库API设计的非常优秀,再加上文档docs.com写的非常优秀,写代码给人一种十分优雅的感觉. 获得当 ...
CSS SandBox
引言本篇文章主要介绍的是关于CSS Sandbox的一些事情,为什么要介绍这个呢?在我们日常的开发中,样式问题其实一直是一个比较耗时的事情,一方面我们根据 UI 稿不断的去调整,另一方面随着项目越来 ...
SAP Container Controls（容器）
BC_CONTROLS_TUTORIAL 效果代码 REPORT bc_controls_tutorial. *------------------------------------------- ...
Linux的文件路径和访问文件相关命令
Linux的绝对和相对路径绝地路径绝对路径:以根作为起来的路径相对路径相对路径:以当前位置作为起点文件操作命令显示当前工作目录: pwd命令 pwd:显示文件所在的路径基名:basena ...
Java方法读取文件内容
一.针对文件内容的读取,在平时的工作中想必是避免不了的操作,现在我将自己如何用java方法读取文件中内容总结如下:废话不多说,直接上代码: 1 public static void main(Stri ...
不要让Microsoft edge 打开IE浏览器的设置（兼容性问题）
1打开Microsoft edge 2 打开设置 3 搜索栏搜索IE,打开即可
Work Center View * cannot be used for report assignment. Please deselect错误解决方法
by zyi

日常问题: SQL优化

日常问题: SQL优化的更多相关文章

随机推荐

热门专题