SQL优化案例（2）：OR条件优化

接下来上一篇文章《 SQL优化案例（1）：隐式转换》的介绍，此处内容围绕OR的优化展开。

在MySQL中，同样的查询条件，如果变换OR在SQL语句中的位置，那么查询的结果也会有差异，在多个复杂的情况下，可能会带来索引选择不佳的性能隐患，为了避免执行效率大幅度下降的问题，我们可以适当考虑使用统一所有对查询逻辑复杂的SQL进行分离。

常见OR使用场景，请阅读以下案例。

案例一：不同列使用OR条件查询

1.待优化场景

SELECT

..

..

 FROM`t1` a

 WHERE a.token= '16149684'

 AND a.store_id= '242950'

 AND(a.registrationId IS NOT NULL

 AND a.registrationId<> '')

 OR a.uid= 308475

 AND a.registrationId IS NOT NULL

 AND a.registrationId<> ''

执行计划

+--------------+-----------------------+-----------------+----------------+-------------------+-------------------+---------------+----------------+---------------------------------------------+

| id           | select_type           | table           | type           | key               | key_len           | ref           | rows           | Extra                                       |

+--------------+-----------------------+-----------------+----------------+-------------------+-------------------+---------------+----------------+---------------------------------------------+

| 1            | SIMPLE                | a               | range          |idx_registrationid | 99                |               | 100445         | Using index condition; Using where          |

+--------------+-----------------------+-----------------+----------------+-------------------+-------------------+---------------+----------------+---------------------------------------------+

共返回1行记录，花费 5 ms 。

2.场景解析

从查询条件中可以研磨令牌和uid过滤性都非常好，但是由于使用了，或者，需要采用索引合并的方法才能获得比较好的性能。但在实际执行过程中MySQL优化器替代选择了使用registrationId的索引，导致SQL的性能很差。

3.场景优化

我们将SQL改写成union all的形式。

SELECT

...

...

FROM`t1` a

WHERE a.token = '16054473'

AND a.store_id = '138343'

AND b.is_refund = 1

AND (a.registrationId IS NOT NULL

AND a.registrationId <> '')

union all

SELECT

...

...

FROM`t1` a

where a.uid = 181579

AND a.registrationId IS NOT NULL

AND a.registrationId <> ''

+--------------+-----------------------+-----------------+----------------+------------------------------+---------------+-------------------+------------------------------+----------------+------------------------------------+

| id           | select_type           | table           | type           | possible_keys                | key           | key_len           | ref                          | rows           | Extra                              |

+--------------+-----------------------+-----------------+----------------+------------------------------+---------------+-------------------+------------------------------+----------------+------------------------------------+

| 1            | PRIMARY               | a               | ref            | IDX_TOKEN,IDX_STORE_ID_TOKEN | IDX_TOKEN     | 63                | const                        | 1              | Using index condition; Using where |

| 1            | PRIMARY               | b               | eq_ref         | PRIMARY                      | PRIMARY       | 4                 | youdian_life_sewsq.a.role_id | 1              | Using where                        |

| 2            | UNION                 | a               | const          | PRIMARY                      | PRIMARY       | 4                 | const                        | 1              |                                    |

| 2            | UNION                 | b               | const          | PRIMARY                      | PRIMARY       | 4                 | const                        | 0              | unique row not found               |

|              | UNION RESULT          | <union1,2>      | ALL            |                              |               |                   |                              |                | Using temporary                    |

+--------------+-----------------------+-----------------+----------------+------------------------------+---------------+-------------------+------------------------------+----------------+------------------------------------+

共返回5行记录，花费 5 ms 。

通过对比优化前后的执行计划，可以明显修剪，将SQL合并成两个子查询，再使用union对结果进行合并，稳定性和安全性更好，性能更高。

案例二：同一列使用OR查询条件

1.待优化场景

select

....

....

from

t1 as mci

left join t1 as ccv2_1 on ccv2_1.unique_no = mci=category_no1

left join t1 as ccv2_2 on ccv2_2.unique_no = mci=category_no2

left join t1 as ccv2_3 on ccv2_3.unique_no = mci=category_no3

left join(

 select product_id,

 count(0) count

 from t2 pprod

 inner join t3 pinfo on pinfo.promotion_id = pprod.promotion_id

 and pprod.is_enable =1

 and ppinfo.is_enable=1

 and pinfo.belong_t0 =1

 and pinfo.end_time >=now()

 and not (

 pinfo.onshelv_time>'2019-06-30 00:00:00'

 or pinfo.end_time>'2018-12-05 00:00:00'

 )group by pprod.product_id

)as pc on pc.product_id = mci.product_id

where mci.is_enable =0

and mci.comodifty_type in ('1', '5', '6')

and (pc.count =0 or pc.count isnull ) limit 0,5;

执行计划

2.场景解析

本例的SQL查询中有一个子查询，子查询被当成成驱动表，产生了auto_key，通过SQL进行进行测试，验证主要是（pc.count = 0或pc.count为null）会影响到整个SQL的性能，需要进行比较改写。

3.场景优化

首先我们可以单独思考（pc.count = 0或pc.count为null）如何进行优化？先写一个类似的SQL

Select col from test where col =100 or col is null;

+--------+

| col    |

+--------+

|    100 |

|   NULL |

+--------+

2 rows in set (0.00 sec)

这个时候我们看到的其实是同一个列，但对应不同的值，这种情况可以利用case when进行转换。

Select col From test where case when col is null then 100 else col =100 end;

+--------+

| col    |

+--------+

|    100 |

|   NULL |

+--------+

2 rows in set (0.00 sec)

再回到原始SQL进行改写。

select

....

....

from

t1 as mci

left join t1 as ccv2_1 on ccv2_1.unique_no = mci=category_no1

left join t1 as ccv2_2 on ccv2_2.unique_no = mci=category_no2

left join t1 as ccv2_3 on ccv2_3.unique_no = mci=category_no3

left join(

 select product_id,

 count(0) count

 from t2 pprod

 inner join t3 pinfo on pinfo.promotion_id = pprod.promotion_id

 and pprod.is_enable =1

 and ppinfo.is_enable=1

 and pinfo.belong_t0 =1

 and pinfo.end_time >=now()

 and not (

 pinfo.onshelv_time>'2019-06-30 00:00:00'

 or pinfo.end_time>'2018-12-05 00:00:00'

 )group by pprod.product_id

)as pc on pc.product_id = mci.product_id

where mci.is_enable =0

and mci.comodifty_type in ('1', '5', '6')

and case when pc.count is null then 0 else pc.count end=0 limit 0,5;

可以抛光优化后的SQL比原始SQL快了30秒，执行效率提升约50倍。

案例三：优化关联SQL OR条件

1.待优化场景

SELECT user_msg.msg_id AS ‘msg_id’, user_msg.content AS ‘msg_content’, …

FROM user_msg

LEFT JOIN user ON user_msg.user_id = user.user_id

LEFT JOIN group ON user_msg.group_id = group.group_id

WHERE user_msg.gmt_modified >= date_sub('2018-03-29 09:31:44', INTERVAL30SECOND)

OR user.gmt_modified >= date_sub('2018-03-29 09:31:44', INTERVAL 30 SECOND)

OR group.gmt_modified >= date_sub('2018-03-29 09:31:44', INTERVAL 30 SECOND)

2.场景解析

我们仔细分析上述查询语句，发现虽然业务逻辑只需要查询半分钟内修改的数据，但执行过程却必须对所有的数据进行关联操作，带来的性能损失。

3.场景优化

我们对原始SQL进行分解操作，第一部分sql-01如下：

SELECT user_msg.msg_id AS ‘msg_id’, user_msg.content AS ‘msg_content’, …

FROM user_msg

LEFT JOIN user ON user_msg.user_id = user.user_id

LEFT JOIN group ON user_msg.group_id = group.group_id

WHERE user_msg.gmt_modified >= date_sub('2018-03-29 09:31:44', INTERVAL 30 SECOND)

sql-01以user_msg表为驱动，使用gmt_modified索引过滤最新数据。

第二部分sql-02如下：

SELECT user_msg.msg_id AS ‘msg_id’, user_msg.content AS ‘msg_content’, …

FROM user_msg

LEFT JOIN user ON user_msg.user_id = user.user_id

LEFT JOIN group ON user_msg.group_id = group.group_id

WHERE user.gmt_modified >= date_sub('2018-03-29 09:31:44', INTERVAL 30 SECOND)

sql-02以用户为驱动表，msg user_id的索引过滤行很好。

第三部分sql-03如下：

SELECT user_msg.msg_id AS ‘msg_id’, user_msg.content AS ‘msg_content’, …

FROM user_msg

LEFT JOIN user ON user_msg.user_id = user.user_id

LEFT JOIN group ON user_msg.group_id = group.group_id

WHERE group.gmt_modified >= date_sub('2018-03-29 09:31:44', INTERVAL 30 SECOND)

sql-03以group为驱动表，使用gmt_modified索引过滤最新数据。

总结

MySQL OR条件优化的常见场景主要有以下情况：

1，相同列可以使用IN进行代替

2，不同列及复杂的情况下，可以使用union all进行分离

3，关联SQL OR条件

我们需要结合实际场景，分析优化。

更多技术可以去官网查看https://www.dtstack.com/dtsmart/

SQL优化案例（2）：OR条件优化的更多相关文章

优化案例--改写IN条件为INNER JOIN
--====================================== --原始语句 SET STATISTICS IO ON SELECT COUNT(DISTINCT parent_co ...
MySQL参数优化案例
环境介绍优化层级与指导思想优化过程最小化安装情况下的性能表现优化innodb_buffer_pool_size 优化innodb_log_files_in_group&innodb_l ...
SQL性能优化案例分析
这段时间做一个SQL性能优化的案例分析, 整理了一下过往的案例,发现一个比较有意思的,拿出来给大家分享. 这个项目是我在项目开展2期的时候才加入的, 之前一期是个金融内部信息门户, 里面有个功能是收集 ...
SQL 优化案例 1
create or replace procedure SP_GET_NEWEST_CAPTCHA( v_ACCOUNT_ID in VARCHAR2, --接收短信的手机号 v_Tail_num i ...
sqlserver sql优化案例及思路
始sql: SELECT TOP 100 PERCENT ZZ.CREW_NAME AS 机组, ZZ.CREW_ID, AA.年度时间, CC.当月时间, DD.连续七天时间 AS 最近七天 FRO ...
SQL 优化案例
create or replace procedure SP_GET_NEWEST_CAPTCHA( v_ACCOUNT_ID in VARCHAR2, --接收短信的手机号 v_Tail_num i ...
百倍性能的PL/SQL优化案例(r11笔记第13天)
我相信你是被百倍性能的字样吸引了,不过我所想侧重的是优化的思路,这个比优化技巧更重要,而结果嘛,其实我不希望说成是百倍提升,“”自黑“”一下. 有一个真实想法和大家讨论一下,就是一个SQL语句如果原本 ...
Hive优化案例
1.Hadoop计算框架的特点数据量大不是问题,数据倾斜是个问题. jobs数比较多的作业效率相对比较低,比如即使有几百万的表,如果多次关联多次汇总,产生十几个jobs,耗时很长.原因是map re ...
（4.13）SQL Server profile使用、数据库优化引擎顾问使用
SQL Server profile使用技巧介绍经常会有人问profile工具该怎么使用?有没有方法获取性能差的sql的问题.自从转mysql我自己也差不多2年没有使用profile,忽然prof ...
MySQL的索引单表优化案例分析
建表建立本次优化案例中所需的数据库及数据表 CREATE DATABASE db0206; USE db0206; CREATE TABLE `db0206`.`article`( `id` INT ...

随机推荐

Solution -「CSP 2019」Centroid
Description Link. 给定一棵 \(n\) 个点的树,设 \(E\) 为边集,\(V'_x,\ V'_y\) 分别为删去边 \((x,y)\) 后点 \(x\) 所在的树的点集和点 \ ...
Flask框架——请求扩展、flask中间件、蓝图、分析线程和协程
文章目录 01 请求扩展 01 before_first_request :项目启动后第一次请求的时候执行 02 before_request:每次请求之前执行 03 after_request:每次 ...
英方软件和dell emc对比理解
英方软件和dell emc对比理解: 英方软件功能对比dell emc理解 i2Availability 1.英方实现业务高可用的时候,要求在异地运行与生产机环境一致的备机,备机数据实时与生产机同 ...
手撕Vuex-实现mutations方法
经过上一篇章介绍,完成了实现 getters 的功能,那么接下来本篇将会实现 mutations 的功能. 在实现之前我们先来回顾一下 mutations 的使用. 将官方的 Vuex 导入进来,因为 ...
java——1.变量和数据类型
变量和数据类型字符.字节.位之间的关系 1.字符:人类可以阅读的文本内容最小单位字符编码:utf-8,gbk 2.字节:1字符=2字节:1字符=4字节 3.位:1字节=8位位指的是二进制位, ...
一文讲透DevOps理论体系的演进
一.前言当前,我国处于以信息化.数字化.网络化.智能化为特征的科技变革浪潮中,企业数字化转型大势所趋,那么作为支撑企业IT运转的运营体系也在向多元方向发展,比如DevOps(研发运营一体化).AIO ...
欧拉序求LCA
使用欧拉序 st 表 O(1) 求 LCA 欧拉序 st 表求 LCA 一开始是从某篇题解里看到的,后来百度了一下就会了( 这是一种预处理 O(nlogn) ,查询 O(1) 的优秀算法. 什么是欧拉 ...
Redis Functions 介绍之二
首先,让我们先回顾一下上一篇讲的在Redis Functions中关于将key的名字作为参数和非key名字作为参数的区别,先看下面的例子.首先,我们先在一个Lua脚本文件mylib.lua中定义如下的 ...
offline RL | TD3+BC：在最大化 Q advantage 时添加 BC loss 的极简算法
题目:A Minimalist Approach to Offline Reinforcement Learning ,NeurIPS 2021,8 7 7 5. pdf 版本:https://arx ...
关于Delphi
# 关于Delphi ··Delphi中使用的面向对象pascal编程语言. ··Pascal语言最初由瑞士苏黎士理工学院的尼古拉斯-沃斯(Niklaus Wirth)教授在1971年设计. ··19 ...

SQL优化案例（2）：OR条件优化

SQL优化案例（2）：OR条件优化的更多相关文章

随机推荐

热门专题