SQL Server优化技巧——如何避免查询条件OR引起的性能问题

原文:SQL Server优化技巧——如何避免查询条件OR引起的性能问题

之前写过一篇博客“SQL SERVER中关于OR会导致索引扫描或全表扫描的浅析”，里面介绍了OR可能会引起全表扫描或索引扫描的各种案例，以及如何优化查询条件中含有OR的SQL语句的几种方法，其实还有一些方法可以用来优化这种问题，这里简单介绍一下。

如下所示，下面的SQL语句之所有出现这种写法，是因为程序的查询界面，可能有多个输入性的查询条件，往往用户只填了一个或部分查询条件（业务情况，应该不用详细介绍，大家都能明白），但是程序里面没有通过判断查询条件生成不同的SQL语句，而是用一个SQL搞定，不管用户没有填写JobNo这个查询条件，下面这种写法：WHERE ISNULL(@JobNo, '') = '' OR JobNo = @JobNo都能满足条件，实现逻辑功能。

DECLARE @GenerateDateStart DATETIME ,

    @GenerateDateEnd DATETIME ,

    @JobNo NVARCHAR(200) ,

    @GkNo NVARCHAR(200);

SET @JobNo = 'PT19B030';

SET @GkNo = 'PV19-1-8050';

  SELECT    *

  FROM      [dbo].[GEW_UnitConsumption] AS A

            LEFT JOIN dbo.UnitConsumption_Relation AS B ON B.UsableFlag = 'Y'

                                                           AND A.GewUnitConsumptionId = B.RootUnitConsumptionID

  WHERE     ( ISNULL(@JobNo, '') = ''

              OR A.JobNo = @JobNo

            AND ( ISNULL(@GkNo, '') = ''

                  OR A.GkNo = @GkNo

);

其实，如果根据查询条件动态生成SQL语句，的确能避免查询条件中出现OR的情形，但是动态SQL语句没有上面语句简单和通熟易懂，尤其是查询条件较多的情况下。只能说各有利弊。这里暂且不讨论那种策略的优劣。

下面介绍一种技巧，如何避免OR引起的索引扫描或全表扫描问题。我们可以使用CASE WHEN改写一下这个SQL语句，就能避免OR引起的执行计划不走索引查找(Index Seek)的情况，如下所示：

DECLARE @GenerateDateStart DATETIME ,

    @GenerateDateEnd DATETIME ,

    @JobNo NVARCHAR(200) ,

    @GkNo NVARCHAR(200);

SET @JobNo = 'PT19B030';

SET @GkNo = 'PV19-1-8050';

SELECT  *

FROM    [dbo].[GEW_UnitConsumption] AS A

        LEFT JOIN dbo.UnitConsumption_Relation AS B ON B.UsableFlag = 'Y'

                                                       AND A.GewUnitConsumptionId = B.RootUnitConsumptionID

WHERE   CASE WHEN ISNULL(@JobNo, '') = '' THEN A.JobNo

             ELSE @JobNo

        END = JobNo

        AND CASE WHEN ISNULL(@GkNo, '') = '' THEN A.GkNo

                 ELSE GkNo

            END = @GkNo;

测试对比发现性能改善非常明显，当然这种优化技巧也是有局限性的，并不能解决所有OR引起的性能问题（没有银弹！）。如下所示，对于下面这种情况，这种技巧也是无能为力！

SELECT * FROM TEST1 WHERE A=12 OR B=500

------------------------------------------分割线-------------------------------------------------

网友MSSQL123反馈：他测试的一个案例发现这种技巧无效，个人测试验证发现确实如此，后面发现个人遇到的仅仅是一个特殊个例（当时生产环境那个场景下确实生效了），后面经过大量测试发现，很多情况下CASE WHEN这种技巧无效，也就是说单个案例不具有通用性，后面进一步测试分析，发现我得出的结论是错误的。

当然在错误的基础上，进一步测试验证，发现还是有技巧优化OR引起的性能问题的，这也是我后续补充的原因,请见下文分析：

我们首先简单构造一个测试环境案例,测试环境为SQL Server 2014

CREATE TABLE TEST_OPTION_COMPILE (OBJECT_ID  INT, NAME VARCHAR(16));

CREATE CLUSTERED INDEX PK_TEST_OPTION_COMPILE ON TEST_OPTION_COMPILE(OBJECT_ID);

DECLARE @Index INT =0;

WHILE @Index < 100000

BEGIN

    INSERT INTO TEST_OPTION_COMPILE

    SELECT @Index, 'kerry'+CAST(@Index AS VARCHAR(7));

    SET @Index = @Index +1;

END

CREATE INDEX IX_TEST_OPTION_COMPILE_N1 ON TEST_OPTION_COMPILE(NAME);

UPDATE STATISTICS TEST_OPTION_COMPILE WITH FULLSCAN;

如下测试所示，发现这个例子中，CASE WHEN完全无效，使用这种SQL写法，依然走Index Scan

DECLARE @name VARCHAR(8);

SET @name = 'kerry8'

SELECT  NAME

FROM    dbo.TEST_OPTION_COMPILE

WHERE   CASE WHEN ISNULL(@name, '') = '' THEN NAME

             ELSE @name

        END = NAME;

SELECT  NAME

FROM    dbo.TEST_OPTION_COMPILE

WHERE   ( ISNULL(@name, '') = ''

          OR NAME = @name

如果我们在SQL后面加上OPTION(RECOMPILE)的话，那么SQL就会走索引查找（Index Seek),其实下面两个SQL语句，如果都加上OPTION(RECOMPILE)的话，它们都会走索引。这是什么情况呢？

接下来我们对比分析一下，看看SQL语句有无OPTION(RECOMPILE)的区别，如下所示：

DECLARE @name VARCHAR(8);

SET @name = 'kerry8'

SELECT  NAME

FROM    dbo.TEST_OPTION_COMPILE

WHERE   CASE WHEN ISNULL(@name, '') = '' THEN NAME

             ELSE @name

        END = NAME ;

SELECT  NAME

FROM    dbo.TEST_OPTION_COMPILE

WHERE   CASE WHEN ISNULL(@name, '') = '' THEN NAME

             ELSE @name

        END = NAME OPTION(RECOMPILE)

如下所示，如果没有OPTION(RECOMPILE)的话，执行计划走Index Scan，预估行数（Estimated Number of Rows）是100000，而实际行数（Actual Number of Rows）是1，

如果SQL中有OPTION(RECOMPILE)的话，执行计划走Index Seek，预估行数（Estimated Number of Rows）是1，而实际行数（Actual Number of Rows）是1，从对比我们可以看出，加上OPTION(RECOMPILE)的话，SQL的执行计划要准确很多，那么为什么呢？这里是因为OPTION(RECOMPILE)开启了Parameter Embedding Optimization

关于Parameter Embedding Optimization，这里简单介绍一下，详情参考Parameter Sniffing, Embedding, and the RECOMPILE Options 和参考资料的相关文档。

参数嗅探值使优化器可以使用参数值来得出基数估计。 WITH RECOMPILE和OPTION（RECOMPILE）均会生成查询计划，并根据每次执行时的实际参数值计算出估算值。

　　相比WITH RECOMPILE这种强制重编译的方式，OPTION(RECOMPILE)中的参数嵌入优化（Parameter Embedding Optimization）的机制更进一步：查询解析期间，查询参数被文字常量值替代。解析器能够神奇的将复杂问题简单化，并且在随后的查询优化可能会进一步完善这些内容。

Microsoft在SQL Server 2008（后RTM）中引入了参数嵌入优化（Parameter Embedding Optimization）。这个特性扩展了参数嗅探优化。它能使用基数估计值来嗅探参数以影响计划。具体参考官方文档“Changed behaviour of OPTION RECOMPILE syntax in SQL Server 2008 SP1 cumulative update #5”

总结： 我们可以使用OPTION(RECOMPILE)（确切的说，是Parameter Embedding Optimization）这种技巧来避免查询条件中OR引起的性能问题，这确实是一个SQL Server优化技巧，至于我前面的结论，这是一个错误结论（使用CASE WHEN改写一下这个SQL语句，就能避免OR引起的执行计划不走索引查找(Index Seek)）。在缺乏严谨的论证、充分的测试就草率的得出了一个结论，以后要引以为戒！。

参考资料：

https://www.cnblogs.com/wy123/p/6262800.html

https://sqlperformance.com/2013/08/t-sql-queries/parameter-sniffing-embedding-and-the-recompile-options

SQL Server优化技巧——如何避免查询条件OR引起的性能问题的更多相关文章

SQL Server优化技巧——如何避免查询条件OR引起的性能问题
之前写过一篇博客"SQL SERVER中关于OR会导致索引扫描或全表扫描的浅析",里面介绍了OR可能会引起全表扫描或索引扫描的各种案例,以及如何优化查询条件中含有OR的SQL语句的 ...
SQL Server优化技巧之SQL Server中的"MapReduce"
日常的OLTP环境中,有时会涉及到一些统计方面的SQL语句,这些语句可能消耗巨大,进而影响整体运行环境,这里我为大家介绍如何利用SQL Server中的”类MapReduce”方式,在特定的统计情形中 ...
Sql Server 优化技巧
1.查看执行时间和cpu占用时间 set statistics time on select * from dbo.Product set statistics time off 打开你查询之后的消息 ...
SQL Server优化的方法
SQL Server优化的方法<一> 查询速度慢的原因很多,常见如下几种: 1.没有索引或者没有用到索引(这是查询慢最常见的问题,是程序设计的缺陷) 2.I/O吞吐量小,形成了 ...
深入SQL Server优化【推荐】
深入sql server优化,MSSQL优化,T-SQL优化,查询优化十步优化SQL Server 中的数据访问故事开篇:你和你的团队经过不懈努力,终于使网站成功上线,刚开始时,注册用户较少,网站性 ...
SQL Server优化器特性-隐式谓词
我们都知道,一条SQL语句提交给优化器会产生相应的执行计划然后执行输出结果,但他的执行计划是如何产生的呢?这可能是关系型数据库最复杂的部分了.这里我为大家介绍一个有关SQL Server优化器的特性- ...
Sql Server优化之路
本文只限coder级别层次上对Sql Server的优化处理简结,为防止专业DB人士有恶心.反胃等现象,请提前关闭此页面. 首先得有一个测试库,使用数据生成计划生成测试数据库(参考:http://de ...
【SQL Server 优化性能的几个方面】(转)
转自:http://blog.csdn.net/feixianxxx/article/details/5524819 SQL Server 优化性能的几个方面 (一).数据库的设计可以参看最 ...
SQL Server 优化器特性导致的内存授予相关BUG
我们有时会遇到一些坑,要不填平,要不绕过.这里为大家介绍一个相关SQL Server优化器方面的特性导致内存授予的相关BUG,及相关解决方式,也顺便回答下邹建同学的相关疑问. 问题描述一个简单的查询 ...

随机推荐

阿里云Ubuntu安装LNMP环境之Nginx
在QQ群很多朋友问阿里云服务器怎么安装LNMP环境,怎么把项目放到服务器上面去,在这里,我就从头开始教大家怎么在阿里云服务器安装LNMP环境. 在这之前,我们先要知道什么是LNMP. L: 表示的是L ...
javascript原型继承
在传统的基于Class的语言如Java.C++中,继承的本质是扩展一个已有的Class,并生成新的Subclass. 由于这类语言严格区分类和实例,继承实际上是类型的扩展.但是,JavaScript由 ...
0079 Ehcache 3.x应用入门及通过JCache与Spring整合
基本要素:版本.概念与抽象 Ehcache 3.x是一个用Java语言实现的缓存库,并且实现了 JSR107规范 Ehcache从2.x升级到3.x后,Maven依赖从 net.sf.ehcache: ...
宝塔apache设置泛目录的反向代理/莲花泛目录
反向解析目标站-泛目录站一般用ip或者ip:端口来搭建,这样可以节省一个域名,当然也可以用域名,看个人爱好.主站和泛站可以同一个服务器和可以不同服务器,看个人实际情况.先来看宝塔的反向代理的步骤:点击 ...
selenium知识点
1. 导包 from selenium import webdriver from selenium.webdriver.support.ui import WebDriverWait from se ...
西湖论剑2019--一道MISC题目的解题思路
TTL题的writeup 第一次打西湖论剑,啥都不懂,被题目虐的很惨,一共就做出来两道题,但也算有收获.这里分享一下TTL那道misc题目的writeup,算是给自己点安慰吧. 题目描述我们截获了一 ...
查找与排序算法（Searching adn Sorting）
1,查找算法常用的查找算法包括顺序查找,二分查找和哈希查找. 1.1 顺序查找(Sequential search) 顺序查找: 依次遍历列表中每一个元素,查看是否为目标元素.python实现代码如 ...
JDBC与ODBC
ODBC(Open Database Connectivity)是一组对数据库访问的标准API,这些API通过SQL来完成大部分任务,而且它本身也支持SQL语言,支持用户发来的SQL.ODBC定义了 ...
【MyBatis】【SQL】没有最快，只有更快，从一千万条记录中删除八百万条仅用1分9秒
这次直接使用delete from emp where cdate<'2018-02-02',看看究竟会发生什么. Mapper里写好SQL: <?xml version="1. ...
python 连接 hive
1.python连接hive,其实是连接hiveserver,连接的包的impyla impyla安装: error: cc1plus 没有文件或目录需要安装gcc 和g++,并且版本保持一致 er ...

SQL Server优化技巧——如何避免查询条件OR引起的性能问题

SQL Server优化技巧——如何避免查询条件OR引起的性能问题的更多相关文章

随机推荐

热门专题