SQL SERVER中关于OR会导致索引扫描或全表扫描的浅析（转载）

在SQL SERVER的查询语句中使用OR是否会导致不走索引查找（Index Seek）或索引失效（堆表走全表扫描（Table Scan）、聚集索引表走聚集索引扫描（Clustered Index Scan））呢？是否所有情况都是如此？又该如何优化呢？下面我们通过一些简单的例子来分析理解这些现象。下面的实验环境为SQL SERVER 2008，如果在不同版本有所区别，欢迎指正。

堆表单索引

首先我们构建我们测试需要实验环境，具体情况如下所示：

DROP TABLE TEST

CREATE TABLE TEST (OBJECT_ID  INT, NAME VARCHAR(32));

CREATE INDEX PK_TEST ON TEST(OBJECT_ID)

DECLARE @Index INT =0;

WHILE @Index < 500000

BEGIN

    INSERT INTO TEST

    SELECT @Index, 'kerry'+CAST(@Index AS VARCHAR(6));

    SET @Index = @Index +1;

END

UPDATE STATISTICS TEST WITH FULLSCAN

场景1：如下所示，并不是所有的OR条件都会导致SQL走全表扫描。具体情况具体分析，不要套用教条。

SELECT * FROM TEST WHERE (OBJECT_ID =5 OR OBJECT_ID = 105)

场景2：加了条件1=1后，执行计划从索引查找（Index Seek）变为全表扫描（Table Scan），为什么会如此呢？个人理解为优化器将OR运算拆分为两个子集处理，由于一些原因，1=1这个条件导致优化器认定需要全表扫描才能完成1=1条件子集的计算处理（为了理解这个，煞费苦心，鉴于理论薄弱，如有错误或不足，敬请指出）。所以优化器在权衡代价后生成的执行计划最终选择了全表扫描（Table Scan）

SELECT * FROM TEST WHERE (1=1 OR OBJECT_ID =105);

场景3: 下面场景比较好理解，因为下面需要从500000条记录中取出499700条记录，而全表扫描（Table Scan）肯定是最优的选择，代价（Cost）最低。

SELECT * FROM TEST WHERE (OBJECT_ID >300 OR OBJECT_ID =105);

场景4：这种场景跟场景2的情况本质是一样的。所以在此略过。其实类似这种写法也是实际情况中最常出现的情况，还在迷糊的同学，赶紧抛弃这种写法吧

DECLARE @OBJECT_ID INT =150;

SELECT * FROM TEST WHERE (@OBJECT_ID IS NULL OR OBJECT_ID =@OBJECT_ID);

聚集索引表单索引

在聚集索引表中，我们也依葫芦画瓢，准备实验测试的数据环境。

DROP TABLE TEST

CREATE TABLE TEST (OBJECT_ID  INT, NAME VARCHAR(32));

CREATE CLUSTERED INDEX PK_TEST ON TEST(OBJECT_ID)

DECLARE @Index INT =0;

WHILE @Index < 500000

BEGIN

    INSERT INTO TEST

    SELECT @Index, 'kerry'+CAST(@Index AS VARCHAR(6));

    SET @Index = @Index +1;

END

UPDATE STATISTICS TEST WITH FULLSCAN

场景1 ：索引查找（Index Seek）

SELECT * FROM TEST WHERE (OBJECT_ID =5 OR OBJECT_ID = 105)

场景2：聚集索引扫描（Clustered Index Scan）

场景3：似乎与堆表有所不同。聚集索引表居然还是走聚集索引查找。

场景4：OR导致聚集索引扫描

如果堆表或聚集索引表上建立有联合索引,情况也大致如此，在此不做过多案例讲解。下面仅仅讲述一两个案例场景。

DROP TABLE test1; 

CREATE TABLE test1

  (

     a INT,

     b INT,

     c INT,

     d INT,

     e INT

  ) 

DECLARE @Index INT =0; 

WHILE @Index < 10000

  BEGIN

      INSERT INTO test1

      SELECT @Index,

             @Index,

             @Index,

             @Index,

             @Index 

      SET @Index = @Index + 1;

  END 

CREATE INDEX idx_test_n1

  ON test1(a, b, c, d) 

UPDATE STATISTICS test1 WITH fullscan;

SELECT * FROM TEST1 WHERE A=12 OR B> 500 OR C >100000

因为结果集是几个条件的并集，最多只能在查找A=12的数据时用索引，其它几个条件都需要表扫描，那优化器就会选择直接走一遍表扫描，以最低的代价COST完成，所以索引就失效了。

那么如何优化查询语句含有的OR的SQL语句呢？方法无外乎有三种：

1：通过索引覆盖，使包含OR的SQL走索引查找（Index Seek）。但是这个只能满足部分场景，并不能解决所有这类SQL。这个Solution具有一定的局限性。

SELECT * FROM TEST1 WHERE A=12 OR B=500

如果我们通过索引覆盖，在字段B上面也建立索引，那么下面OR查询也会走索引查

CREATE INDEX IDX_TEST1_B ON TEST1(B);

SELECT * FROM TEST1 WHERE A=12 OR B=500

2：使用IN替换OR。但是这个Solution也有很多局限性。在此不做过多阐述。

3：一般将OR的字句分解成多个查询，并且通过UNION ALL 或UNION连接起来。在联合索引或有索引覆盖的场景下。大部分情况下，UNION ALL的效率更高。但是并不是所有的UNION ALL都会比OR的SQL的代价（COST），特殊的情况或特殊的数据分布也会出现UNION ALL比OR代价要高的情况。例如，上面特殊的要求，从全表中取两条记录，如下所示

SELECT * FROM TEST1 WHERE A=12

UNION ALL

SELECT * FROM TEST1 WHERE B=500

UNON ALL语句的代价（Cost）要高与OR是因为它做了两次索引查找（Index Seek），而OR语句只做一次索引查找（Index Seek）就完成了。开销明显小一些，但是实际情况这类特殊情况比较少，实际情况的取数条件、数据都比这个简单案例要复杂得多。所以在大部分情况下，拆分为UNION ALL语句的效率要高于OR语句

另外一个案例，就是最上面实验的堆表TEST，在字段OBJECT_ID上建有索引

SELECT * FROM TEST WHERE (OBJECT_ID >300 OR OBJECT_ID =105);

SELECT * FROM TEST WHERE OBJECT_ID >300

UNION ALL

SELECT * FROM TEST WHERE OBJECT_ID =105;

可以从下面看出两者开销不同的地方在于IO方面，两者开销之所以有区别，是因为第二个SQL多了一次扫描（索引查找）

总结：

在实际开发环境中，OR这种写法确实会带来很多不确定性，尽量使用UNION 或IN替换OR。我们需要遵循一些规则，但是也不能认为它就是一成不变的，永为真理。具体场景、具体环境具体分析。要知其然知其所以然。在微软亚太区数据库技术支持组的官方博客中就有一个案例SQL Server性能问题案例解析（3）也是OR引起的性能案例。博客中有个观点，我觉得挺赞的：”需要注意的是，对于OR或UNION，并没有确定的孰优孰劣，使用时要进行测试才能确定。“ 。

原文链接

SQL SERVER中关于OR会导致索引扫描或全表扫描的浅析（转载）的更多相关文章

SQL SERVER中关于OR会导致索引扫描或全表扫描的浅析
在SQL SERVER的查询语句中使用OR是否会导致不走索引查找(Index Seek)或索引失效(堆表走全表扫描 (Table Scan).聚集索引表走聚集索引扫描(Clustered Index ...
SQL SERVER中什么情况会导致索引查找变成索引扫描
SQL Server 中什么情况会导致其执行计划从索引查找(Index Seek)变成索引扫描(Index Scan)呢? 下面从几个方面结合上下文具体场景做了下测试.总结.归纳. 1:隐式转换会导致 ...
SQL Server中TOP子句可能导致的问题以及解决办法
简介在SQL Server中,针对复杂查询使用TOP子句可能会出现对性能的影响,这种影响可能是好的影响,也可能是坏的影响,针对不同的情况有不同的可能性. 关系数据库中SQL语句只 ...
SQL Server中VARCHAR(MAX)和NVARCHAR(MAX)使用时要注意的问题（转载）
在Microsoft SQLServer2005及以上的版本中,对于varchar(n).nvarchar(n)和varbinary(n)有了max的扩展.可以使用如:varchar(max).nva ...
SQL Server中通过设置非聚集索引(Non-Clustered index)来达到性能优化的目的
首先我们一下,在SQL Server 2014 Management Studio中,如何为一张表设置Non-Clustered index 具体可以参考 https://docs.microsof ...
SQL Server 中SELECT INTO 和 INSERT INTO SELECT 两种表复制语句
1.INSERT INTO SELECT语句语句形式为:Insert into Table2(field1,field2,...) select value1,value2,... from Tab ...
mysql in 中使用子查询，会不使用索引而走全表扫描
所以可以将 in 条件中子查询转换成一张子表,从而通过 join 的形式进行条件限制.
SQL Server临界点游戏——为什么非聚集索引被忽略！
当我们进行SQL Server问题处理的时候,有时候会发现一个很有意思的现象:SQL Server完全忽略现有定义好的非聚集索引,直接使用表扫描来获取数据.我们来看看下面的表和索引定义: CREATE ...

随机推荐

Java你不知道的那些事儿—Java隐藏特性（上）
每种语言都很强大,不管你是像我一样的初学者还是有过N年项目经验的大神,总会有你不知道的东西.就其语言本身而言,比如Java,也许你用Java开发了好几年,对其可以说是烂熟于心,但你能保证Java所有的 ...
简单的字母全排列问题—递归法和STL法
问题描述:求全由小写字母组成的不超过200个字符序列的全排列如输入序列bbjd,排列结果为: bbdj bbjd bdbj bdjb bjbd bjdb dbbj dbjb djbb jbbd jb ...
从Java进程里dump出类的字节码文件
想要查看一些被增强过的类的字节码,或者一些AOP框架的生成类,就需要dump出运行时的Java进程里的字节码. 从运行的java进程里dump出运行中的类的class文件的方法: 用agent att ...
KMP算法理解（转）
(作者matrix67) KMP算法是拿来处理字符串匹配的.换句话说,给你两个字符串,你需要回答,B串是否是A串的子串(A串是否包含B串).比如,字符串A="I'm matrix67&quo ...
oc for in遍历
在oc中用for in遍历可变数组时,不能修改删除新增元素,因为for in遍历是枚举遍历,在遍历的过程中不能修改容器里的值. NSMutableArray *arr=[NSMutableArray ...
.18-浅析webpack源码之compile流程-rules参数处理(1)
Tips:写到这里,需要对当初的规则进行修改.在必要的地方,会在webpack.config.js中设置特殊的参数来跑源码,例如本例会使用module:{rules:[...]}来测试,基本上测试参数 ...
C# Azure 设置云端应用程序的默认时间
在微软云Azure中,应用程序(website)的默认时间是按照美国UTC的时间的. 例如,在应用程序中获取DateTime.Now,的时候,是获取UTC的时间,不是中国的时间. 所以我们开始在这里设 ...
关于winform文本框怎么实现html的placeholder效果
winfrom默认是不支持这种操作的,此时需要重写控件操作,具体代码如下: public class TextBoxEx : TextBox { public String PlaceHolderSt ...
SQL SERVER 快捷键收录
1.大小写转换快捷键 Ctrl+Shift+U 转为大写 Ctrl+Shift+L 转为小写
[日常] Go语言圣经--示例: 并发的Clock服务习题
练习 8.1: 修改clock2来支持传入参数作为端口号,然后写一个clockwall的程序,这个程序可以同时与多个clock服务器通信,从多服务器中读取时间,并且在一个表格中一次显示所有服务传回的结 ...

SQL SERVER中关于OR会导致索引扫描或全表扫描的浅析 （转载）

SQL SERVER中关于OR会导致索引扫描或全表扫描的浅析 （转载）的更多相关文章

随机推荐

热门专题

SQL SERVER中关于OR会导致索引扫描或全表扫描的浅析（转载）

SQL SERVER中关于OR会导致索引扫描或全表扫描的浅析（转载）的更多相关文章