SQL SERVER 中is null 和 is not null 将会导致索引失效吗？

其实本来这个问题没有什么好说的，今天优化的时候遇到一个SQL语句，因为比较有意思，所以我截取、简化了SQL语句，演示给大家看，如下所示

declare @bamboo_Code varchar(3);

set @bamboo_Code='-01';

SELECT DISTINCT yarn_lot

FROM   dbo.rsjob WITH ( nolock )

WHERE  RIGHT(ges_no, 3) = @bamboo_Code

       AND Isnull(yarn_lot, '') <> '';

如上所示，SQL中对列yarn_log 使用了Isnull(yarn_lot, '') <> ''这种写法，我估计书写该SQL语句的人应该是深信了“is null 和 is not null 将会导致索引失效”这条网上流传的教条，至于这个建议是从哪里流传开来，已经无法考证。那么我们通过实践来验证一下is null 或 is not null 是否会导致索引失效。

表rsjob是一个堆表，在列yarn_lot上建有索引yarn_lot.那么我们通过实验来验证吧

SELECT DISTINCT yarn_lot

FROM   dbo.rsjob WITH(nolock)

WHERE  yarn_lot IS NOT NULL;

SELECT DISTINCT yarn_lot

FROM   dbo.rsjob WITH(nolock)

WHERE  yarn_lot IS NULL

如上所示，不管是IS NULL 或IS NOT NULL都走了索引查找。

declare @bamboo_Code varchar(3);

set @bamboo_Code='-01';

SELECT DISTINCT yarn_lot

FROM   dbo.rsjob WITH ( nolock )

WHERE  RIGHT(ges_no, 3) = @bamboo_Code

       AND Isnull(yarn_lot, '') <> '';

SELECT DISTINCT yarn_lot

FROM   dbo.rsjob WITH ( nolock )

WHERE  RIGHT(ges_no, 3) = @bamboo_Code

       AND yarn_lot IS NOT NULL;

另外我们来看看这两个原始SQL执行计划的开销比值为52:48，也就是说使用IS NOT NULL性能更好，第一个SQL语句由于做了转换，导致其走索引扫描，而使用IS NOT NULL则走索引查找。

“is null 和 is not null 将会导致索引失效”这种坑人教条直接被推翻了。所以还在信奉这个教条的人真应该自己动手验证一下。

下面我们可以通过实验验证一下，考虑到在真实环境中，可能情况比较复杂。我们可以构建下面几个场景。其实真实环境中情况还会复杂一些。但是基本上大致有如下一些场景

情况1：堆表谓词上单独索引列

USE Test;

GO

DROP TABLE TEST;

GO

CREATE TABLE TEST (OBJECT_ID  INT, NAME VARCHAR(12));

CREATE INDEX PK_TEST ON TEST(OBJECT_ID) INCLUDE(NAME);

DECLARE @Index INT =0;

WHILE @Index < 10000

BEGIN

    INSERT INTO TEST

    SELECT @Index, 'kerry'+ CAST(@Index AS VARCHAR);

    SET @Index = @Index +1;

END

INSERT INTO TEST

SELECT NULL, 'only test1' UNION ALL

SELECT NULL, 'only test2'

UPDATE STATISTICS TEST WITH FULLSCAN;

SELECT * FROM TEST WHERE OBJECT_ID IS NULL;

SELECT * FROM TEST WHERE  OBJECT_ID IS NOT NULL;

删除索引，建立如下索引。如下所示

DROP INDEX PK_TEST ON TEST;

CREATE INDEX PK_TEST ON TEST(OBJECT_ID)

由此可见IS NULL 或IS NOT NULL的执行计划即与索引有关系，还跟数据分布有一定关系。

情况2：堆表谓词上无索引

USE Test;

GO

DROP TABLE TEST;

GO

CREATE TABLE TEST (OBJECT_ID  INT, NAME VARCHAR(12));

DECLARE @Index INT =0;

WHILE @Index < 10000

BEGIN

    INSERT INTO TEST

    SELECT @Index, 'kerry'+ CAST(@Index AS VARCHAR);

    SET @Index = @Index +1;

END

INSERT INTO TEST


SELECT NULL, 'only test1' UNION ALL

SELECT NULL, 'only test2'

UPDATE STATISTICS TEST WITH FULLSCAN;

SELECT * FROM TEST WHERE OBJECT_ID IS NULL;

SELECT * FROM TEST WHERE  OBJECT_ID IS NOT NULL;

如上所示，如果一个堆表没有建立任何索引，那么使用IS NULL 或IS NOT NULL肯定要走全表扫描，不过这不在我们的讨论范围之内。然后我们看看将索引建立在其它字段上（主要是为了与聚集索引表对比），它依然全表扫描。

CREATE INDEX PK_TEST ON TEST(OBJECT_ID) INCLUDE(NAME);

INSERT INTO TEST

 SELECT 10000, NULL UNION ALL

 SELECT 10001, NULL ;

SELECT * FROM TEST WHERE NAME  IS NULL;

SELECT * FROM TEST WHERE  NAME IS NOT NULL;

情况3：堆表联合索引列

USE Test;

GO

DROP TABLE TEST;

GO

CREATE TABLE TEST (OBJECT_ID  INT, NAME VARCHAR(12), AGE INT);

CREATE INDEX IDX_TEST_N1 ON TEST(NAME, AGE);

DECLARE @Index INT =0;

WHILE @Index < 10000

BEGIN

    INSERT INTO TEST

    SELECT @Index, 'kerry'+ CAST(@Index AS VARCHAR), floor(rand()*100) ;

    SET @Index = @Index +1;

END

INSERT INTO TEST

SELECT NULL, 'only test1', 12 UNION ALL

SELECT NULL, 'only test2',24

UPDATE STATISTICS TEST WITH FULLSCAN;

SELECT * FROM TEST WHERE NAME IS NULL;

SELECT * FROM TEST WHERE  NAME IS NOT NULL;

如果联合索引中，谓词位于联合索引的第二或更后位置，那么又是什么情况？从下面我们可以看到，SQL走全表扫描了。

DROP INDEX IDX_TEST_N1 ON TEST;

CREATE INDEX IDX_TEST_N1 ON TEST( AGE,NAME);

UPDATE STATISTICS TEST WITH FULLSCAN;

4 聚集索引表单独索引列

USE Test;

GO

DROP TABLE TEST;

GO

CREATE TABLE TEST (OBJECT_ID  INT, NAME VARCHAR(12));

CREATE CLUSTERED INDEX PK_TEST ON TEST(OBJECT_ID)

DECLARE @Index INT =0;

WHILE @Index < 10000

BEGIN

    INSERT INTO TEST

    SELECT @Index, 'kerry'+ CAST(@Index AS VARCHAR);

    SET @Index = @Index +1;

END

INSERT INTO TEST

SELECT NULL, 'only test1' UNION ALL

SELECT NULL, 'only test2'

SELECT * FROM TEST WHERE OBJECT_ID IS NULL;

SELECT * FROM TEST WHERE  OBJECT_ID IS NOT NULL;

如果我在列NAME上面使用IS NULL 或IS NOT NULL进行查询，你会发现执行计划从聚集索引查找变为了聚集索引扫描。

INSERT INTO TEST

SELECT 10000, NULL UNION ALL

SELECT 10001, NULL ;

SELECT * FROM TEST WHERE NAME IS NULL;

SELECT * FROM TEST WHERE NAME IS NOT NULL;

4 聚集索引表联合索引列

USE Test;

GO

DROP TABLE TEST;

GO

CREATE TABLE TEST (OBJECT_ID  INT, NAME VARCHAR(12), AGE INT);

CREATE CLUSTERED INDEX PK_TEST ON TEST(OBJECT_ID)

DECLARE @Index INT =0;

WHILE @Index < 10000

BEGIN

    INSERT INTO TEST

    SELECT @Index, 'kerry'+ CAST(@Index AS VARCHAR), floor(rand()*100) ;

    SET @Index = @Index +1;

END

INSERT INTO TEST

SELECT 10001, 'NULL', 12 UNION ALL

SELECT 10002, 'NULL',24

CREATE INDEX IDX_TEST_N2 ON TEST(NAME,AGE);

UPDATE STATISTICS TEST WITH FULLSCAN;

如果联合索引中，谓词位于不位于第一列，那么IS NULL 或IS NOT NULL有会不会走索引呢？

DROP INDEX IDX_TEST_N2 ON TEST;

CREATE INDEX IDX_TEST_N2 ON TEST(AGE,NAME);

UPDATE STATISTICS TEST WITH FULLSCAN;

如上所示，它从索引查找变成索引扫描了。

小结： 1：“is null 和 is not null 将会导致索引失效”这种教条完全是狗屎，SQL Server的索引是包含了null 值，而Oracle的索引是不包含null值的。不同数据库情况有所不同，不要生搬硬套。

2：如果谓词上面建立有索引的话，基本上都会走索引，至于是走索引查找还是索引扫描与索引类型有一定关系，也与字段位于联合索引中位置有关系。另外，数据分布倾斜得非常厉害也会导致其走全表扫描而不走索引，但是这并不是说IS NULL 和 IS NOT NULL导致索引失效。有一点非常重要，通过观察SQL语句而推断执行计划是很不现实的，需要综合考察SQL语句所涉及表的索引、数据分布、统计信息，才能综合判断，用通俗的话来说要结合具体场景。

SQL SERVER 中is null 和 is not null 将会导致索引失效吗？的更多相关文章

SQL Server中可能为null的变量逻辑运算的时候要小心
DECLARE @a int declare @b int IF(@a<>@b) print('@a<>@b') else print('@a=@b') ) print('b& ...
sql server中NULL导入decimal字段时报错
sql server中NULL导入decimal字段时报错在导入CSV文件时,如果decimal字段为null值,导致文本文件入库时失败. 错误现象构造例子新建一张表,包含decimal字段. ...
SQL Server中NULL的一个测试
我们都知道SQL Server中NULL是一个很特殊的存在,因为NULL不会等于任何值,且NULL也不会不等于任何值.对于NULL我们只能使用IS或IS NOT关键字来进行比较. 我们先来看看下面一个 ...
SQL Server中的高可用性（2）----文件与文件组
在谈到SQL Server的高可用性之前,我们首先要谈一谈单实例的高可用性.在单实例的高可用性中,不可忽略的就是文件和文件组的高可用性.SQL Server允许在某些文件损坏或离线的情况下,允 ...
在SQL Server中为什么不建议使用Not In子查询
在SQL Server中,子查询可以分为相关子查询和无关子查询,对于无关子查询来说,Not In子句比较常见,但Not In潜在会带来下面两种问题: 结果不准确查询性能低下下面 ...
sql server中对xml进行操作
一.前言 SQL Server 2005 引入了一种称为 XML 的本机数据类型.用户可以创建这样的表,它在关系列之外还有一个或多个 XML 类型的列:此外,还允许带有变量和参数.为了更好地支持 XM ...
SQL Server中查询数据库及表的信息语句
/* -- 本文件主要是汇总了 Microsoft SQL Server 中有关数据库与表的相关信息查询语句. -- 下面的查询语句中一般给出两种查询方法, -- A方法访问系统表,适应于SQL 20 ...
再谈SQL Server中日志的的作用
简介之前我已经写了一个关于SQL Server日志的简单系列文章.本篇文章会进一步挖掘日志背后的一些概念,原理以及作用.如果您没有看过我之前的文章,请参阅: 浅谈SQL Server ...
SQL Server 中的事务与事务隔离级别以及如何理解脏读, 未提交读,不可重复读和幻读产生的过程和原因
原本打算写有关 SSIS Package 中的事务控制过程的,但是发现很多基本的概念还是需要有 SQL Server 事务和事务的隔离级别做基础铺垫.所以花了点时间,把 SQL Server 数据库中 ...

随机推荐

[python]CentOS 6下安装Python2.7
安装方法如果在CentOS上自己编译安装过python2.7,使用过程中会发现有些标准库没有安装之类的问题. 逛别人博客的时候发现,一个便捷的方法:使用RHSCL的全称是Red Hat Softwa ...
使用dynamic linq 解决自定义查询的若干弊端
在项目中想必大家肯定是使用各种ORM, 如:NH.EF.fluent Data. 然而我在使用ORM的这几年中,随着数据库的结构越来越复杂,自定义查询的越来越多,但是一直没有解决一个问题就是自定义查询 ...
【集合框架】JDK1.8源码分析之HashMap（一）
一.前言在分析jdk1.8后的HashMap源码时,发现网上好多分析都是基于之前的jdk,而Java8的HashMap对之前做了较大的优化,其中最重要的一个优化就是桶中的元素不再唯一按照链表组合,也 ...
2.第一个Struts2程序-HelloWorld程序
1.新建Web Project项目:Study_Struts2 2.新建HelloWordAction.java类 3.复制struts.xml文件到src目录下,配置struts.xml文件内容如下 ...
数据结构(c语言第2版)-----了解链表，栈，队列，串
关于链表我觉得这都是最基本的东西,但是不常见,在实际的应用中很少的使用,了解它会用就OK,不需要研究的那么深,除非做那种内存压缩,存储方面工作. C语言中动态申请空间 malloc() q=(dlin ...
工厂模式，根据ID创建对应的实例类
工厂模式,根据ID创建对应的实例类 // // main.cpp // TestCPP1 // // Created by bianchx on 15/4/27. // Copyright (c) 2 ...
PHP资源网站收藏
PHP之道 http://laravel-china.github.io/php-the-right-way/#use_the_current_stable_version http://www.ph ...
关于tomcat文件下载配置
前言 tomcat文件下载关闭tomcat目录列表浏览功能 Tomcat 不能下载带中文文件名的附件的方法在Java Web项目中文件下载是一个很常见的功能,最近在做项目中发现可以通过tomcat ...
魔术方法__sleep 和 __wakeup
感觉序列化和反序列化用得倒是比较少了,而json_encode和json_decode用得相对多,都是转化成串,进行入库.传输等.json更方便,但是序列化和反序列化结合这两个魔术方法使用倒还行< ...
推荐15款创建漂亮幻灯片的 jQuery 插件
对于设计师,开发者,摄影师或任何创造性的个人和企业,他们自己的网站是展示他们的技能和服务的最佳场所.你可能打算设计一个新的个人作品网站,不管你是从头开始或使用模板,都会需要使用 jQuery 幻灯片插 ...

SQL SERVER 中is null 和 is not null 将会导致索引失效吗？

SQL SERVER 中is null 和 is not null 将会导致索引失效吗？的更多相关文章

随机推荐

热门专题