索引这块从存储结构来分，有2大类，聚集索引和非聚集索引，而非聚集索引在堆表或者在聚集索引表都会对其键值有所影响，这块可以详细查看本系列第二篇文章：SQL SERVER大话存储结构_(2)_非聚集索引如何查找到行记录。

非聚集索引内又分为多类：单列索引、复合索引、包含索引、过滤索引等。之前文章有具体分析过非聚集索引的存储情况，但是没有对复合索引及包含索引做过多说明，本文来讲讲这两个索引。

如果转载，请注明博文来源： www.cnblogs.com/xinysu/ ，版权归博客园苏家小萝卜所有。望各位支持！

1 语法及说明

--复合索引

CREATE INDEX IndexName ON tbname(columna,columnb [,columnc...] )

--包含索引

CREATE INDEX IndexName ON tbname(columna [,columnb,columnc...] ) INCLUDE (column1 [,column2,column3...])

复合索引，顾名思义，及多个列组成的索引，列的顺序非常重要，关系到查询性能，这点后面会说明。

包含索引，建索引SQL 中含有 include 字段，索引键值用于WHERE条件过滤，INCLUDE字段用于 SELECT 展示，这点后面也会说明。

无论是符合索引还是包含索引，都有索引键值长度不能超过900字节的限制，但是要注意一点，包含索引的include字段是不包括在里边的。

2 索引页存储情况

从索引页的存储情况来分析，分析过程中，重点在查看复合索引跟包含包含索引在子节点及叶子结点的键值情况。

2.1 创建测试表格

创建表格 tbindex，建立两个测试索引，同时造数据。

 CREATE TABLE tbindex(

 id int identity(1,1) not null primary key ,

 name varchar(50) not null,

 type varchar(10) not null,

 numbers int not null

 )

 GO

 CREATE INDEX ix_number_name ON tbindex(numbers,name)

 GO

 CREATE INDEX ix_name ON tbindex(numbers) INCLUDE (name)

 GO

 DECLARE @ID INT

 SET @ID=1

 WHILE @ID<=5

 BEGIN

      INSERT INTO tbindex(name,type,numbers)

      SELECT

            name,

          type,

          object_id+@id

      FROM sys.objects

         SET @ID=@ID+1

 END

2.2 分析索引行

--查看该表格索引的id情况

SELECT * FROM sys.indexes WHERE object_id=object_id('tbindex')

--PK__tbindex__3213E83F89582AC3    1

--ix_number_name    2

--ix_number    3

DBCC traceon(3604)

DBCC ind('dbpage','tbindex',-1)

DBCC PAGE('dbpage',1,395,3)

DBCC PAGE('dbpage',1,396,3)

DBCC PAGE('dbpage',1,397,3)

DBCC PAGE('dbpage',1,398,3)

分析查看，得知：

复合索引 IX_number_name的索引节点为pageid=395，再挑选一个叶子结点来分析 pageid=396；
包含索引 IX_number 的索引节点为 pageid=397，再挑选一个叶子节点来分析 pageid=398。

--复合索引，395为索引页节点，396为索引页叶子节点

DBCC PAGE('dbpage',1,395,3)

DBCC PAGE('dbpage',1,396,3)

--包含索引，397为索引页节点，398为索引页叶子节点

DBCC PAGE('dbpage',1,397,3)

DBCC PAGE('dbpage',1,398,3)

从这里可以看出，复合索引跟包含索引的所有索引列都会存储在索引叶子节点跟子节点，但是包含索引的INCLUDE列，不在索引页的子节点存储，仅存储在索引页的叶子节点上。

从这里不难理解，为什么之前说 include列用于 select 列，而不用于 where 列过滤。因为非聚集索引当索引页面有多层的时候，是先查询索引的子节点，再查询索引的叶子节点，而包含索引的INCLUDE列不在叶子节点中存储，无法根据其来进行过滤。

3 对查询的影响

3.1 复合索引查询注意事项

由于需要数据量作为实验支持，所以不用之前分析索引行结构的表格tbindex，换个高大上 tb_composite 如下。

 create table tb_composite(

 id int identity(1,1) not null primary key,

 name varchar(50) not null,

 userid int not null,

 timepoint datetime not null

 )

 GO

 create index ix_userid_name on tb_composite(userid,name)

 GO

 create index ix_userid on tb_composite(userid)

 GO

 INSERT INTO tb_composite(name,userid,timepoint)

 SELECT

       newid(),orderid%10000 ,CreatedDate

 FROM ORDERS

大数据表格

至此，测试表格建立完成，开始分析索引页面信息，统计表格tb_composite信息如下：

 --查看表格的数据大小跟非聚集索引大小

 WITH DATA AS (

 SELECT

       O.name tb_name,

       reservedpages = SUM (reserved_page_count),

       usedpages = SUM (used_page_count),

       pages = SUM (CASE WHEN (index_id < 2) THEN (in_row_data_page_count + lob_used_page_count + row_overflow_used_page_count) ELSE 0 END ),

       rowCounts = SUM (CASE WHEN (index_id < 2) THEN row_count ELSE 0 END )

 FROM sys.dm_db_partition_stats S

 JOIN sys.objects o on s.object_id=o.object_id

 WHERE O.type='U'

 GROUP BY O.name

 )

 SELECT

          tb_name,

          rowCounts,

          reservedpages*8/1024 reserved_Mb,

          pages*8/1024 data_Mb,

          index_Mb=(usedpages-pages)*8/1024,

          unused_Mb=case when usedpages>reservedpages then 0 else (reservedpages-usedpages)*8/1024 end

 FROM DATA

 WHERE tb_name = 'tb_composite'

 ORDER BY reserved_Mb DESC

 Go

--详细分析每一个索引的索引页面数量

create table tbind(PageFID int, PagePID int,IAMFID int,IAMPID int,ObjectID int,IndexID int,PartitionNumber int,PartitionID varchar(50),iam_chain_type varchar(50) ,PageType int,IndexLevel int,NextPageFID int,NextPagePID int,PrevPageFID int,PrevPagePID int )

INSERT INTO TBIND EXEC ('DBCC IND(''yaochufa'',''tb_composite'',-1) ')

SELECT

i.name,i.index_id,p.page_nums

FROM sys.indexes i join (SELECT IndexID,count(*) page_nums FROM tbind group by IndexID ) p on i.index_id=p.IndexID

WHERE object_id=object_id('tb_composite')

ORDER BY index_id

可以看到这个表格的非聚集索引总大小 ≈ 598Mb ≈ （43022+33279）*8k/1024 ≈ 596Mb 。

ix_userid_name 明显要比 ix_userid 存储的页面多，这是因为 ix_userid_name 比 ix_userid 多存储了 name 这个索引键值，索引页的增加，意味着使用这个索引就会相应增加 IO 。

比如一下两个SQL：

SET STATISTICS IO ON

--执行前，按下快捷键：Ctrl+M, 执行SQL后会显示实际执行的执行计划（注意，Ctrl+L，则为预估的执行计划）

SELECT * FROM tb_composite WITH(INDEX=ix_userid_name) WHERE userid =6500

SELECT * FROM tb_composite WITH(INDEX=ix_userid) WHERE userid =6500

查看其IO情况：

走复合索引会比单列索引要多出3个IO，userid 条件的扩大这个IO差别也会逐步加大。

查看执行计划如下：

可以看出，两者都是先根据索引进行 index seek 查找到相应的索引行，再根据索引行上的主键，去聚集索引中进行 key lookup查找行记录。两者的执行计划是一模一样的。这里加多一个SQL查询。

SELECT * FROM tb_composite WHERE name='6CDC4A13-36FF-4FA2-94D0-F1CBEA40852C'

name这一列，不存在单列索引，存在于复合索引 ix_userid_name(userid,timepoint,name) 中，那么这个查询能否根据这个索引进行查找呢？

答案是：NO NO NO ，数据库会根据其IO情况来做选择，有两种可能，一种是根据主键做全表scan，另外一种是对复合索引进行 index scan 全扫描，然后再根据键值去聚集索引上查找相应的行记录。

且看执行计划跟IO如下，可以看出，逻辑读基本上把所有数据页（聚集索引叶子节点）都扫描出来，一次IO是一个8kb的data page。

来吧，总结一下：

最左匹配原则：复合索引键值列假设为（a, b, c, d, e），则等同于索引这几个索引：（a）、（a, b）、（a, b, c）、（a, b, c, d）、（a, b, c, d, e）
1. 当where条件符合最左匹配原则，那么，执行计划则是 INDEX SEEK ，走索引查找；
2. 当where条件不符合最左匹配原则，则根据性能评估，走primary index scan 或者非聚集索引扫描再根据键值去 primary key lookup ；
根据最左匹配原则，可以在日常管理中，避免添加一些冗余冗余索引
但是也有一个注意事项：随着复合索引的列增加，索引页也会增加，使用其索引会增加一定量的IO，所以，再判断冗余索引的时候，需要考虑下这种情况，通常很少碰到这种情形。

3.2 复合索引与包含索引的查询区别

前面测试已经了解复合索引跟包含索引的存储结构，这里进行查询测试。这里注意索引页数量 = 索引节点页+索引叶子节点页。

先创建包含索引表格，造数据。

CREATE TABLE tb_include(

id int identity(1,1) not null primary key,

name varchar(50) not null,

userid int not null,

timepoint datetime not null

)

CREATE INDEX ix_userid on tb_include(userid) INCLUDE (timepoint,name)

INSERT INTO tb_include( name , userid , timepoint ) SELECT name,userid,timepoint FROM tb_composite

做两个查询如下：

SELECT USERID,name FROM tb_composite where USERID=71

SELECT USERID,name FROM tb_include where USERID=71

SELECT USERID,name FROM tb_composite where USERID=71 AND NAME='010CC1BD-1736-46A8-9497-7F4DBFD082B2'

SELECT USERID,name FROM tb_include where USERID=71 AND NAME='010CC1BD-1736-46A8-9497-7F4DBFD082B2'

总结：

如果where 条件包含include列
1. include列无法参与 index seek，因为其索引子节点不存在，只存在于索引叶子节点，所以include列一般都是展示列；
2. include列由于无法做 where 过滤的 index seed，同比复合索引，IO相对会较大
如果展示列仅限于索引键值及include列
1. 包含索引中，根据索引键值找到索引叶子节点后，无须根据主键值或者RID值回表去查询行记录，而是直接把索引叶子节点的 include 列的内容展示即可，减少回表的IO；
如果where条件仅含键值列，select 展示列仅含键值列级include列
1. 两者性能基本一致，包含索引相对少IO，但是区别不大。
所有非聚集索引的限制长度是900个字节，但是包含索引中的 include列是不计算在索引长度中的，所以如果要是遇到这种索引超过 900 bytes的特殊情况，可以考虑把相关字段放到include中来处理。

SQL SERVER大话存储结构（4）_复合索引与包含索引的更多相关文章

SQL SERVER大话存储结构（3）_数据行的行结构
一行数据是如何来存储的呢? 变长列与定长列,NULL与NOT NULL,实际是如何整理存放到 8k的数据页上呢? 对表格进行增减列,修改长度,添加默认值等DDL SQL ...
SQL SERVER大话存储结构（6）_数据库数据文件
数据库文件有两大类:数据文件跟日志文件,每一个数据库至少各有一个数据文件或者日志文件,数据文件用来存储数据,日志文件用来存储数据库的事务修改情况,可用于恢复数据库使用. 这里分 ...
SQL SERVER大话存储结构（5）_SQL SERVER 事务日志解析
本系列上一篇博文链接:SQL SERVER大话存储结构(4)_复合索引与包含索引 1 基本介绍每个数据库都具有事务日志,用于记录所有事物以及每个事物对数据库所作的操作. 日志的记录 ...
SQL SERVER大话存储结构（1）_数据页类型及页面指令分析
如果转载,请注明博文来源: www.cnblogs.com/xinysu/ ,版权归博客园苏家小萝卜所有.望各位支持! SQLServer的数据页大 ...
SQL SERVER大话存储结构（2）_非聚集索引如何查找到行记录
如果转载,请注明博文来源: www.cnblogs.com/xinysu/ ,版权归博客园苏家小萝卜所有.望各位支持! 1 行记录如何存储这里引入两个 ...
人人都是 DBA（VIII）SQL Server 页存储结构
当在 SQL Server 数据库中创建一张表时,会在多张系统基础表中插入所创建表的信息,用于管理该表.通过目录视图 sys.tables, sys.columns, sys.indexes 可以查看 ...
[转帖]真TM长的:SQL Server 2008存储结构——GAM和SGAM、PFS结构、IAM结构、DCM&BCM
谈到GAM和SGAM,我们不得不从数据库的页和区说起. https://blog.csdn.net/snowfoxmonitor/article/details/49991015 一个数据库由用户定义 ...
SQL Server 列存储索引强化
SQL Server 列存储索引强化 SQL Server 列存储索引强化 1. 概述 2.背景 2.1 索引存储 2.2 缓存和I/O 2.3 Batch处理方式 3 聚集索引 3.1 提高索引创建 ...
MySQL的redo log结构和SQL Server的log结构对比
MySQL的redo log结构和SQL Server的log结构对比 innodb 存储引擎 mysql技术内幕 log buffer根据一定规则将内存中的log block刷写到磁盘,这个规则是 ...

随机推荐

java nio（一）buffer
概述常见的网络io分为两种情况,BIO(block-io)和NIO(non-block-io),分别位于java.io和java.nio. BIO,是阻塞的io,采用一个线程处理一个连接的方式,就算 ...
Redis数据类型之列表List
Redis列表简介 Redis列表是简单的字符串列表,一个列表最多可以包含 232 - 1 个元素.列表按照插入顺序排序,可以从列表的头部或者尾部添加元素上图演示了使用LPUSH向列表中插入元素,并 ...
手把手视频：万能开源Hawk抓取动态网站
Hawk是沙漠之鹰历时五年开发的开源免费网页抓取工具(爬虫),无需编程,全部可视化. 自从上次发布Hawk 2.0过了小半年,可是还是有不少朋友通过邮件或者微信的方式询问如何使用.看文档还是不如视频教 ...
KVO 模式详解
KVO:观察者模式.当指定的被观察对象属性被修改时,允许对象接收到通知的机制. p.p1 { margin: 0.0px 0.0px 0.0px 0.0px; font: 18.0px Menlo; ...
NSString 为什么要使用copy，而不是retain
NSString 为什么要使用copy,而不是retain1.首先如果使用retain,只是引用计数+1,并没有生成新的对象,所以效率好2.但是使用copy安全.因为NSString 为 NSMuta ...
java抽象类和抽象方法之间的关系
抽象类和抽象方法之间的关系有抽象方法的类,一定是抽象类:抽象类不一定有抽象方法当子类继承抽象类时,必须要将抽象类中的抽象方法全部实现(或者称为重写),否则子类依然是抽象类因为子类是继承父类全部内容,所 ...
git远程库代码版本回滚方法
最近使用git时, 造成了远程库代码需要回滚到之前版本的情况,为了解决这个问题查看了很多资料. 问题产生原因: 提交了错误的版本到远程库. 以下是解决的方法, 供大家参考: 1.对本地代码库进行回滚 ...
（练习题）利用构造器函数实现三个小实例——不使用String()与Array()构造器和Math对象，不使用内建的方法的方法和属性。
1)在String()构造器不存在的情况下自定义一个myString()构造器函数.由于String()不存在,因此您在写构造器函数时不能使用任何属于内建String对象的方法和属性.并让你所创建的对 ...
MySQL 的Coalesce函数
今天用到了coalesce 函数,原因在于,我想要查找合同到期日的字段是否有值(因为合同到期日分3个字段,对应着不同的日期) select coalesce(contract_date1,contra ...
ZJOI2017 Round#2 滚粗记
在杭州的火车站的KFC餐厅里,独自一人,闲来无事,便写写这篇博客.刚刚的一个礼拜,经历了余姚的省选和杭州的数学集训,感觉有些浪,学校里现在还在上新课,我已经落下一个礼拜的文化课了,回去估计补死:最重要 ...

SQL SERVER大话存储结构（4）_复合索引与包含索引