索引这块从存储结构来分，有2大类，聚集索引和非聚集索引，而非聚集索引在堆表或者在聚集索引表都会对其键值有所影响，这块可以详细查看本系列第二篇文章：SQL SERVER大话存储结构_(2)_非聚集索引如何查找到行记录。

非聚集索引内又分为多类：单列索引、复合索引、包含索引、过滤索引等。之前文章有具体分析过非聚集索引的存储情况，但是没有对复合索引及包含索引做过多说明，本文来讲讲这两个索引。

如果转载，请注明博文来源： www.cnblogs.com/xinysu/ ，版权归博客园苏家小萝卜所有。望各位支持！

1 语法及说明

--复合索引

CREATE INDEX IndexName ON tbname(columna,columnb [,columnc...] )

--包含索引

CREATE INDEX IndexName ON tbname(columna [,columnb,columnc...] ) INCLUDE (column1 [,column2,column3...])

复合索引，顾名思义，及多个列组成的索引，列的顺序非常重要，关系到查询性能，这点后面会说明。

包含索引，建索引SQL 中含有 include 字段，索引键值用于WHERE条件过滤，INCLUDE字段用于 SELECT 展示，这点后面也会说明。

无论是符合索引还是包含索引，都有索引键值长度不能超过900字节的限制，但是要注意一点，包含索引的include字段是不包括在里边的。

2 索引页存储情况

从索引页的存储情况来分析，分析过程中，重点在查看复合索引跟包含包含索引在子节点及叶子结点的键值情况。

2.1 创建测试表格

创建表格 tbindex，建立两个测试索引，同时造数据。

 CREATE TABLE tbindex(

 id int identity(1,1) not null primary key ,

 name varchar(50) not null,

 type varchar(10) not null,

 numbers int not null

 )

 GO

 CREATE INDEX ix_number_name ON tbindex(numbers,name)

 GO

 CREATE INDEX ix_name ON tbindex(numbers) INCLUDE (name)

 GO

 DECLARE @ID INT

 SET @ID=1

 WHILE @ID<=5

 BEGIN

      INSERT INTO tbindex(name,type,numbers)

      SELECT

            name,

          type,

          object_id+@id

      FROM sys.objects

         SET @ID=@ID+1

 END

2.2 分析索引行

--查看该表格索引的id情况

SELECT * FROM sys.indexes WHERE object_id=object_id('tbindex')

--PK__tbindex__3213E83F89582AC3    1

--ix_number_name    2

--ix_number    3

DBCC traceon(3604)

DBCC ind('dbpage','tbindex',-1)

DBCC PAGE('dbpage',1,395,3)

DBCC PAGE('dbpage',1,396,3)

DBCC PAGE('dbpage',1,397,3)

DBCC PAGE('dbpage',1,398,3)

分析查看，得知：

复合索引 IX_number_name的索引节点为pageid=395，再挑选一个叶子结点来分析 pageid=396；
包含索引 IX_number 的索引节点为 pageid=397，再挑选一个叶子节点来分析 pageid=398。

--复合索引，395为索引页节点，396为索引页叶子节点

DBCC PAGE('dbpage',1,395,3)

DBCC PAGE('dbpage',1,396,3)

--包含索引，397为索引页节点，398为索引页叶子节点

DBCC PAGE('dbpage',1,397,3)

DBCC PAGE('dbpage',1,398,3)

从这里可以看出，复合索引跟包含索引的所有索引列都会存储在索引叶子节点跟子节点，但是包含索引的INCLUDE列，不在索引页的子节点存储，仅存储在索引页的叶子节点上。

从这里不难理解，为什么之前说 include列用于 select 列，而不用于 where 列过滤。因为非聚集索引当索引页面有多层的时候，是先查询索引的子节点，再查询索引的叶子节点，而包含索引的INCLUDE列不在叶子节点中存储，无法根据其来进行过滤。

3 对查询的影响

3.1 复合索引查询注意事项

由于需要数据量作为实验支持，所以不用之前分析索引行结构的表格tbindex，换个高大上 tb_composite 如下。

 create table tb_composite(

 id int identity(1,1) not null primary key,

 name varchar(50) not null,

 userid int not null,

 timepoint datetime not null

 )

 GO

 create index ix_userid_name on tb_composite(userid,name)

 GO

 create index ix_userid on tb_composite(userid)

 GO

 INSERT INTO tb_composite(name,userid,timepoint)

 SELECT

       newid(),orderid%10000 ,CreatedDate

 FROM ORDERS

大数据表格

至此，测试表格建立完成，开始分析索引页面信息，统计表格tb_composite信息如下：

 --查看表格的数据大小跟非聚集索引大小

 WITH DATA AS (

 SELECT

       O.name tb_name,

       reservedpages = SUM (reserved_page_count),

       usedpages = SUM (used_page_count),

       pages = SUM (CASE WHEN (index_id < 2) THEN (in_row_data_page_count + lob_used_page_count + row_overflow_used_page_count) ELSE 0 END ),

       rowCounts = SUM (CASE WHEN (index_id < 2) THEN row_count ELSE 0 END )

 FROM sys.dm_db_partition_stats S

 JOIN sys.objects o on s.object_id=o.object_id

 WHERE O.type='U'

 GROUP BY O.name

 )

 SELECT

          tb_name,

          rowCounts,

          reservedpages*8/1024 reserved_Mb,

          pages*8/1024 data_Mb,

          index_Mb=(usedpages-pages)*8/1024,

          unused_Mb=case when usedpages>reservedpages then 0 else (reservedpages-usedpages)*8/1024 end

 FROM DATA

 WHERE tb_name = 'tb_composite'

 ORDER BY reserved_Mb DESC

 Go

--详细分析每一个索引的索引页面数量

create table tbind(PageFID int, PagePID int,IAMFID int,IAMPID int,ObjectID int,IndexID int,PartitionNumber int,PartitionID varchar(50),iam_chain_type varchar(50) ,PageType int,IndexLevel int,NextPageFID int,NextPagePID int,PrevPageFID int,PrevPagePID int )

INSERT INTO TBIND EXEC ('DBCC IND(''yaochufa'',''tb_composite'',-1) ')

SELECT

i.name,i.index_id,p.page_nums

FROM sys.indexes i join (SELECT IndexID,count(*) page_nums FROM tbind group by IndexID ) p on i.index_id=p.IndexID

WHERE object_id=object_id('tb_composite')

ORDER BY index_id

可以看到这个表格的非聚集索引总大小 ≈ 598Mb ≈ （43022+33279）*8k/1024 ≈ 596Mb 。

ix_userid_name 明显要比 ix_userid 存储的页面多，这是因为 ix_userid_name 比 ix_userid 多存储了 name 这个索引键值，索引页的增加，意味着使用这个索引就会相应增加 IO 。

比如一下两个SQL：

SET STATISTICS IO ON

--执行前，按下快捷键：Ctrl+M, 执行SQL后会显示实际执行的执行计划（注意，Ctrl+L，则为预估的执行计划）

SELECT * FROM tb_composite WITH(INDEX=ix_userid_name) WHERE userid =6500

SELECT * FROM tb_composite WITH(INDEX=ix_userid) WHERE userid =6500

查看其IO情况：

走复合索引会比单列索引要多出3个IO，userid 条件的扩大这个IO差别也会逐步加大。

查看执行计划如下：

可以看出，两者都是先根据索引进行 index seek 查找到相应的索引行，再根据索引行上的主键，去聚集索引中进行 key lookup查找行记录。两者的执行计划是一模一样的。这里加多一个SQL查询。

SELECT * FROM tb_composite WHERE name='6CDC4A13-36FF-4FA2-94D0-F1CBEA40852C'

name这一列，不存在单列索引，存在于复合索引 ix_userid_name(userid,timepoint,name) 中，那么这个查询能否根据这个索引进行查找呢？

答案是：NO NO NO ，数据库会根据其IO情况来做选择，有两种可能，一种是根据主键做全表scan，另外一种是对复合索引进行 index scan 全扫描，然后再根据键值去聚集索引上查找相应的行记录。

且看执行计划跟IO如下，可以看出，逻辑读基本上把所有数据页（聚集索引叶子节点）都扫描出来，一次IO是一个8kb的data page。

来吧，总结一下：

最左匹配原则：复合索引键值列假设为（a, b, c, d, e），则等同于索引这几个索引：（a）、（a, b）、（a, b, c）、（a, b, c, d）、（a, b, c, d, e）
1. 当where条件符合最左匹配原则，那么，执行计划则是 INDEX SEEK ，走索引查找；
2. 当where条件不符合最左匹配原则，则根据性能评估，走primary index scan 或者非聚集索引扫描再根据键值去 primary key lookup ；
根据最左匹配原则，可以在日常管理中，避免添加一些冗余冗余索引
但是也有一个注意事项：随着复合索引的列增加，索引页也会增加，使用其索引会增加一定量的IO，所以，再判断冗余索引的时候，需要考虑下这种情况，通常很少碰到这种情形。

3.2 复合索引与包含索引的查询区别

前面测试已经了解复合索引跟包含索引的存储结构，这里进行查询测试。这里注意索引页数量 = 索引节点页+索引叶子节点页。

先创建包含索引表格，造数据。

CREATE TABLE tb_include(

id int identity(1,1) not null primary key,

name varchar(50) not null,

userid int not null,

timepoint datetime not null

)

CREATE INDEX ix_userid on tb_include(userid) INCLUDE (timepoint,name)

INSERT INTO tb_include( name , userid , timepoint ) SELECT name,userid,timepoint FROM tb_composite

做两个查询如下：

SELECT USERID,name FROM tb_composite where USERID=71

SELECT USERID,name FROM tb_include where USERID=71

SELECT USERID,name FROM tb_composite where USERID=71 AND NAME='010CC1BD-1736-46A8-9497-7F4DBFD082B2'

SELECT USERID,name FROM tb_include where USERID=71 AND NAME='010CC1BD-1736-46A8-9497-7F4DBFD082B2'

总结：

如果where 条件包含include列
1. include列无法参与 index seek，因为其索引子节点不存在，只存在于索引叶子节点，所以include列一般都是展示列；
2. include列由于无法做 where 过滤的 index seed，同比复合索引，IO相对会较大
如果展示列仅限于索引键值及include列
1. 包含索引中，根据索引键值找到索引叶子节点后，无须根据主键值或者RID值回表去查询行记录，而是直接把索引叶子节点的 include 列的内容展示即可，减少回表的IO；
如果where条件仅含键值列，select 展示列仅含键值列级include列
1. 两者性能基本一致，包含索引相对少IO，但是区别不大。
所有非聚集索引的限制长度是900个字节，但是包含索引中的 include列是不计算在索引长度中的，所以如果要是遇到这种索引超过 900 bytes的特殊情况，可以考虑把相关字段放到include中来处理。

SQL SERVER大话存储结构（4）_复合索引与包含索引的更多相关文章

SQL SERVER大话存储结构（3）_数据行的行结构
一行数据是如何来存储的呢? 变长列与定长列,NULL与NOT NULL,实际是如何整理存放到 8k的数据页上呢? 对表格进行增减列,修改长度,添加默认值等DDL SQL ...
SQL SERVER大话存储结构（6）_数据库数据文件
数据库文件有两大类:数据文件跟日志文件,每一个数据库至少各有一个数据文件或者日志文件,数据文件用来存储数据,日志文件用来存储数据库的事务修改情况,可用于恢复数据库使用. 这里分 ...
SQL SERVER大话存储结构（5）_SQL SERVER 事务日志解析
本系列上一篇博文链接:SQL SERVER大话存储结构(4)_复合索引与包含索引 1 基本介绍每个数据库都具有事务日志,用于记录所有事物以及每个事物对数据库所作的操作. 日志的记录 ...
SQL SERVER大话存储结构（1）_数据页类型及页面指令分析
如果转载,请注明博文来源: www.cnblogs.com/xinysu/ ,版权归博客园苏家小萝卜所有.望各位支持! SQLServer的数据页大 ...
SQL SERVER大话存储结构（2）_非聚集索引如何查找到行记录
如果转载,请注明博文来源: www.cnblogs.com/xinysu/ ,版权归博客园苏家小萝卜所有.望各位支持! 1 行记录如何存储这里引入两个 ...
人人都是 DBA（VIII）SQL Server 页存储结构
当在 SQL Server 数据库中创建一张表时,会在多张系统基础表中插入所创建表的信息,用于管理该表.通过目录视图 sys.tables, sys.columns, sys.indexes 可以查看 ...
[转帖]真TM长的:SQL Server 2008存储结构——GAM和SGAM、PFS结构、IAM结构、DCM&BCM
谈到GAM和SGAM,我们不得不从数据库的页和区说起. https://blog.csdn.net/snowfoxmonitor/article/details/49991015 一个数据库由用户定义 ...
SQL Server 列存储索引强化
SQL Server 列存储索引强化 SQL Server 列存储索引强化 1. 概述 2.背景 2.1 索引存储 2.2 缓存和I/O 2.3 Batch处理方式 3 聚集索引 3.1 提高索引创建 ...
MySQL的redo log结构和SQL Server的log结构对比
MySQL的redo log结构和SQL Server的log结构对比 innodb 存储引擎 mysql技术内幕 log buffer根据一定规则将内存中的log block刷写到磁盘,这个规则是 ...

随机推荐

Memetic Algorithm(文化基因算法)
1. 文化进化理论威尔逊认为,从性质上来讲,文化进化总是以拉马克主义为特征的,即文化进化依赖于获得性状的传递,相对来说速度比较快:而基因进化是达尔文主义式的,依赖于经过几个世代的基因频率的改变,因而 ...
Bug 笔记
1.页面返回 400 Bag request: 原因:使用Spring MVC controller的时候,查询数据库:当数据库的数据类型是int型时,Spring MVC在查询的数据匹配给实体类 ...
2 安装redis.md
cnblogs-DOC 1.服务器环境 2.安装Redis3.安装Zookeeper4.安装MPush5.安装Alloc服务6.完整测试7.常见问题一.Linux系统安装Redis 官网下载Redi ...
简单的利用JS来判断页面是在手机端还是在PC端打开的方法
在移动设备应用越来越广泛的今天,许多网站都开始做移动端的界面展示,两者屏幕尺寸差异很大,所以展示的内容也有所差别.于是就遇到一个问题,如何判断你的页面是在移动端还是在PC端打开的,很简单的问题,那我们 ...
jasmine 初探(一)
前言 <敏捷软件开发>这本书由享誉全球的软件开发专家和软件大师Robert C.Martin所著中提到两个开发方式: TDD(Test Driven Development)测试驱动开发 ...
Android -- 带你从源码角度领悟Dagger2入门到放弃（二）
1,接着我们上一篇继续介绍,在上一篇我们介绍了简单的@Inject和@Component的结合使用,现在我们继续以老师和学生的例子,我们知道学生上课的时候都会有书籍来辅助听课,先来看看我们之前的Stu ...
jdk动态代理与cglib代理、spring aop代理实现原理解析
原创声明:本博客来源为本人原创作品,绝非他处摘取,转摘请联系博主代理(proxy)的定义:为某对象提供代理服务,拥有操作代理对象的功能,在某些情况下,当客户不想或者不能直接引用另一个对象,而代理对象 ...
VirtualBox实现内外网络互访问的配置
作者 jrl137824675 来源地址:http://www.2cto.com/os/201205/133370.html 环境: 宿主机操作系统 Windows XP s ...
jquery 模态窗口蒙层无法覆盖flash解决办法
在应用swf的<object></object>标签中加入如下属性: <param name="wmode" value="transpar ...
mysql分页查询优化
由于MySql的分页机制:并不是跳过 offset 行,而是取 offset + N 行,然后返回放弃前 offset 行,返回N 行, 所以当 offset 特别大的时候,效率就非常的低下,要么控制 ...

SQL SERVER大话存储结构（4）_复合索引与包含索引