在SQL Server里，有2种表是以存储为基础的。有聚集索引的表叫聚集表，没有聚集索引的表叫堆表。在上一篇文章，我们讨论了堆表的特性和存储结构。在这篇文章里，我们来看下聚集表。

有聚集索引的表叫聚集表。聚集索引保存了使用B树结构的聚集键，并只能以此顺序存储实际的数据。这也是SQL Server限制一个表只能有一个聚集索引，因为物理存储顺序只能有一个。我们来看看B树结构的逻辑呈现。下图是基于AdventureWorks2008R2数据库，表SalesOrderDetail创建的。

 USE IndexDB

 GO

 SELECT * INTO dbo.SalesOrderDetail FROM AdventureWorks2008R2.Sales.SalesOrderDetail

 GO

 CREATE UNIQUE CLUSTERED INDEX ix_SalesOrderDetail ON dbo.SalesOrderDetail(SalesOrderDetailID)

创建一个帮助表，并通过DBCC IND将表信息导入方便进一步分析。

 -- Create a helper table

 CREATE TABLE sp_table_pages

 (

   PageFID TINYINT,

   PagePID INT,

   IAMFID TINYINT,

   IAMPID INT,

   ObjectID INT,

   IndexID TINYINT,

   PartitionNumber TINYINT,

   PartitionID BIGINT,

   iam_chain_type VARCHAR(30),

   PageType TINYINT,

   IndexLevel TINYINT,

   NextPageFID TINYINT,

   NextPagePID INT,

   PrevPageFID INT,

   PrevPagePID int,

   PRIMARY KEY (PageFID, PagePID)

 )

 GO

 -- Write everything in a table for further analysis

 INSERT INTO sp_table_pages EXEC('DBCC IND(IndexDB,SalesOrderDetail,-1)')

 GO

提取跟节点/索引页，中间级/索引页，叶子节点/数据页信息。

 SELECT * FROM dbo.sp_table_pages WHERE IndexLevel=2 --根节点/索引页

 DBCC TRACEON(3604)

 DBCC PAGE(IndexDB,1,90,3)

 SELECT * FROM dbo.sp_table_pages WHERE IndexLevel=1 --中间级/索引页

 DBCC TRACEON(3604)

 DBCC PAGE(IndexDB,1,1864,3)

 DBCC TRACEON(3604)

 DBCC PAGE(IndexDB,1,1832,3)

 DBCC TRACEON(3604)

 DBCC PAGE(IndexDB,1,1808,3)

 DBCC TRACEON(3604)

 DBCC PAGE(IndexDB,1,1896,3)

 SELECT * FROM dbo.sp_table_pages WHERE IndexLevel=0 --叶子节点/数据页

 DBCC TRACEON(3604)

 DBCC PAGE(IndexDB,1,1704,3)

 DBCC TRACEON(3604)

 DBCC PAGE(IndexDB,1,1720,3)

 DBCC TRACEON(3604)

 DBCC PAGE(IndexDB,1,1752,3)

 DBCC TRACEON(3604)

 DBCC PAGE(IndexDB,1,1784,3)

根据上述信息进行聚集索引结构示例图绘制。

这张表有121317条记录。SQL Server需要3层来存储这个数据。我们根据上图来分析下页。在最高层，你可以看到只有一个页，这个叫做根页（root page）。在所有的B树结构里，都只有一个根页作为树结构的访问入口点。根层始终是最高层。在我们实例里根页有第2层索引。在根层（root level）和中间级别（intermediate level）的页叫索引页。在索引页里，SQL Server保存着聚集键（clustering key）和B树下层的入口点（页面指针）。聚集键保存的子页id，最小值保存在下层页（子页）。在指定子页上的聚集键最大值可以通过下一记录找到。例如，在根层第一条记录（Salesorderdetailid =NULL,pageid=1864），Salesorderdetailid小于等于30226可以在1864号页找到。入口（Salesorderdetailid =30226,pageid=1832)）表示，salesorderdetailid值在30226与60003之间的记录可以在1832号页找到，以此类推。在那层，上一页和下一页的值将做双向链接来连接这些页。在根层因为只有一个页，所以上一页和下一页的值为0。

我们移到下一层来看，在这层有4个页。你可以在下一页和上一页里找到值，也是用来链接那层的页。这层被称为中间层（intermediate level）。中间层的个数和中间层的页数取决于表的大小和聚集键。一个大表可以有多个中间层，小表可能就没有中间层。这层的值可以和根层一样的方式读取。例如，这层的第1页的第一个入口（Salesorderdetailid =NULL,pageid=1704）表示，salesorderdetailid值小于等于72的可以在1704号页找到。

下一层是底层，称为叶子层（leaf level，index level 0）。在这层的页被称为叶子页（leaf pages）或数据页（data pages）。在这些页里，你可以找到Salesorderdetail表记录的全部数据（所有列）。换句话说，聚集索引的叶子层是实际数据存放的地方。

我们复制一张没有聚集索引的Salesorderdetail表。

 SELECT * INTO dbo.SalesOrderDetailHeap FROM AdventureWorks2008R2.Sales.SalesOrderDetail

 GO

我们来执行下列查询，2个查询都返回同样的结果，这里我们更关注的是IO部分。

 SET STATISTICS IO ON

 GO

 SELECT * FROM SalesOrderDetail WHERE SalesOrderDetailID =75

 GO

 SELECT * FROM SalesOrderDetailheap WHERE SalesOrderDetailID =75

IO统计信息如下显示。有聚集索引的表，相比另一个表，逻辑读对它来说可以忽略不计的。

我们来看看SQL如何使用聚集索引的3个逻辑读取来拿到记录的。首先我们需要找出聚集索引的根节点（root node），DBCC IND命令可以帮我们找到。

 DBCC IND('IndexDB','SalesOrderDetail',1)

返回1501条记录，包含IAM页，一个索引页，和1499个数据页，部分结果显示如下。

从输出结果，我们可以知道90页（page type 2）是根页，这个页是这个表的入口点（entry point）。我们用DBCC PAGE看下这个页。

 DBCC traceon(3604)

 GO

 DBCC page('IndexDB',1,90,3)

SQL Server在子页保存聚集键的最小值，它的页号索引页里。例如，1864号页会有表salesorderdetailid列值小于等于30226的所有记录。同样，1832号页会有表salesorderdetailid列值在30226与60003之间的所有记录（30226可能在这2个页都有）。我们查找这条记录的salesorderdetailid值小于30226，所以这条记录的所有信息可以在子页1864找到。

我们用DBCC PAGE看下这个1864页。

 DBCC traceon(3604)

 GO

 DBCC page('IndexDB',1,1864,3)

输出结果包含410条记录，下面是部分结果显示。你可以参数1（最后一个参数）来运行DBCC PAGE命令来看页头。那样我们可以找到m_type=2的索引页。用我们刚才描述的方法，我们知道要找的记录（salesorderdetailid=75）可以在子页1705里找到。

我们看下1704页的内容：

 DBCC traceon(3604)

 GO

 DBCC page('IndexDB',1,1705,3)  with tableresults

从页头部分，我们可以看到m_type是1，因此这个页是数据页，且是索引的叶子层。我们把如下输出结果一直往下翻。我们就有记录所有列的值，就是聚集索引叶子层，即实际的数据。

SQL Server从聚集索引只读取3页（根页，中间层的1页，还有叶子节点的1页，即数据页）就找到了我们的记录。

我们用DBCC IND命令比较下2个表的区别（SalesOrderDetail，SalesOrderDetailHeap）

 DBCC IND('IndexDB','SalesOrderDetail',1)

 DBCC IND('IndexDB','SalesOrderDetailHeap',1)

SalesOrderDetailHeap表是堆表，只有1496个页；SalesOrderDetail表是聚集表，包含一个聚集索引，却有1501个页。这个多出的5页用来存储B树结构的中间级（intermediate）和根级（root）的索引页。我们当他是聚集索引的优点吧，多用5个页，却将逻辑读减少的只有3次。这个存储开销还是很划算的。

参考文章：

http://www.sqlservercentral.com/blogs/practicalsqldba/2013/03/12/sql-server-index-part-3-explaining-the-clustered-table-structure/

索引深入浅出(3/10)：聚集索引的B树结构的更多相关文章

索引深入浅出(5/10)：非聚集索引的B树结构在堆表
在“索引深入浅出:非聚集索引的B树结构在聚集表”里,我们讨论了在聚集表上的非聚集索引,这篇文章我们讨论下在堆表上的非聚集索引. 非聚集索引可以在聚集表或堆表上创建.当我们在聚集表上创建非聚集索引时,聚 ...
索引深入浅出(4/10)：非聚集索引的B树结构在聚集表
一个表只能有一个聚集索引,数据行以此聚集索引的顺序进行存储,一个表却能有多个非聚集索引.我们已经讨论了聚集索引的结构,这篇我们会看下非聚集索引结构. 非聚集索引的逻辑呈现简单来说,非聚集索引是表的子 ...
SQL Server - 索引详细教程（聚集索引，非聚集索引）
转载自:https://www.cnblogs.com/hyd1213126/p/5828937.html 作者:爱不绝迹 (一)必读:深入浅出理解索引结构实际上,您可以把索引理解为一种特殊的目录. ...
SQL Server索引 (原理、存储)聚集索引、非聚集索引、堆 <第一篇>
一.存储结构在SQL Server中,有许多不同的可用排列规则选项. 二进制:按字符的数字表示形式排序(ASCII码中,用数字32表示空格,用68表示字母"D").因为所有内容都 ...
SQL Server索引 (原理、存储)聚集索引、非聚集索引、堆
http://www.cnblogs.com/kissdodog/archive/2013/06/12/3132380.html
SQL Server中的聚集索引(clustered index) 和非聚集索引 (non-clustered index)
本文转载自 http://blog.csdn.net/ak913/article/details/8026743 面试时经常问到的问题: 1. 什么是聚合索引(clustered index) / ...
SQLSERVER聚集索引与非聚集索引的再次研究（上）
SQLSERVER聚集索引与非聚集索引的再次研究(上) 上篇主要说聚集索引下篇的地址:SQLSERVER聚集索引与非聚集索引的再次研究(下) 由于本人还是SQLSERVER菜鸟一枚,加上一些实验的逻 ...
SQLSERVER聚集索引与非聚集索引的再次研究（下）
SQLSERVER聚集索引与非聚集索引的再次研究(下) 上篇主要说了聚集索引和简单介绍了一下非聚集索引,相信大家一定对聚集索引和非聚集索引开始有一点了解了. 这篇文章只是作为参考,里面的观点不一定正确 ...
SQL Server索引进阶：第三级，聚集索引
原文地址: Stairway to SQL Server Indexes: Level 3, Clustered Indexes 本文是SQL Server索引进阶系列(Stairway to SQL ...

随机推荐

解剖SQLSERVER 第十三篇 Integers在行压缩和页压缩里的存储格式揭秘（译）
解剖SQLSERVER 第十三篇 Integers在行压缩和页压缩里的存储格式揭秘(译) http://improve.dk/the-anatomy-of-row-amp-page-compre ...
google搜索技巧汇总
由于不能访问google,可访问ggso.in进行搜索. 简单整理记录一下常用的一些Google搜索技巧:或操作一般搜索时,如果输入多个词,默认是与的关系,如输入词1和词2,即搜索同时包含词1和词2的 ...
nginx（2、反向代理）
反向代理是nginx最重要的特性之一,与正向代理相反,它代理的不是客户端,而是目标源,即我代理目标源满足客户端给出的请求. 在nginx中反向代理的简单配置如下: server { listen 80 ...
Java多线程14：生产者/消费者模型
什么是生产者/消费者模型一种重要的模型,基于等待/通知机制.生产者/消费者模型描述的是有一块缓冲区作为仓库,生产者可将产品放入仓库,消费者可以从仓库中取出产品,生产者/消费者模型关注的是以下几个点: ...
ReactMix框架，让你实现一套js代码，基于ReactNative在H5，App都能完美跑起来，Write Once,Run Anywhere
ReactNative框架推出已经有一段时间了,相信很多小伙伴都在尝试实现Write Once, Run Anywhere的梦想,比如淘宝的ReactWeb等等,但是这些框架都局限于因为ReactNa ...
[Spring框架]Spring AOP基础入门总结二:Spring基于AspectJ的AOP的开发.
前言: 在上一篇中: [Spring框架]Spring AOP基础入门总结一. 中我们已经知道了一个Spring AOP程序是如何开发的, 在这里呢我们将基于AspectJ来进行AOP 的总结和学习 ...
基于Oracle的SQL优化（社区万众期待数据库优化扛鼎巨著）
基于Oracle的SQL优化(社区万众期待数据库优化扛鼎巨著) 崔华编 ISBN 978-7-121-21758-6 2014年1月出版定价:128.00元 856页 16开编辑推荐本土O ...
Java的声明和访问介绍
1.类的声明类本身的声明:对类的声明来说,主要包括类的访问权限声明和非访问修饰符的使用.对于一个普通的Java类(POJO)来说,主要的访问权限修饰符只有两个public和默认权限,内部类可以有pr ...
Jsp练习——连接数据库模拟登录
<%@ page language="java" contentType="text/html; charset=UTF-8" pageEncoding= ...
css3使用box-sizing布局
css3增添了盒模型box-sizing,属性值有下面三个: content-box:默认值,让元素维持W3C的标准盒模型.元素的宽度/高度(width/height)(所占空间)等于元素边框宽度(b ...

索引深入浅出(3/10)：聚集索引的B树结构

参考文章：

索引深入浅出(3/10)：聚集索引的B树结构的更多相关文章

随机推荐

热门专题