《Pro SQL Server Internals》

作者: Dmitri Korotkevitch
出版社: Apress
出版年: 2016-12-29
页数: 804
定价: USD 59.99
装帧: Paperback
ISBN: 9781484219638

聚集索引

聚集索引指示表中数据的物理顺序，该表根据聚集索引键进行排序。该表只能定义一个聚集索引。

假设您想用数据创建堆表上的聚集索引。作为第一步，如图2-5所示，SQL Server创建数据的另一个副本，然后根据集群密钥的值对其进行排序。数据页链接在双链接列表中，其中每个页都包含指向链中的下一页和前一页的指针。此列表被称为索引的叶级，并且包含实际的表数据。

图2-5。聚集索引结构：叶级

■注释页上的排序顺序由时隙数组控制。页面上的实际数据未排序。

当叶级包含多个页面时，SQL Server开始构建

索引，如图2-6所示。

图2-6。聚集索引结构：中间和叶级

中间级存储每个叶级页的一行。它存储两段信息：物理地址和它所引用的页面中的索引键的最小值。唯一的例外是第一页的第一行，其中SQL Server存储NULL而不是最小索引键值。通过这种优化，当在表中插入具有最低键值的行时，SQL Server不需要更新非叶级行。

中间层次的页面也链接到双链表。SQL Server添加了越来越多的中间级别，直到有一个仅包含单个页面的级别。这个级别称为根级别，并且它成为索引的入口点，如图2-7所示。

图2-7。聚集索引结构：根级

如您所见，索引总是具有一个叶子级别、一个根级别和零个或多个中间级别。唯一的例外是当索引数据适合单个页面时。在这种情况下，SQL Server不创建单独的根级页面，而索引仅由单个叶级页面组成。

索引中的级别数量很大程度上取决于行和索引键的大小。例如，4字节整数列上的索引在中间级别和根级别上每行需要13个字节。这13个字节由一个2字节的时隙数组条目、一个4字节的索引键值、一个6字节的页指针和一个1字节的行开销组成，这足够了，因为索引键不包含可变长度和NULL列。

因此，每行可以容纳8060字节/ 13字节=每页620行。这意味着，使用一个中间级别，可以存储最多620*620=384400个叶级页面的信息。如果数据行大小是200字节，那么可以在索引中存储每页40行，最多15376000行，只有三个级别。向索引添加另一个中间级别将基本覆盖所有可能的整数值。

■注释在现实生活中，索引碎片会减少这些数字。我们将在第6章中讨论索引碎片。

SQL Server可以从索引中读取数据有三种不同的方式。第一个是通过有序扫描。让我们假设我们想从DBO运行选择名称。索引的叶级上的数据已经根据CuuleID列值排序。因此，SQL Server可以扫描索引从第一页到最后一页的叶子级别，并按照存储行的顺序返回行。

SQLServer从索引的根页开始，并从那里读取第一行。该行引用具有最小键值的中间页从表中引用。SQLServer读取该页并重复该过程，直到找到叶级上的第一页为止。然后，SQL Server开始逐行读取，遍历页面的链接列表，直到所有行都被读取。图2-8说明了这一过程。

图2-8。有序索引扫描

 前面查询的执行计划显示有序索引的聚集索引扫描运算符。

属性设置为true，如图2-9所示。

图2-9。有序索引扫描执行计划

值得一提的是，触发有序扫描不需要order by子句。有序扫描只意味着SQLServer根据索引键的顺序读取数据。

SQLServer可以双向索引，向前和向后导航。但是，您必须记住一个重要方面：SQL Server在反向索引扫描期间不使用并行性。

■提示可以通过检查执行计划中的INDEX SCAN或INDEX SEEK操作符属性来检查扫描方向。但是，请记住，Management Studio并不在执行计划的图形表示中显示这些属性。您需要在执行计划中选择操作符并选择View/Properties Window菜单项或通过按F4键打开Properties窗口以查看它。

企业版的SQL Server有一个称为旋转扫描的优化特性，允许多个任务共享相同的索引扫描。假设您有会话S1，它正在扫描索引。在扫描中间的某个时刻，另一个会话S2运行需要扫描相同索引的查询。通过旋转木马扫描，S2在其当前扫描位置连接S1。SQLServer只读取每个页面一次，将行传递给两个会话。

当S1扫描到达索引的结束时，S2从索引的开始开始扫描数据，直到S2扫描开始的点。旋转木马扫描是另一个示例，它说明了为什么您不能依赖于索引键的顺序，以及为什么在需要时应该始终指定ORDER BY子句。

有序扫描后的下一个访问方法称为分配顺序扫描。SQL Server通过IAM页面访问表数据，类似于使用堆表的方式。来自DBO的选择名称。使用（NoLoCK）查询和图2-10的客户说明了该方法。图2-11显示了查询执行计划。

图2-10。分配顺序扫描

图2-11。分配顺序扫描执行计划

不幸的是，当SQLServer使用一个分配顺序扫描时，不容易检测到。尽管执行计划中的Ordered属性显示为false，但它表明SQL Server并不关心行是否按索引键的顺序读取，而不关心使用分配顺序扫描。

分配顺序扫描可以更快地扫描大表，尽管它的启动成本较高。当表小时，SQLServer不使用此访问方法。另一个重要的考虑因素是数据一致性。SQL Server在具有集群索引的表中不使用转发指针，并且分配顺序扫描可能产生不一致的结果。由于页拆分引起的数据移动，可以多次跳过或读取行。因此，SQL Server通常避免使用分配顺序扫描，除非它读取READ UNCOMMITTED或SERIALIZABLE事务隔离级别的数据。

■注释我们将在第6章“索引分段”中讨论分页和分段，在第三部分“锁定、阻塞和并发”中讨论锁定和数据一致性。

最后一个索引访问方法称为索引查找。从dbo.Customers WHERE CustomerId BETWEEN 4和7查询的SELECT Name以及图2-12说明了该操作。

图2-12。索引查找

为了从表中读取行的范围，SQL Server需要从范围中找到具有最小键值的行，即4。SQL Server从根页面开始，其中第二行引用具有最小键值350的页面。它大于我们正在寻找的键值（4），并且SQL Server读取由根页面上的第一行引用的中间级数据页（1:170）。

类似地，中间页面将SQL Server引导到第一叶级页面（1:176）。SQL Server读取该页，然后读取CustomerIds等于4和5的行，最后，从第二页读取剩余的两行。

执行计划如图2-13所示。

图2-13。索引查找执行计划

可以猜到，索引查找比索引扫描更有效，因为SQL Server只处理行和数据页的子集，而不扫描整个表。

从技术上讲，有两种索引查找操作。第一个称为单例查找，有时称为点查找，其中SQL Server查找并返回单行。您可以想到Cuffer-Id= 2谓词在哪里。另一种类型的索引查找操作称为范围扫描，它要求SQL Server查找键的最低值或最高值，并扫描（向前或向后）行集合，直到到达扫描范围的末尾。客户机ID介于4和7之间的谓词导致范围扫描。两种情况都显示为执行计划中的索引查找操作。

正如您所猜到的，范围扫描完全可能迫使SQL Server处理索引中的大量数据页甚至所有数据页。例如，如果将查询更改为使用WHERE CustomerId>0谓词，SQL Server将读取所有行/页面，尽管在执行计划中将显示Index Seek操作符。您必须牢记这种行为，并在查询性能优化期间始终分析范围扫描的效率。

在关系数据库中有一个称为SARGable谓词的概念，它代表Search Argument able。如果存在索引，SQL Server可以使用索引查找操作，则谓词是SARGable。简言之，当SQL Server可以隔离要处理的索引键值的单个值或范围时，谓词就是SARGable，从而限制了谓词评估期间的搜索。显然，使用SARGable谓词编写查询并尽可能利用索引查找是有益的。

SARGable谓词包括下列操作符：=、>、>=、<=、IN、BETWEEN和LIKE（在前缀匹配的情况下）。非SARGable操作符包括NOT、<>、LIKE（在非前缀匹配的情况下）和NOT IN。

使谓词不可SARGable的另一种情况是对表列使用函数或数学计算。SQLServer必须调用函数或为它所处理的每一行执行计算。幸运的是，在某些情况下，您可以重构查询以使这些谓词SARGable。表2-1显示了一些例子。

你必须记住的另一个重要因素是类型转换。在某些情况下，可以使用不正确的数据类型使谓词不可SARGable。让我们创建一个包含varchar列的表，并用一些数据填充它，如清单2-6所示。

清单2-6。SARG谓词和数据类型：测试表创建

create table dbo.Data

(

    VarcharKey varchar() not null,

    Placeholder char()

);

create unique clustered index IDX_Data_VarcharKey

on dbo.Data(VarcharKey);

;with N1(C) as (select  union all select ) --  rows

,N2(C) as (select  from N1 as T1 cross join N1 as T2) --  行

,N3(C) as (select  from N2 as T1 cross join N2 as T2) -- 16行

,N4(C) as (select  from N3 as T1 cross join N3 as T2) --  行

,N5(C) as (select  from N4 as T1 cross join N4 as T2) -- ,536行

,IDs(ID) as (select row_number() over (order by (select null)) from N5)

insert into dbo.Data(VarcharKey)

    select convert(varchar(),ID) from IDs;

清单2-7。SARG谓词和数据类型：用整数参数选择

declare

 @IntParam int = ''

select * from dbo.Data where VarcharKey = @IntParam;

如图2-14所示，在整数参数的情况下，SQL Server扫描集群索引，将每行的varchar转换为整数。在第二种情况下，SQL Server在开始时将整数参数转换为varchar，并利用更有效的集群索引查找操作。

图2-14。SARG谓词和数据类型：整数参数的执行方案

注释注意连接谓词中的列数据类型。隐式或显式数据类型转换可以显著降低查询的性能。

在Unicode字符串参数的情况下，您将观察到非常类似的行为。让我们运行清单2-8所示的查询。图2-15显示了语句的执行计划。

清单2-8。SARG谓词和数据类型：用字符串参数选择

select * from dbo.Data where VarcharKey = '';

select * from dbo.Data where VarcharKey = N''; -- unicode 参数

图2-15。SARG谓词和数据类型：具有字符串参数的执行计划

正如您所看到的，Unicode字符串参数对于VARCHAR列是非SGARABLE。这是一个比看上去更大的问题。虽然很少以这种方式编写查询，如清单2-8所示，但是现在大多数应用程序开发环境将字符串视为unicode。因此，SQL Server客户端库为字符串对象生成unicode(nvarchar)参数，除非参数数据类型被显式指定为varchar。这使得谓词不可SARGable，并且即使对varchar列进行索引，也会由于不必要的扫描而导致严重的性能损失。

■重点始终在客户端应用程序中指定参数数据类。例如，在ADO.NET中，使用Parameters.Add("@ParamName",SqlDbType.Varchar, <Size>).Value = stringVariable instead of

Parameters.Add("@ParamName").Value = stringVariable overload. 在ORM框架中使用映射来显式地指定类中的非unicode属性。

还值得一提的是，VARCHAR参数对于NVARCHAR Unicode数据列是可处理的。

《Pro SQL Server Internals, 2nd edition》的CHAPTER 2 Tables and Indexes中的Clustered Indexes一节（翻译）的更多相关文章

第十五周翻译-《Pro SQL Server Internals, 2nd edition》
<Pro SQL Server Internals, 2nd edition> 作者:Dmitri Korotkevitch 翻译:赖慧芳译文: 55-58页第三章统计 SQL Se ...
第十四周翻译-《Pro SQL Server Internals, 2nd edition》
<Pro SQL Server Internals, 2nd edition> 作者:Dmitri Korotkevitch 翻译:赖慧芳译文: 设计和优化索引定义一种应用于所有地方的 ...
第十三周翻译-《Pro SQL Server Internals, 2nd edition》
<Pro SQL Server Internals, 2nd edition> 作者:Dmitri Korotkevitch 翻译:赖慧芳译文: 聚集索引聚集索引指示表中数据的物理顺序 ...
第十二周翻译-《Pro SQL Server Internals, 2nd edition》
<Pro SQL Server Internals, 2nd edition> 作者:Dmitri Korotkevitch 翻译:赖慧芳译文: 专业SQL服务器内部了解在引擎盖下发生 ...
《Pro SQL Server Internals, 2nd edition》的CHAPTER 3 Statistics中的Introduction to SQL Server Statistics、Statistics and Execution Plans、Statistics Maintenance(译）
<Pro SQL Server Internals> 作者: Dmitri Korotkevitch 出版社: Apress出版年: 2016-12-29页数: 804定价: USD 59 ...
《Pro SQL Server Internals, 2nd edition》中CHAPTER 7 Designing and Tuning the Indexes中的Clustered Index Design Considerations一节（译）
<Pro SQL Server Internals> 作者: Dmitri Korotkevitch 出版社: Apress出版年: 2016-12-29页数: 804定价: USD 59 ...
《Pro SQL Server Internals, 2nd edition》
设计和优化索引定义一种应用于所有地方的索引策略是不可能的.每个系统都是独特的,需要基于工作,业务需求和其他一些因素的自己的索引方法.然而,有几个设计的注意事项和指导方针可以被应用到每个系统. 在我们 ...
《Pro SQL Server Internals, 2nd edition》的CHAPTER 1 Data Storage Internals中的Data Pages and Data Rows(翻译)
数据页和数据行数据库中的空间被划分为逻辑8KB的页面.这些页面是以0开始的连续编号,并且可以通过指定文件ID和页号来引用它们.页面编号都是连续的,这样当SQL Server增长数据库文件时,从文件中 ...
《Pro SQL Server Internals, 2nd edition》15w
第三章统计 SQL Server查询优化器在为查询选择执行计划时使用基于成本的模型.它估计不同执行计划的成本,并选择成本最低的一个.但是,请记住,SQL Server并不搜索可用于查询的最佳执行计划 ...

随机推荐

TiDB数据库 mydumper与loader导入数据
从mysql导出数据最好的方法是使用tidb官方的工具mydumper. 导入tidb最好的方法是使用loader工具,大概19.4G每小时的速度. 详细的步骤可以参考官网:https://pingc ...
【转】头部属性 Meta http-equiv 大全
http-equiv类似于HTTP的头部协议,它回应给浏览器一些有用的信息,以帮助正确和精确地显示网页内容.常用的http-equiv类型有: 1.Content-Type和Content-Langu ...
google浏览器window.onbeforeunload方法兼容问题
window.onbeforeunload方法在IE内核浏览器是有效的,但是在google浏览器中并不兼容,请教给位怎么在google浏览器中兼容window.onbeforeunload方法采纳的 ...
maven项目中，lib目录下有自己私有的包，则需要配置一下代码，然后进行打包
<plugin> <groupId>org.apache.maven.plugins</groupId> <artifactId>maven-compi ...
PReLU与ReLU
PReLU激活函数,方法来自于何凯明paper <Delving Deep into Rectifiers:Surpassing Human-Level Performance on Image ...
html5获取地理位置信息API
html5获取地理位置信息API 在HTML5中,可以看下如何使用Geolocation API来获得用户的地理位置信息,如果该浏览器支持的话,且设备具有定位功能,就能够直接使用这组API来获取当前位 ...
装饰器 python 你也可以叫语法糖
1.最简单的装饰器不带入参 def func(): pass def decorate(func) def wrapper(): return func() return wrapper 使用 @ ...
QT 用listveiw显示图片
很多的时候需要浏览图片,一般会使用listview 显示图片,接下来我用listview显示图片代码如下: QStandardItem * s1; QStandardItem * s2; QStan ...
GitHub上最火的74个Android开源项目（三）
此前,推出的GitHub平台上“最受欢迎的开源项目”系列文章引发了许多读者的热议,在“GitHub上最火的40个Android开源项目(一).(二)中,我们也相继盘点了40个GitHub上最受欢迎的A ...
（转）Centos7 修改硬件时间和系统时间
查看硬件时间 [root@localhost ~]# hwclock --show Tue 13 Jun 2017 02:11:12 AM CST -0.848845 seconds 1 2 可以看出 ...

《Pro SQL Server Internals, 2nd edition》的CHAPTER 2 Tables and Indexes中的Clustered Indexes一节（翻译）

《Pro SQL Server Internals》

《Pro SQL Server Internals, 2nd edition》的CHAPTER 2 Tables and Indexes中的Clustered Indexes一节（翻译）的更多相关文章

随机推荐

热门专题