SQL Server索引进阶:第二级,深入非聚集索引
原文地址:
Stairway to SQL Server Indexes: Level 2, Deeper into Nonclustered Indexes
本文是SQL Server索引进阶系列(Stairway to SQL Server Indexes)的一部分。
在第一级中介绍了SQL Server中的非聚集索引。而且在第一个学习的例子中,我们证明了在从表中获取一行数据的情况下,索引带来的潜在的好处。在这一级中,我们继续介绍非聚集索引,看看他们在提升查询性能中做出的贡献。
我们先来介绍一些理论,了解一些索引的内部信息,帮助我们解释理论,然后执行一些查询。这些查询会在包含和不包含索引的两种情况被执行,开启性能报告,我们可以看到索引产生的影响。
我们继续使用AdventureWorks 数据库的部分表,主要集中在Contact表。我们将只是用一个索引,在上一级中使用的FullName索引,来证明我们的观点。为了确保我们很好的控制Contact表的索引,我们将做两份拷贝,一份建立FullName索引,一份不建立索引。
IF EXISTS (
SELECT *
FROM sys.tables
WHERE OBJECT_ID = OBJECT_ID('dbo.Contacts_index'))
DROP TABLE dbo.Contacts_index;
GO
IF EXISTS (
SELECT *
FROM sys.tables
WHERE OBJECT_ID = OBJECT_ID('dbo.Contacts_noindex'))
DROP TABLE dbo.Contacts_noindex;
GO
SELECT * INTO dbo.Contacts_index
FROM Person.Contact;
SELECT * INTO dbo.Contacts_noindex
FROM Person.Contact;
非聚集索引
在Contacts_index 表建立非聚集索引
CREATE INDEX FullName
ON Contacts_index
( LastName, FirstName );
请记住,非聚集索引顺序存储索引键,通过标记来访问表中真正的数据。你可以把标签看做一种指针。将来的级别中会描述标签的格式,标签的用法,标签的细节。
另外,SQL Server的非聚集索引的入口还有一些内部使用的头信息,还有一些可选的数据值。这些在后面的文章中都会有介绍,现在都不是重点内容。
到目前为止,我们只需要知道,键使得SQL Server找到合适的索引入口,入口的标签使得SQL Server访问表对应的行数据。
索引入口有序的好处
索引的入口是有序的,因此SQL Server可以快速的定位入口。扫描可以从头部开始,可以从尾部开始,也可以从中间开始。
因此,如果一个查询,请求所有LastName以S开头的Contact用户(where lastname like 's%')。SQL Server会快速定位到第一个S开头的记录,然后通过索引,使用标签访问数据行,直到第一个T开头的记录。
如果选择的列都包含在索引中,上面的查询会执行的更快。如果我们执行
SELECT FirstName, LastName
FROM Contact
WHERE LastName LIKE 'S%';
SQL Server快速的导航到S入口,然后通过索引,忽略标签,直接从索引的入口返回数据,直到第一个T入口。在关系数据库的名词中,叫做查询全覆盖索引。
很多SQL的操作都可以从索引中受益,包括:ORDER BY, GROUP BY, DISTINCT, UNION( not UNION ALL ), JOIN ... ON 。
谨记从左到右的键顺序的重要性。我们建立的索引对于lastname=“ashton”很管用,但是对于firstname=“ashton”作用会小很多,甚至没有用。
测试一些简单的查询
如果你要执行下面的查询,确保你执行了前面的脚本,创建了contact_index和contact_noindex表,而且也在contact_index表创建了LastName, FirstName索引。
开启统计
SET STATISTICS io ON SET STATISTICS time ON
因为contact表中的数据只有19972行,很难得到有意义的统计时间。大部分的查询都显示CPU time: 0 毫秒,因此我们可以关闭time统计,只显示io统计。如果你需要一张大表来统计真实的time信息,可以用文章后面的脚本构建一个百万行数据的contact表。下面的测试都以19972行的表为测试对象。
测试一个完全覆盖的查询
第一个查询是一个覆盖索引的查询,获取contact表中lastname以S开头的记录的一部分列。下面是执行的信息。
| SQL语句 | SELECT FirstName, LastName FROM dbo.Contacts -- execute with both Contacts_noindex and -- Contacts_index WHERE LastName LIKE 'S%' |
| 没有索引的情况下 | (2130 row(s) affected) Table 'Contacts_noindex'. Scan count 1, logical reads 568. |
| 有索引的情况 | (2130 row(s) affected) Table 'Contacts_index'. Scan count 1, logical reads 14. |
| 索引产生的影响 | IO从568次减少到14次 |
| 注释 | 覆盖查询的索引是个好东西。没有索引,就会进行全表扫描。2130行,表明以S开头的记录占到了10%的数据。 |
测试一个非完全覆盖的查询
我们修改一下查询,还是相同的查询,只是获取的列包含了一些没有建立索引的列,下面是执行的结果。
| SQL语句 | SELECT * FROM dbo.Contacts -- execute with both Contacts_noindex and -- Contacts_index WHERE LastName LIKE 'S%' |
| 没有索引的情况下 | (2130 row(s) affected) Table 'Contacts_noindex'. Scan count 1, logical reads 568. |
| 有索引的情况 | (2130 row(s) affected) Table 'Contacts_index'. Scan count 1, logical reads 568. |
| 索引产生的影响 | IO没有影响 |
| 注释 | 在查询的过程中没有使用到索引。在这种情况下,SQL Server觉得使用索引查找,比不适用索引直接扫描,还要做更多的工作。 |
测试一个非完全覆盖的查询,但是提供更多的条件
我们修改一下查询,还是相同的查询,只是缩减了查询结果的范围,增加使用索引的好处,下面是执行的结果。
| SQL语句 | SELECT * FROM dbo.Contacts -- execute with both Contacts_noindex and -- Contacts_index WHERE LastName LIKE 'Ste%' |
| 没有索引的情况下 | (107 row(s) affected) Table 'Contacts_noindex'. Scan count 1, logical reads 568. |
| 有索引的情况 | (107 row(s) affected) Table 'Contact_index'. Scan count 1, logical reads 111. |
| 索引产生的影响 | IO从568次减少到111次。 |
| 注释 |
SQL Server访问了107条入口,都在索引的连续范围内。每个入口的标签都被用来获取对应的行数据。这些行在表中不是连续的。 这些查询用到了索引,但是不如第一次的覆盖查询效果好,尤其是在IO的读取方面。 你希望读取107次索引,然后获取107条数据,产生107次读取。 之前的查询,请求了2130行数据,没有用到索引。这次请求107行数据,使用了索引。你很像知道使用索引的临界点在哪里?在后面的级别中我们将会介绍这方面的内容。 |
测试一个完全覆盖的聚合查询
最后一个例子是一个聚合查询,包含了count计算。
| SQL语句 | SELECT LastName, FirstName, COUNT(*) as 'Contacts' FROM dbo.Contacts -- execute with both Contacts_noindex and -- Contacts_index WHERE LastName LIKE 'Ste%' GROUP BY LastName, FirstName |
| 没有索引的情况下 | (2130 row(s) affected) Table 'Contacts_noindex'. Scan count 1, logical reads 568. |
| 有索引的情况 | (104 row(s) affected) Table 'Contacts_index'. Scan count 1, logical reads 4. |
| 索引产生的影响 | IO从568次减少到4次 |
| 注释 | 所有需要查询的信息都包含在索引中,很好的使用了索引。 |
测试一个非完全覆盖的聚合查询
我们修改一下查询,还是相同的查询,只是获取的列包含了一些没有建立索引的列,下面是执行的结果。
| SQL语句 | SELECT LastName, FirstName, MiddleName, COUNT(*) as 'Contacts' FROM dbo.Contacts -- execute with both Contacts_noindex and -- Contacts_index WHERE LastName LIKE 'Ste%' GROUP BY LastName, FirstName, MiddleName |
| 没有索引的情况下 | (2130 row(s) affected) Table 'Contacts_noindex'. Scan count 1, logical reads 568. |
| 有索引的情况 | (105 row(s) affected) Table 'ContactLarge'. Scan count 1, logical reads 111. |
| 索引产生的影响 | IO从568次减少到111次 |
| 注释 | 。 |
结论
当目前位置,我们知道非聚集索引有下面的一些好处:
- 是一些有序的入口集合。
- 表中的每一行都有一个入口。
- 包含一个索引键和一个标签。
- 用户负责创建的。
- SQL Server来维护。
- SQL Server用来最小化查询尝试,来满足客户的请求。
通过一些例子,我们看到SQL Server通过索引可以满足查询的请求,也有一些查询会完全忽略索引,还有一些会部分的使用索引。基于这个原因,我们来更新一下在第一级中的一个结论。
当一个请求到达数据库的时候,SQL Server只有三种访问数据的方式:
- 访问非聚集索引,避免访问表。这只发生在索引包含了请求中的所有数据。
- 通过索引键访问非聚集索引,然后使用标签访问表中的行数据。
- 忽略非聚集索引,扫描表找到请求的行数据。
通常来说,第一种是理想的,第二种要比第三种好。在之前的介绍中,我们知道了如何增加索引的使用可能性,如何决定更高效的使用非聚集索引。但是我们需要知道更多的索引内部的细节。
在我们知道细节之前,我们还需要介绍其他类型的SQL Server索引:聚集索引。
SQL Server索引进阶:第二级,深入非聚集索引的更多相关文章
- SQL Server性能优化(12)非聚集索引的组合索引存储结构
一,非聚集索引组合索引 用户可以在多个列上建立索引,这种索引叫做复合索引(组合索引).但复合索引在数据库操作期间所需的开销更小,可以代替多个单一索引.当表的行数远远大于索引键的数目时,使用这种方式可以 ...
- SQL Server性能优化(11)非聚集索引的覆盖索引存储结构
一,非聚集索引的include 非聚集索引的Include属性可以让非聚集索引包含其他列.如 CREATE NONCLUSTERED INDEX [NonIxUser] ON [dbo].[Users ...
- SQL Server性能优化(10)非聚集索引的存储结构
一,新建测试表 CREATE TABLE [dbo].[Users]( ,) NOT NULL, ) NOT NULL, [CreatTime] [datetime] NOT NULL ) ON [P ...
- 索引深入浅出(5/10):非聚集索引的B树结构在堆表
在“索引深入浅出:非聚集索引的B树结构在聚集表”里,我们讨论了在聚集表上的非聚集索引,这篇文章我们讨论下在堆表上的非聚集索引. 非聚集索引可以在聚集表或堆表上创建.当我们在聚集表上创建非聚集索引时,聚 ...
- SQL Server 索引和表体系结构(非聚集索引)
非聚集索引 概述 对于非聚集索引,涉及的信息要比聚集索引更多一些,由于整个篇幅比较大涉及接下来的要写的“包含列的索引”,“索引碎片”等一些知识点,可能要结合起来阅读理解起来要更容易一些.非聚集索引和聚 ...
- SQLServer中重建聚集索引之后会影响到非聚集索引的索引碎片吗
本文出处:http://www.cnblogs.com/wy123/p/7650215.html (保留出处并非什么原创作品权利,本人拙作还远远达不到,仅仅是为了链接到原文,因为后续对可能存在的一些错 ...
- 【SqlServer】聚集索引与主键、非聚集索引
目录结构: contents structure [-] 聚集索引和非聚集索引的区别 聚集索引和主键的区别 主键和(非)聚集索引的常规操作 聚集索引.非聚集索引在SqlServer.MySQL.Ora ...
- SQL Server索引进阶:第三级,聚集索引
原文地址: Stairway to SQL Server Indexes: Level 3, Clustered Indexes 本文是SQL Server索引进阶系列(Stairway to SQL ...
- SQL Server中的联合主键、聚集索引、非聚集索引、mysql 联合索引
我们都知道在一个表中当需要2列以上才能确定记录的唯一性的时候,就需要用到联合主键,当建立联合主键以后,在查询数据的时候性能就会有很大的提升,不过并不是对联合主键的任何列单独查询的时候性能都会提升,但我 ...
- SQL Server中的联合主键、聚集索引、非聚集索引
我们都知道在一个表中当需要2列以上才能确定记录的唯一性的时候,就需要用到联合主键,当建立联合主键以后,在查询数据的时候性能就会有很大的提升,不过并不是对联合主键的任何列单独查询的时候性能都会提升,但我 ...
随机推荐
- <meta http-equiv="Pragma" content="no-cache">
<meta http-equiv="Pragma" content="no-cache"><meta http-equiv="Cac ...
- [推荐] 查看网站使用的JS框架
查看各大网站使用的JS框架: 打开:http://oskarkrawczyk.github.com/wtframework/ 在这个中间的图片页面上右击,Add BookMarks.(添加到书签中) ...
- 製程能力介紹(SPC introduction) ─ Cp之製程能力解釋
Cp之製程能力解釋 從常態分配的特性來看,在群體中 ±3σ(標準差) 之範圍內的值,應包含群體全部的 99.73%.也就是說,若以 6σ為單位,就可以代表整個分布的範圍,但是有 0.27% (2700 ...
- Robot Framework作者建议如何选择自动化测试框架
本文摘自:InfoQ中文站http://www.infoq.com/cn/news/2012/06/robot-author-suggest-autotest Robot Framework作者建议如 ...
- 有哪些适合学生参与的 C++,网络编程方面的开源项目?
有哪些适合学生参与的 C++,网络编程方面的开源项目? Tinyhttpd是一个超轻量型Http Server,使用C语言开发,全部代码只有502行(包括注释),附带一个简单的Client,可以通 ...
- C++编程学习52个经典网站 强力推荐
C/C++是最主要的编程语言.这里列出了50名优秀网站和网页清单,这些网站提供c/c++源代码.这份清单提供了源代码的链接以及它们的小说明.我已尽力包括最佳的C/C++源代码的网站.这不是一个完整的清 ...
- 【FZU】2152 文件系统
Problem 2152 文件系统 Accept: 63 Submit: 126 Time Limit: 1000 mSec Memory Limit : 32768 KB Probl ...
- lucene定义自己的分词器将其分成单个字符
问题描写叙述:将一句话拆分成单个字符.而且去掉空格. package com.mylucene; import java.io.IOException; import java.io.Reader; ...
- Android 匿名共享内存C++接口分析
在上一篇Android 匿名共享内存C接口分析中介绍了Android系统的匿名共享内存C语言访问接口,本文在前文的基础上继续介绍Android系统的匿名共享内存提供的C++访问接口.在C++层通过引入 ...
- Zookeeper 编程
ZooKeeper编程(一) 杂记 ZooKeeper的用途:distributed coordination;maintaining configuration information, namin ...