Sql Server之旅——第四站 你必须知道的非聚集索引扫描
非聚集索引,这个是大家都非常熟悉的一个东西,有时候我们由于业务原因,sql写的非常复杂,需要join很多张表,然后就泪流满面了。。。这时候就
有DBA或者资深的开发给你看这个猥琐的sql,通过执行计划一分析。。。或许就看出了不该有的表扫描。。。万恶之源。。。然后给你在关键的字段加上非
聚集索引后。。。才发现提速比阿斯顿马丁还要快。。。那么一个问题来了,为什么非聚集索引能提速这么快。。。怎么做到的???是不是非常的好奇???
这篇我们来解开神秘面纱。
一:现象
先让我们一睹非聚集索引的真容,看看到底在执行计划看来是个什么玩意。。。我这里有个product表,里面灌了8w多数据,然后在Name列上建立
一个非聚集索引,就像下图一样:
从上图中看到了两个好玩的东西,一个就是我想看到的“索引查找[nonclustered]”,这个大家很熟悉,也是这篇要说的,然后我们还看到了一个“RID查找”,
乍一看这是什么鸡巴玩意。。。非聚集索引跟它扯上什么关系了???
二:什么是RID
通过前面几篇,我想大家都知道了数据页中的记录是如何寻找的?秘密就是通过slot槽位中的偏移量决定的,那问题来了,如果上升到数据页层面,我
只需要(pageID:slotID)就可以找到记录了,对不对?那如果我上升了文件层面,那是不是只需要知道(fileID:pageID:slotID)就可以找到数据页中的
记录了?其实这里的RID就是站在文件的高度通过(fileID:pageID:slotID)找到表记录的。。。既RID=RowID=(fileID:pageID:slotID),如果你非要眼见
为实的话,在sq中l还真提供了这么个函数(sys.fn_PhysLocFormatter(%%physloc%%)),我们看下图:
看了上面的图,是不是很兴奋,一目了然,比如productID=18088这条记录,然来是在1号文件,34941号数据页,0号槽位上,productID=18089
是在1号槽位上,好了,当你知道RID是个什么东西的时候,我想你已经离彻底理解非聚集索引不远啦。。。
三:非聚集索引
有一点我们肯定知道,就是非聚集索引是可以加速查找的,要是跟表扫描那样的龟速,那也就失去了索引的目的,既然能加速,是因为它和聚集索
引一样,在底层都玩起了B树,首先我们插入一些样例数据。
DROP TABLE dbo.Person CREATE TABLE Person(ID INT IDENTITY,NAME CHAR(900))
CREATE INDEX idx_Person_Name ON dbo.Person(Name) DECLARE @ch AS INT=97 WHILE @ch<=122
BEGIN
INSERT INTO dbo.Person VALUES(REPLICATE(CHAR(@ch),5))
SET @ch=@ch+1
END
上面的sql,我故意在Name列设置为900个char,这也是索引的上限值,这样的话,我DBCC就可以导出很多数据页和索引页了。
可以看到,当我dbcc ind 的时候,发现Person表中已经有4个数据页,5个索引页,其中151号数据页是表跟踪页,174号为索引跟踪页,这也就
说明当我建立索引后,引擎给我们分配了专门的索引页来存放我们建立的Name索引,那下一步就是我们来看看这些索引中都存放着什么,这也是我
非常关心的,接下来我导出173号索引页。
DBCC PAGE(Ctrip,1,173,1)
Slot 0, Offset 0x60, Length 912, DumpStyle BYTE Record Type = INDEX_RECORD Record Attributes = NULL_BITMAP Record Size = 912 Memory Dump @0x000000000EF1C060 0000000000000000: 16 2020 20202020 20202020 †.aaaaa
0000000000000010: 20202020 20202020 20202020 20202020 †
0000000000000020: 20202020 20202020 20202020 20202020 †
0000000000000030: 20202020 20202020 20202020 20202020 †
0000000000000040: 20202020 20202020 20202020 20202020 †
0000000000000050: 20202020 20202020 20202020 20202020 †
0000000000000060: 20202020 20202020 20202020 20202020 †
0000000000000070: 20202020 20202020 20202020 20202020 †
0000000000000080: 20202020 20202020 20202020 20202020 †
0000000000000090: 20202020 20202020 20202020 20202020 †
00000000000000A0: 20202020 20202020 20202020 20202020 †
00000000000000B0: 20202020 20202020 20202020 20202020 †
00000000000000C0: 20202020 20202020 20202020 20202020 †
00000000000000D0: 20202020 20202020 20202020 20202020 †
00000000000000E0: 20202020 20202020 20202020 20202020 †
00000000000000F0: 20202020 20202020 20202020 20202020 †
0000000000000100: 20202020 20202020 20202020 20202020 †
0000000000000110: 20202020 20202020 20202020 20202020 †
0000000000000120: 20202020 20202020 20202020 20202020 †
0000000000000130: 20202020 20202020 20202020 20202020 †
0000000000000140: 20202020 20202020 20202020 20202020 †
0000000000000150: 20202020 20202020 20202020 20202020 †
0000000000000160: 20202020 20202020 20202020 20202020 †
0000000000000170: 20202020 20202020 20202020 20202020 †
0000000000000180: 20202020 20202020 20202020 20202020 †
0000000000000190: 20202020 20202020 20202020 20202020 †
00000000000001A0: 20202020 20202020 20202020 20202020 †
00000000000001B0: 20202020 20202020 20202020 20202020 †
00000000000001C0: 20202020 20202020 20202020 20202020 †
00000000000001D0: 20202020 20202020 20202020 20202020 †
00000000000001E0: 20202020 20202020 20202020 20202020 †
00000000000001F0: 20202020 20202020 20202020 20202020 †
0000000000000200: 20202020 20202020 20202020 20202020 †
0000000000000210: 20202020 20202020 20202020 20202020 †
0000000000000220: 20202020 20202020 20202020 20202020 †
0000000000000230: 20202020 20202020 20202020 20202020 †
0000000000000240: 20202020 20202020 20202020 20202020 †
0000000000000250: 20202020 20202020 20202020 20202020 †
0000000000000260: 20202020 20202020 20202020 20202020 †
0000000000000270: 20202020 20202020 20202020 20202020 †
0000000000000280: 20202020 20202020 20202020 20202020 †
0000000000000290: 20202020 20202020 20202020 20202020 †
00000000000002A0: 20202020 20202020 20202020 20202020 †
00000000000002B0: 20202020 20202020 20202020 20202020 †
00000000000002C0: 20202020 20202020 20202020 20202020 †
00000000000002D0: 20202020 20202020 20202020 20202020 †
00000000000002E0: 20202020 20202020 20202020 20202020 †
00000000000002F0: 20202020 20202020 20202020 20202020 †
0000000000000300: 20202020 20202020 20202020 20202020 †
0000000000000310: 20202020 20202020 20202020 20202020 †
0000000000000320: 20202020 20202020 20202020 20202020 †
0000000000000330: 20202020 20202020 20202020 20202020 †
0000000000000340: 20202020 20202020 20202020 20202020 †
0000000000000350: 20202020 20202020 20202020 20202020 †
0000000000000360: 20202020 20202020 20202020 20202020 †
0000000000000370: 20202020 20202020 20202020 20202020 †
0000000000000380: 20202020 20 00010000 020000 † ...........
Row - Offset
7 (0x7) - 6480 (0x1950)
6 (0x6) - 5568 (0x15c0)
5 (0x5) - 4656 (0x1230)
4 (0x4) - 3744 (0xea0)
3 (0x3) - 2832 (0xb10)
2 (0x2) - 1920 (0x780)
1 (0x1) - 1008 (0x3f0)
0 (0x0) - 96 (0x60)
从上面至少可以发现三个有趣的现象:
<1>:173号索引页中slot0和slot1槽位指向记录的内容已经有序了,比如:aaaaa,bbbbb。。。。这样。。。。原来非聚集索引也是有序呀。。。
<2>:6161616161就是16进制的aaaaa。
0000 :这几个数字非常重要,因为是16进制表示,所以2位16进制表示一个字节,所以可以这么解释,前面4个字节表示
pageID,中间2个字节表示fileID,后面2个字节表示slot,看到这里你是不是想起了RID。。。因为RID就是这三样的组合。。。原来非聚集索
引的记录存放的就是“key+RowID”呀。。。。
<3>:通过最后的槽位列表,可以得知173号索引页上存放着8条索引记录。
好了,看完了叶子节点,我们再看分支节点,也就是IndexLevel=1的那条索引数据页,也就是78号。ok,dbcc看看吧。
当看到这个列表的时候,不知道你脑子里面是不是有一幅图出来了,就像上一篇看到聚集索引一样,因为它的结构和聚集索引非常像,只不过
非聚集索引这里多了一个RID而已。。。最后我也把图贡献一下。
总结一下:在走非聚集索引的时候,比如你的条件是where name='jjjjj' 时,它的逻辑是这样的,根据78号索引数据页的key的范围,然后通过
rowid走到了79号索引数据页,然后在79号索引数据页中顺利的找到了jjjjj,这时候就可以拿出jjjjj的rowid去表数据页中直接定位记录,
最后输出。。。。。这个也就是博客开头的地方为什么会出现RID的查找。。。
Sql Server之旅——第四站 你必须知道的非聚集索引扫描的更多相关文章
- Sql Server之旅——第三站 解惑那些背了多年聚集索引的人
说到聚集索引,我想每个码农都明白,但是也有很多像我这样的猥程序员,只能用死记硬背来解决这个问题,什么表中只能建一个聚集索引, 然后又扯到了目录查找来帮助读者记忆....问题就在这里,我们不是学文科,, ...
- Sql Server之旅——第五站 确实不得不说的DBCC命令
原文:Sql Server之旅--第五站 确实不得不说的DBCC命令 今天研发中心办年会,晚上就是各自部门聚餐了,我个人喜欢喝干红,在干红中你可以体味到那种酸甜苦辣...人生何尝不是这样呢???正好 ...
- (转)Sql Server之旅——第八站 复合索引和include索引到底有多大区别?
索引和锁,这两个主题对我们开发工程师来说,非常的重要...只有理解了这两个主题,我们才能写出高质量的sql语句,在之前的博客中,我所说的 索引都是单列索引...当然数据库不可能只认单列索引,还有我这篇 ...
- Sql Server之旅——第七站 为什么都说状态少的字段不能建索引
我们在学sqlserver的时候,大多教科书和前辈们都说状态少的字段不要建索引,由此带来的开销还不如不建索引,但是这句话有多少人真的知道, 或者说有多少人真的对此有比较深刻的理解,而不是听别人道听途说 ...
- Sql Server之旅——第五站 确实不得不说的DBCC命令(文后附年会福利)
今天研发中心办年会,晚上就是各自部门聚餐了,我个人喜欢喝干红,在干红中你可以体味到那种酸甜苦辣...人生何尝不是这样呢???正好 ceo从美国带了干红回来,然后我就顺道开心的过了把瘾....一个字.. ...
- Sql Server之旅——第八站 复合索引和include索引到底有多大区别?
周末终于搬进出租房了,装了宽带....才发现没网的日子...那是一个怎样的与世隔绝呀...再也受不了那样的日子了....好了,既然网 安上去了,还得继续我的这个系列. 索引和锁,这两个主题对我们开发工 ...
- Sql Server之旅——第十三站 对锁的初步认识
终于这个系列快结束了,马上又要过年了,没什么心情写博客...作为一个开发人员,锁机制也是我们程序员必须掌握的东西,很久之前 在学习锁的时候,都是教科书上怎么说,然后我怎么背,缺少一个工具让我们眼见为实 ...
- Sql Server之旅——第十一站 简单说说sqlserver的执行计划
我们知道sql在底层的执行给我们上层人员开了一个窗口,那就是执行计划,有了执行计划之后,我们就清楚了那些烂sql是怎么执行的,这样 就可以方便的找到sql的缺陷和优化点. 一:执行计划生成过程 说到执 ...
- Sql Server之旅——第十站 看看DML操作对索引的影响
我们都知道建索引是需要谨慎的,当只有利大于弊的时候才适合建,我们也知道建索引是需要维护成本的,这个维护也就在于DML操作了, 下面我们具体看看到底DML对索引都有哪些内幕.... 一:delete操作 ...
随机推荐
- ASP.NET MVC中使用Dropzone.js实现图片的批量拖拽上传
说在前面 最近在做一个MVC相册的网站(这里),需要批量上传照片功能,所以就在网上搜相关的插件,偶然机会发现Dropzone.js,试用了一下完全符合我的要求,而且样式挺满意的,于是就在我的项目中使用 ...
- int和Integer的区别
int是一种数据类型,Integer是一个类,有各种方法,如Integer.parseInt(string)等.
- ios源码-ios游戏源码-ios源码下载
游戏源码 一款休闲类的音乐小游戏源码 该源码实现了一款休闲类的音乐小游戏源码,该游戏的源码很简单,而且游戏的玩法也很容易学会,只要我们点击视图中的grid,就可以 人气:2943运行环境:/Xco ...
- Apache+Mod_Python配置
我其实不是个适合做编程的人,因为喜欢折腾,不喜欢日复一日的重复同样的事情.感觉挺适合做网管(运维)的. 经常在摆弄一些小众的程序员不怎么会关心的东西,不走寻常路.有时也挺纠结的,折腾这些东西的过程中, ...
- 点我吧工作总结(技术篇) Cobar原理和环境搭建
我思故我在,提问启迪思考! 1.什么是Cobar? Cobar是关系型数据的分布式处理系统,它可以在分布式的环境下看上去像传统数据库一样为您提供海量数据服务.cobar已经在阿里巴巴B2B公司稳定运行 ...
- 抽取的BaseFragment和LoadingPage
[BaseFragment]: public abstract class BaseFragment extends Fragment { /*★★★★★★★★★★★★★★★★★★★★★★★★★★★★ ...
- [小北De编程手记] : Lesson 03 玩转 xUnit.Net 之 Fixture(上)
在使用xUnit.Net Framework构建单元测试或自动化测试项目的时候,无论是针对一些比较耗费资源的对象亦或是为了支持Test case预设数据的能力,我们都需要有一些初始化或是清理相关的动作 ...
- socket.io,系统api,
原文:http://www.cnblogs.com/xiezhengcai/p/3956401.html 1. 服务端 io.on('connection',function(socket)); 监听 ...
- 浅谈spring security 403机制
403就是access denied ,就是请求拒绝,因为权限不足 三种权限级别 一.无权限访问 <security:http security="none" pattern ...
- Training - Problem and Change Management
Problem Management Problem management seeks to identify the underlying causes of incidents in an IT ...