范围小的（Narrow）

聚集键值应该i越小越好。为什么？因为它要占用空间，聚集键值也在每个非聚集索引的叶子曾作为逻辑指针。如果你的聚集键值很广，你的非聚集索引也会很大。如果你定义了非唯一非聚集索引（Non-Unique Non-Clustered Index）（基本上是这个情况），聚集键也是你非聚集索引导航结构的一部分。因此你的索引会变得很大。我们的目标是最小化我们的索引。因为我们要为此承担更多的物理存储，缓存池，这些都是SQL Server从存储缓存读取的索引页的地方。

一般我们会选择技术性键值（technical key value）（像INT/BIGINT数据类型），而不是自然键值（natural key value）。当我也看到很多长度有100 bytes甚至更长的聚集键值（包含LastName, FirstName, SocialSecurityNumber等）。相信我——你这是在浪费内存！没有必要这样做。选择一个技术性键值就可以了。

静态的（Static）

因为聚集键值在每个非聚集索引里都会复制一份，你的聚集键值应该从不改变！不然SQL Server需要经常维护，去更新执行计划里每个在你表上定义的非聚集索引。你再次引入了你不需要的额外计算。把你的CPU用在其它重要的事情上。我们都知道，自然键值是会改变的（例如LastName列，当你结婚了就会改变）。

技术性键值（像INT IDENTITY）不会改变（默认）。因此在你非聚集索引里的逻辑指针（聚集键值格式）保持稳定——永远没有必要修改他们！

自增长的（Ever Increasing）

“好”的聚集键值第3个重要属性是选择列应该给你自增长的值。为什么？因为你总是在你聚集索引的末尾增加额外记录，因此你可以避免昂贵的分页（Page Splits）（涉及到CPU周期，事务日志等问题）和索引碎片。使用像INT IDENTITY自增长值列，在99%的情况下是没有问题的，但还是有些情形，这个方法会导致严重的扩展性问题。假设你有个工作量，那里有很多不同用户用自增长聚集键值对同个表永久插入键值。想下日志/审计表（Logging/Auditing Table）。

我们来仔细看下当你在内存里读写页时，在SQL Server内部会发生什么。当SQL Server访问特定内存机构（像存储在缓存池里的页）时，这些内存访问必须被多个线程上同步。你不能在内存里并发写入同个页。当一个线程写入一个页时，其他一些线程同时就不能读这个页。另外并发编程你用互斥器（Mutexes）解决那个问题——像临界区（Critical Section）。一些代码路径是人为互斥的。闩锁（latches）用来在线程/查询间的同步。每次当你读一个页，工作线程需要获得共享锁（Shared Latch（SH）），每次当你写一个页，工作线程需要获得排它闩锁（Exclusive Latch（EX））。而且这些闩锁彼此是不兼容的。

当你进行INSERT语句时，工作线程在INSERT语句发生的页获得排它闩锁。同时没有线程可以从这个页读写。使用自增长聚集键值这个方法实际上不会扩展，因为你在你聚集索引的末尾插入你的记录。因此你的并行线程/查询在你聚集索引里同个最后页为闩锁竞争。作为一个副作用SQL Server会连续执行你的INSERT语句——一个接着一个INSERT，你就碰到了著名的最后页插入闩锁竞争（Last Page Insert Latch Contention）。我们来看下面的图片。

用自增长聚集键值的最佳实践，在聚集键的末尾你有一个热区。你的记录越小，这里就会有更多的竞争。如果解决那个问题？简单：把你的INSERT语句扩散到聚集索引的整个B树结果。有很多方法可以实现这个：

使用随机聚集键值（像UNIQUEIDENTIFIER）。但要意识到副作用：在每个非聚集索引里逻辑指针更大，页分裂问题……
实现哈希分区（Hash Partitioning），如果你使用企业版本的SQL Server。
使用SQL Server 2014里内不能优化表OLTP来剔除闩锁。
使用逆向索引（Reverse index），很遗憾SQL Server并不提供你像Oracle那样的内建索引。你也可以自己写一个的……

 CREATE FUNCTION BitReverse

 (

     @Input bigint

 )

 RETURNS bigint

 AS

 BEGIN

     DECLARE @WorkValue bigint=@Input

     DECLARE @Result bigint=0;

     DECLARE @Counter int=0;

     WHILE @Counter<63

     BEGIN

         SET @Result=@Result*2

         IF (@WorkValue&1)=1

         BEGIN

             SET @Result=@Result+1

             SET @WorkValue=@WorkValue-1

         END

         SET @WorkValue=@WorkValue/2

         SET @Counter=@Counter+1

     END

     RETURN @Result

 END

小结

使用像INT IDENTITY数据类型的范围小，静态的，自增长的聚集键值99%的情况都没问题。但在一些有大量并发INSERT语句的情况（日志/审计表（Logging/Auditing Table）），用那个方法你会碰到最后也插入闩锁竞争（Last Page Insert Latch Contention）。如果你碰到这个特定问题，你就会离开这99%的太平区域，你要保证INSERT语句散布到你的整个B树结构。基本上你就在如果将多线程散步到典型B树结构做斗争。

希望这篇文章可以帮助你从内部理解：为什么自增长聚集键值会伤及你表的扩展性。

感谢关注。

参考文章：

https://www.sqlpassion.at/archive/2014/04/15/an-ever-increasing-clustered-key-value-doesnt-scale/

自增长的聚集键值不会扩展（scale）的更多相关文章

获取mybaties插入记录自动增长的主键值
首先在Mybatis Mapper文件中insert语句中添加属性“useGeneratedKeys”和“keyProperty”,其中keyProperty是保存主键值的属性. 例如: <in ...
JDBC：获取自增长键值的序号
1.改变的地方实践: package com.dgd.test; import java.io.FileInputStream; import java.io.FileNotFoundExcept ...
Learning Spark 第四章——键值对处理
本章主要介绍Spark如何处理键值对.K-V RDDs通常用于聚集操作,使用相同的key聚集或者对不同的RDD进行聚集.部分情况下,需要将spark中的数据记录转换为键值对然后进行聚集处理.我们也会对 ...
SQL键值约束、索引使用
添加約束的方式: [exec sp_helpconstraint 表名]->可用于查找到表创建的约束 CREATE TABLE stuInfo ( stuName ) NOT NULL,非空約束 ...
ODAC（V9.5.15) 学习笔记（十九）主键值自动生成
ODAC支持通过Oracle的序列来自动生成表的主键功能.这个过程允许在客户端自动完成,不需要过多代码.这个对一些要求自动增长字段做主键的场合非常有用.其实现步骤为: 1.数据库必须先建立生成主键的序 ...
利用GeneratedKeyHolder获得新增数据主键值
Spring利用GeneratedKeyHolder,提供了一个可以返回新增记录所对应的主键值的方法: int update(PreparedStatementCreator psc, KeyHold ...
使用mybatis注解@Options实现添加记录时返回主键值
官网:http://www.mybatis.org/mybatis-3/index.html 在使用mybatis作为ORM框架时,我通常更喜欢使用注解而非xml配置文件的方式.业务场景:添加记录之后 ...
数据结构（二）：轻量级键值对 SparseArray
SparseArray是Android framework中提供的轻量级的键值对数据结构,我们知道空间和效率从来都是相悖的,SparseArray的实现正是以时间来换取空间效率,适合小规模数据的存储. ...
每秒高达1.6亿次操作的并发键值存储库 FASTER 诞生
FASTER 在过去十年中,云中的数据密集型应用程序和服务有了巨大的增长.数据在各种边设施(例如,设备,浏览器和服务器)上创建,并由云应用程序处理用来获得数据价值或做出决策.应用程序和服务可以处理收集 ...

随机推荐

轻松搞定面试中的二叉树题目(java&python)
树是一种比较重要的数据结构,尤其是二叉树.二叉树是一种特殊的树,在二叉树中每个节点最多有两个子节点,一般称为左子节点和右子节点(或左孩子和右孩子),并且二叉树的子树有左右之分,其次序不能任意颠倒.二叉 ...
vim 多行注释消除注释，多行删除
进入可视化模式: Ctrl+v 继续进入编辑模式: shift+i 注释: shift+# 注释生效: ESC 取消注释 d 删除选中全部字符块区域,使用方向键上下右: 然后,按一下d
HTTP - GET和POST的区别
网上有很多文章介绍这两种HTTP请求的区别,我也不懂,主要还是看了一些文章,在这里写下一些笔记. 语义不同在HTTP协议中,最初规定GET是用来查询或者获取资料,只读,POST用于修改数据,可写.因 ...
HL AsySocket 服务开发框架 - 一般性测试1
一概述 Socket服务器性能要好就要经过无数次的测试,来保证,以下是记录一次的测试经过. 机器配置:Inter(R) Core(TM) i3-2310m CPU 2.10GHz RAM 6.00G ...
【jquery】Validform，一款不错的 jquery 表单验证插件
关于 Validform 这是一款很不错的 jquery 表单验证插件,它几乎能够满足任何验证需求,仅仅一行代码就能搞定整站的表单验证. $('form').Validform(); 为什么能如此方便 ...
ExtJs 可查询的下拉框
最近项目中有个需求,就是有四个模块需要加载一个主表的内容,比如说这个表叫项目表(比如项目表里有两个字段一个是项目ID--projCd,还有一个是项目名称--projNm).主表的内容的要放在一个下拉框 ...
SAP ECC FI配置文档
SAP ECC 6.0 Configuration Document Financial Accounting (FI) Table of Content TOC \O "1-2" ...
SQL调优 - Hints指定索引解决慢查询案例
背景每当交易高峰时期,可能会暴露一些平时无法发现的问题,机遇和挑战并存.下面聊聊最近解决的一个案例,因为执行计划走错导致慢查询,进而引发应用线程阻塞.线程池爆满,最后应用功能瘫痪.如何标本兼治的解决 ...
Windows Phone 8.1 Update1 支持中文“小娜”及开发者模拟器更新
千呼万唤的 Windows Phone 8.1 Update1 在 developer Perview 发布了还没有升级的朋友随我先睹为快吧.升级了的朋友们来看看 WP8.1 update1 还有哪些 ...
Oracle 物化视图说明
一．物化视图概述 Oracle的物化视图是包括一个查询结果的数据库对像,它是远程数据的的本地副本,或者用来生成基于数据表求和的汇总表.物化视图存储基于远程表的数据,也可以称为快照. 物化视图可 ...

自增长的聚集键值不会扩展（scale）