一.本文所涉及的内容(Contents)

  1. 本文所涉及的内容(Contents)
  2. 背景(Contexts)
  3. 堆表行记录存储格式(Heap)
  4. 案例分析(Case)
  5. 参考文献(References)

二.背景(Contexts)

  有的时候你需要计算堆表的一行记录有多大?又或者想计算一个数据页(8K)能保存多少条记录?字段类型是设计成nchar还是nvarchar?他们有什么区别呢?在做数据库表设计的时候会经常出现这些问题。要计算一行记录的大小,并不是简单把列字段类型大小直接相加就行的,具体原因请看下文。

三.堆表行记录存储格式(Heap)

  下面是计算堆表行记录大小的公式,它引自MSDN:估计堆的大小

计算公式:Row_Size = Fixed_Data_Size + Variable_Data_Size + Null_Bitmap + 4

= 所有固定长度列的总字节大小 + 可变长度数据的大小 + Null位图 + 数据行的行标题开销

  单看上面的计算公式是比较难理解的,而且MSDN并没有提供相关的说明,比如上面公式最后的4代表什么意思?我参考了一些书籍之后整理出下面更容易理解的堆记录存储格式图,希望能帮助大家理解:

(Figure1:堆表记录存储格式)

四.案例分析(Case)

  本文针对堆表数据页的存储做一个测试,测试不同数据类型的存储大小,测试的数据类型包括:int、char、nchar和nvarchar,测试后你会理解什么是定长类型、什么是变长类型,他们在存储上有什么区别;

(一) 首先创建一个测试数据库;

/******* Step1:创建示例数据库*******/
USE master
GO
IF EXISTS(SELECT name FROM sys.databases WHERE name = 'RecordSize_DB')
DROP DATABASE RecordSize_DB
GO
CREATE DATABASE RecordSize_DB
GO

(二) 接着在数据库中创建3个不同的堆表:[HeapPage_char]、[HeapPage_nchar] 和[HeapPage_nvarchar],3个表分别代表:char、nchar和nvarchar不同数据类型的存储;

USE RecordSize_DB
GO
/******* Step2:创建个堆表*******/
CREATE TABLE [dbo].[HeapPage_char](
[id] [int] IDENTITY(1,1) NOT NULL,
[names] [char](10) NULL
) ON [PRIMARY]
GO CREATE TABLE [dbo].[HeapPage_nchar](
[id] [int] IDENTITY(1,1) NOT NULL,
[names] [nchar](10) NULL
) ON [PRIMARY]
GO CREATE TABLE [dbo].[HeapPage_nvarchar](
[id] [int] IDENTITY(1,1) NOT NULL,
[names] [nvarchar](10) NULL
) ON [PRIMARY]
GO

(三) 再接着就是在3个不同的堆表插入相同的数据;

/******* Step3:分别插入测试数据*******/
INSERT INTO [HeapPage_char](names) values('XX')
GO
INSERT INTO [HeapPage_char](names) values('XXXX')
GO 2 INSERT INTO [HeapPage_nchar](names) values('XX')
GO
INSERT INTO [HeapPage_nchar](names) values('XXXX')
GO 2 INSERT INTO [HeapPage_nvarchar](names) values('XX')
GO
INSERT INTO [HeapPage_nvarchar](names) values('XXXX')
GO 2

(四) 返回3个测试表数据;

-- 返回表数据
SELECT * FROM [HeapPage_char]
SELECT * FROM [HeapPage_nchar]
SELECT * FROM [HeapPage_nvarchar]

(Figure2:HeapPage_char)

(Figure3:HeapPage_nchar)

(Figure4:HeapPage_nvarchar)

(五) 通过开启3604跟踪和DBCC PAGE命令查询数据的存储信息;

/******* Step4:查看各表数据页大小*******/
--开启跟踪
DBCC TRACEON(3604)
--查看表信息
DBCC IND(RecordSize_DB,HeapPage_char,-1)

上面的命令会返回如下图所示的信息:

(Figure5:堆表HeapPage_char)

上图返回结果都会因为每次创建而有所不同,你需要根据每次不同的值来填写下面的DBCC命令中的参数。上图第一行记录为IAM page,第二行为data page(数据页),这里是查看数据页的内容,在参数中填入PageFID=1和PagePID=80

--查看PAGE信息
DBCC PAGE(RecordSize_DB,1,80,1)

执行上面的DBCC PAGE命令将返回下面信息:

DATA:
Slot 0, Offset 0x60, Length 21, DumpStyle BYTE Record Type = PRIMARY_RECORD Record Attributes = NULL_BITMAP Record Size = 21 Memory Dump @0x6523C060 00000000: 10001200 01000000 58582020 20202020 †........XX
00000010: 20200200 00†††††††††††††††††††††††††† ... Slot 1, Offset 0x75, Length 21, DumpStyle BYTE Record Type = PRIMARY_RECORD Record Attributes = NULL_BITMAP Record Size = 21 Memory Dump @0x6523C075 00000000: 10001200 02000000 58585858 20202020 †........XXXX
00000010: 20200200 00†††††††††††††††††††††††††† ... Slot 2, Offset 0x8a, Length 21, DumpStyle BYTE Record Type = PRIMARY_RECORD Record Attributes = NULL_BITMAP Record Size = 21 Memory Dump @0x6523C08A 00000000: 10001200 03000000 58585858 20202020 †........XXXX
00000010: 20200200 00†††††††††††††††††††††††††† ... OFFSET TABLE:
Row - Offset
2 (0x2) - 138 (0x8a)
1 (0x1) - 117 (0x75)
0 (0x0) - 96 (0x60)

从上面的信息我们可以知道3条记录的长度都是:Record Size = 21,这个值是怎么算出来的呢?公式可以参考:估计堆的大小

计算公式:Row_Size = Fixed_Data_Size + Variable_Data_Size + Null_Bitmap + 4

= 所有固定长度列的总字节大小 + 可变长度数据的大小 + Null位图 + 数据行的行标题开销

计算过程:

Fixed_Data_Size = 所有固定长度列的总字节大小 = 4+10(int大小为4个字节,char(10)固定大小为10个字节)

Variable_Data_Size = 2 + (Num_Variable_Cols x 2) + Max_Var_Size

  Num_Variable_Cols = 可变长度列数 = 0(没有可变长度列)

  Max_Var_Size = 所有可变长度列的最大总字节大小 = 0

Variable_Data_Size = 0(如果没有可变长度列,请将 Variable_Data_Size 设置为 0)

Null_Bitmap = 2 + ((Num_Cols + 7) / 8)

  Num_Cols = 总列数(固定长度和可变长度)= 2(id、names两个列)

  Null_Bitmap = 3(只保留整数部分,放弃所有余数)

Row_Size = Fixed_Data_Size + Variable_Data_Size + Null_Bitmap + 4

  = 14 + 0 + 3 +4 = 21(与上面Record Size = 21符合)

(六) 接下来,我们来看看HeapPage_nchar表的存储大小会有什么不同:

--查看表HeapPage_nchar
DBCC ind(RecordSize_DB,HeapPage_nchar,-1)

(Figure6:堆表HeapPage_nchar)

--查看PAGE信息
DBCC PAGE(RecordSize_DB,1,90,1)
DATA:
Slot 0, Offset 0x60, Length 31, DumpStyle BYTE Record Type = PRIMARY_RECORD Record Attributes = NULL_BITMAP Record Size = 31 Memory Dump @0x61ADC060 00000000: 10001c00 01000000 58005800 20002000 †........X.X. . .
00000010: 20002000 20002000 20002000 020000†††† . . . . . .... Slot 1, Offset 0x7f, Length 31, DumpStyle BYTE Record Type = PRIMARY_RECORD Record Attributes = NULL_BITMAP Record Size = 31 Memory Dump @0x61ADC07F 00000000: 10001c00 02000000 58005800 58005800 †........X.X.X.X.
00000010: 20002000 20002000 20002000 020000†††† . . . . . .... Slot 2, Offset 0x9e, Length 31, DumpStyle BYTE Record Type = PRIMARY_RECORD Record Attributes = NULL_BITMAP Record Size = 31 Memory Dump @0x61ADC09E 00000000: 10001c00 03000000 58005800 58005800 †........X.X.X.X.
00000010: 20002000 20002000 20002000 020000†††† . . . . . .... OFFSET TABLE: Row - Offset
2 (0x2) - 158 (0x9e)
1 (0x1) - 127 (0x7f)
0 (0x0) - 96 (0x60)

套用上面的公式:

计算公式:Row_Size = Fixed_Data_Size + Variable_Data_Size + Null_Bitmap + 4

= 所有固定长度列的总字节大小 + 可变长度数据的大小 + Null位图 + 数据行的行标题开销

计算过程:

Fixed_Data_Size = 所有固定长度列的总字节大小 = 4+10*2(int大小为4个字节,nchar(10)固定大小为20个字节)

Variable_Data_Size = 2 + (Num_Variable_Cols x 2) + Max_Var_Size

  Num_Variable_Cols = 可变长度列数 = 0(没有可变长度列)

  Max_Var_Size = 所有可变长度列的最大总字节大小 = 0

Variable_Data_Size = 0(如果没有可变长度列,请将 Variable_Data_Size 设置为 0)

Null_Bitmap = 2 + ((Num_Cols + 7) / 8)

  Num_Cols = 总列数(固定长度和可变长度)= 2(id、names两个列)

  Null_Bitmap = 3(只保留整数部分,放弃所有余数)

Row_Size = Fixed_Data_Size + Variable_Data_Size + Null_Bitmap + 4

  = + 0 + 3 +4 = 31(与上面Record Size = 31符合)

  总结:从上面测试结果来看:char(10)与nchar(10)是固定长度数据类型,无论你保存多少内容,在数据页中会为记录保留固定长度的空间,而char(10)与nchar(10)的区别是nchar(10)占用的空间是char(10)的两倍;

(七) 接下来,我们来看看HeapPage_nvarchar表的存储大小又有什么不同:

--查看表HeapPage_nvarchar
DBCC ind(RecordSize_DB,HeapPage_nvarchar,-1)

(Figure7:堆表HeapPage_nvarchar)

--查看PAGE信息
DBCC PAGE(RecordSize_DB,1,94,1)
DATA:
Slot 0, Offset 0x60, Length 19, DumpStyle BYTE Record Type = PRIMARY_RECORD Record Attributes = NULL_BITMAP VARIABLE_COLUMNS
Record Size = 19
Memory Dump @0x61ADC060 00000000: 30000800 01000000 02000001 00130058 †0..............X
00000010: 005800†††††††††††††††††††††††††††††††.X. Slot 1, Offset 0x73, Length 23, DumpStyle BYTE Record Type = PRIMARY_RECORD Record Attributes = NULL_BITMAP VARIABLE_COLUMNS
Record Size = 23
Memory Dump @0x61ADC073 00000000: 30000800 02000000 02000001 00170058 †0..............X
00000010: 00580058 005800††††††††††††††††††††††.X.X.X. Slot 2, Offset 0x8a, Length 23, DumpStyle BYTE Record Type = PRIMARY_RECORD Record Attributes = NULL_BITMAP VARIABLE_COLUMNS
Record Size = 23
Memory Dump @0x61ADC08A 00000000: 30000800 03000000 02000001 00170058 †0..............X
00000010: 00580058 005800††††††††††††††††††††††.X.X.X. OFFSET TABLE: Row - Offset
2 (0x2) - 138 (0x8a)
1 (0x1) - 115 (0x73)
0 (0x0) - 96 (0x60)

套用上面的公式:

计算公式:Row_Size = Fixed_Data_Size + Variable_Data_Size + Null_Bitmap + 4

= 所有固定长度列的总字节大小 + 可变长度数据的大小 + Null位图 + 数据行的行标题开销

计算过程:

Fixed_Data_Size = 所有固定长度列的总字节大小 = 4(int大小为4个字节)

Variable_Data_Size = 2 + (Num_Variable_Cols x 2) + Max_Var_Size

  Num_Variable_Cols = 可变长度列数 = 1(names列的数据类型是nvarchar)

  Max_Var_Size = 所有可变长度列的最大总字节大小 = 第一行记录是2*2;第二、三行记录是2*4

  第一行记录Variable_Data_Size = 2 + (1 * 2) + (2*2) = 8

  第二、三行记录Variable_Data_Size = 2 + (1 * 2) + (2*4) = 12

Null_Bitmap = 2 + ((Num_Cols + 7) / 8)

  Num_Cols = 总列数(固定长度和可变长度)= 2(id、names两个列)

  Null_Bitmap = 2 + ((2 + 7) / 8) = 3(只保留整数部分,放弃所有余数)

Row_Size = Fixed_Data_Size + Variable_Data_Size + Null_Bitmap + 4

  第一行记录Row_Size = 4 + 8 + 3 + 4 = 19(与上面第一行记录Record Size = 19符合)

  第二、三行记录Row_Size = 4 + 12 + 3 + 4 = 23(与上面第二、三行记录Record Size = 23符合)

  总结:从上面结果来看:nvarchar(10)是变长度数据类型,你输入字符串有多少就存储多少内容,这就是定长数据类型与变长数据类型的区别,从第一行记录(占用19 Bytes)与第二、三行记录(占用23 Bytes)占用了不同的数据空间可以证实这一点;而nchar(10)与nvarchar(10)一样,都属于Unicode编码,所以占用的空间是非Unicode编码的2倍;

五.参考文献(References)

估计堆的大小

估计数据库的大小

SQL SERVER单页数据存储行数计算

SQL Server页中行物理存储

SQL Server计算数据库中表、堆、聚集索引和非聚集索引的大小

SQL Server 2008连载之存储结构

Stairway to SQL Server Indexes(中文:SQL Server索引进阶

SQL Server 堆表行存储大小(Record Size)的更多相关文章

  1. SQL Server 堆表与栈表的对比(大表)

    环境准备 使用1个表,生成1000万行来进行性能对比(勉强也算比较大了),对比性能差别. 为了简化过程,不提供生成随机数据的过程.该表初始为非聚集索引(堆表),测试过程中会改为聚集索引(栈表). CR ...

  2. 一种快速统计SQL Server每个表行数的方法

    转载自:http://www.cnblogs.com/kenyang/archive/2013/04/09/3011447.html 我们都知道用聚合函数count()可以统计表的行数.如果需要统计数 ...

  3. SQL Server索引 (原理、存储)聚集索引、非聚集索引、堆 <第一篇>

    一.存储结构 在SQL Server中,有许多不同的可用排列规则选项. 二进制:按字符的数字表示形式排序(ASCII码中,用数字32表示空格,用68表示字母"D").因为所有内容都 ...

  4. SQL Server创建表超出行最大限制解决方法

    问题的现象在创建表A的时候,出现“信息 511,级别 16,状态 1,第 5 行  无法创建大小为 的行,该值大于允许的最大值 8060.”的信息提示.很奇怪,网上查了一下,是因为要插入表的数据类型的 ...

  5. 统计sql server 2012表的行数

    --功能:统计sql server 2012表的行数 SELECT a.name, a.object_id, b.rows, b.index_id FROM sys.tables AS a INNER ...

  6. SQL Server 深入解析索引存储(下)

    标签:SQL SERVER/MSSQL SERVER/数据库/DBA/索引体系结构/非聚集索引 概述 非聚集索引与聚集索引具有相同的 B 树结构,它们之间的显著差别在于以下两点: 基础表的数据行不按非 ...

  7. 千万级SQL Server数据库表分区的实现

    千万级SQL Server数据库表分区的实现 2010-09-10 13:37 佚名 数据库 字号:T | T 一般在千万级的数据压力下,分区是一种比较好的提升性能方法.本文将介绍SQL Server ...

  8. SQL Server 深入解析索引存储(非聚集索引)

    标签:SQL SERVER/MSSQL SERVER/数据库/DBA/索引体系结构/非聚集索引 概述 非聚集索引与聚集索引具有相同的 B 树结构,它们之间的显著差别在于以下两点: 基础表的数据行不按非 ...

  9. Sql server 系统表

    sql server系统表详细说明 SQL Server 用户库中系统表说明 名称 说明 备注 syscolumns 每个表和视图中的每列在表中占一行,存储过程中的每个参数在表中也占一行.   sys ...

随机推荐

  1. ie6,ie7,ie8 css bug兼容解决方法

    IE浏览器以不支持大量的css 属性出名,同时也因其支持的css属性中存在大量bug. 这里收集了好多的bug以及其解决的办法,都在这个文章里面记录下来了!希望以后解决类似问题的时候能够快速解决,也希 ...

  2. 有关DOM

    一般地,节点至少拥有nodeType.nodeName和nodeValue这三个基本属性. 节点类型不同,这三个属性的值也不相同 nodeType nodeType属性返回节点类型的常数值.不同的类型 ...

  3. DB2数据库参数建议(AIX)

    修改用户最大进程数: chdev -l sys0 -a maxuproc=' 用户资源配置:对实例用户,fence用户,应用用户添加如下限制: db2inst1 : fsize=- fsize_har ...

  4. 我听说 C...

    我听说在 c 语言的世界里,goto 和异常处理都是声名狼藉的东西,而我认为它们在一起就能化解各自的问题.

  5. php 搜索(查询)功能

    今天遇到一个问题:在做“搜索”功能时,输入查询条件后查询不了. 我做的是首页显示数据表package中的内容,但是有个条件,显示在首页的内容还必须是 :字段status=0,且printing=0的数 ...

  6. C#程序员开发WinForm必须知道的 Window 消息大全

    不要以为下面的东西只有C++中才会用到哦! 消息,就是指Windows发出的一个通知,告诉应用程序某个事情发生了.例如,单击鼠标.改变窗口尺寸.按下键盘上的一个键都会使Windows发送一个消息给应用 ...

  7. 纯CSS3制作超级漂亮又实用的加载小图标

    先来一张各种效果的预览图,其实代码并不复杂,关键看自己如何运用. <!doctype html> <head> <meta charset="utf-8&quo ...

  8. ARM 编译 phddns

    参考博文http://bluegemyf.blog.163.com/blog/static/11816340201310472751513/ 1.安装必要的开发包 sudo apt-get  inst ...

  9. SqlServer存储过程模板

    create procedure [spname]([spvariable])asbegin begin transaction begin try  --具体sql过程  commit; end t ...

  10. 游戏编程技巧 - Type Object

    Type Object 使用场景 你在制作一款和LOL类似的游戏,里面有许多英雄,因此你想建立一个英雄基类,然后把各种英雄都继承自该基类,这些英雄类都有生命值和攻击力等属性.每次策划想增加一个英雄,你 ...