sql server 存储机制

1、区段

　　区段(extent)是用来为表和索引分配空间的基本存储单元。它由8个连续的64KB数据页组成。

　　基于区段(而不是实际使用空间)分配空间的概念的要点：

　　一旦区段已满，那么下一记录将要占据的空间不是记录的大小，而是整个新区段的大小。一次分配一个区段而不是分配一个记录。
　　通过预分配空间，SQL Server节省为每个记录分配新空间的时间。

　向当前分配的区段添加了过多的行就要占用整个区段，看起来是一种浪费，但是这种方法浪费的空间不多。但是，这些浪费的空间会累加，特别是在碎片较多的环境中。

　　占据所有空间的好处是SQL Server省去了一些分配时间的系统开销，不需在每次写入行时都考虑分配问题，SQL Server仅仅当需要新区段时才处理额外的空间分配。

　　不要将区段占用的空间和数据库占用的空间想混淆，分配给数据库的那些空间就是磁盘驱动器将要减少的可用空间。区段仅仅是在又数据库保留的整个空间内再次进行分配的方式。

　　2、页

　　页是特定区段中的分配单元。每个区段包含8页。

　　也是在到达实际数据行前所能达到的最后一个存储级别。尽管每个区段中的页数是固定的，但是每一页中的行数不是固定的。这取决于行的大小，而行的大小是可以变化的。可以把页看做是表行和索引行数据的容器。通常不允许跨行。

　　常用的页类型：

　　1、数据页：数据也是不需解释的-它们是表中的实际数据，但任何没有用text in row选项、varchar(max)或varbinary(max)定义的BLOB数据除外。

　　2、索引页：索引页也是相当直观-它们既包括非群集索引的非页级和页级页，又包括群集索引的非页级页。

　　在SQL SERVER中，存储的最小单位是页。SQL SERVER对于页的读取，要么整个读取，要么完全不读取，没有折中。

　　数据库页的大小是8K，实际能够存储的数据量为1024*8=8192-页头(96)-行偏移(36)=8060字节。

　　页拆分

　　当页满时，它会进行拆分。这意味着多个新页被分配-也意味着现有页上又近半的数据被移到新页上。

　　在使用群集索引时，会有例外。如果有一个群集索引，并且下一个插入的记录在物理上将作为表中的最后一个记录，那么创建一个新页，然后将该新行添加到这个新页中，而不需要重新定位任何现有数据。

　　3、行

　　行就是表中的一行记录。行最大可达8KB。除了8060字符限制外，还有最大1024标准列(非稀疏列)的限制，列就是表的一列数据，就是你理解的列。实际上，突破8060字符限制前用完列的情况不多见。1024提供了小于8字节的平均列宽度。1024个列，一个表通常才十几个列啊。当突破了1024个列时，就要运用到稀疏列。

　　4、稀疏列

　　稀疏列是SQL Server2008新引入的一种特殊的数据结构。它们主要用于处理重复的场景，其中的列只是偶尔会用到。大部分时候为空。许多时候，一旦遇到少量这类列，就意味着以后可能会遇到大量这类列。使用稀疏列，可以将单个表中允许的列的总数提高到30000。30000个列，什么概念？什么系统用得到这么多列。

　　Image、text、ntext、geography、geometry、timestamp和所有用户自定义数据类型不能被标记为稀疏列。

在SQL Server中，数据的存储以页为单位。八个页为一个区。一页为8K，一个区为64K,这个意味着1M的空间可以容纳16个区。如图1所示：

图1.SQL Server中的页和区

如图1（PS:发现用windows自带的画图程序画博客中的图片也不错）可以看出，SQL Server中的分配单元分为三种，分别为存储行内数据的In_Row_Data，存储Lob对象的LOB_Data,存储溢出数据的Row_Overflow_data。下面我们通过一个更具体的例子来理解这三种分配单元。

我建立如图2所示的表。

图2.测试表

图2的测试表不难看出，通过插入数据使得每一行的长度会超过每页所能容纳的最大长度8060字节。使得不仅产生了行溢出(Row_Overflow_Data)，还需要存储LOB的页.测试的插入语句和通过DBCC IND看到的分配情况如图3所示。

图3.超过8060字节的行所分配的页

除去IAM页，这1行数据所需要三个页来存储。首先是LOB页，这类是用于存储存在数据库的二进制文件所设计，当这个类型的列出现时，在原有的列会存储一个24字节的指针，而将具体的二进制数据存在LOB页中，除去Text之外，VarBinary(max)也是存在LOB页中的。然后是溢出行，在SQL Server 2000中，一行超过8060字节是不被允许的，在SQL Server 2005之后的版本对这个特性进行了改进，使用Varchar,nvarchar等数据类型时，当行的大小不超过8060字节时，全部存在行内In-row data,当varchar中存储的数据过多使得整行超过8060字节时，会将额外的部分存于Row-overflow data页中，如果update这列使得行大小减少到小于8060字节，则这行又会全部回到in-row data页。

sql server 存储机制的更多相关文章

SQL Server存储机制
1.区段区段(extent)是用来为表和索引分配空间的基本存储单元.它由8个连续的64KB数据页组成. 基于区段(而不是实际使用空间)分配空间的概念的要点: 一旦区段已满,那么下一记录将要占据的空间 ...
SQL Server存储机制二
http://blog.csdn.net/ltylove2007/article/details/21084585 http://www.cnblogs.com/anding/p/3254674.ht ...
SQL SERVER存储引擎——04.数据
4. SQL SERVER存储引擎之数据篇 (4.1)文件 (0)主数据文件.mdf初始文件大小至少为3MB,次要数据文件.ndf初始大小,同日志文件一样至少为512KB: (1)SQL SERVER ...
SQL Server存储ntext截断问题
SQL Server存储ntext截断问题最近遇到一个问题:将大文本存储到数据库的时候,查询出来的文本却被截断了. 最后百度发现,作者提出 sql server management studi ...
转一篇关于sql server 三种恢复模式的文章，从sql server 的机制上来写的，感觉很不错，转了
简介 SQL Server中的事务日志无疑是SQL Server中最重要的部分之一.因为SQL SERVER利用事务日志来确保持久性(Durability)和事务回滚(Rollback).从而还部分确 ...
SQL Server 锁机制悲观锁乐观锁实测解析
先引入一些概念,直接Copy其他Blogs中的,我就不单独写了. 一.为什么会有锁多个用户同时对数据库的并发操作时会带来以下数据不一致的问题: 1.丢失更新 A,B两个用户读同一数据并进行修改,其中 ...
SQL Server 存储中间结果集
在SQL Server中执行查询时,有一些操作会产生中间结果集,例如:排序操作,Hash Join和Hash Aggregate操作产生的Hash Table,游标等,SQL Server查询优化器使 ...
SQL Server 存储(1/8)：理解数据页结构
我们都很清楚SQL Server用8KB 的页来存储数据,并且在SQL Server里磁盘 I/O 操作在页级执行.也就是说,SQL Server 读取或写入所有数据页.页有不同的类型,像数据页,GA ...
SQL Server 存储(3/8)：理解GAM和SGAM页
我们知道SQL Server在8K 的页里存储数据.分区就是物理上连续的8个页.当我们创建一个数据库,数据文件会被逻辑分为页和区,当用户对象创建时,页会分配给它用来存储数据.GAM(Global Al ...

随机推荐

android中：/system/bin/sh: : No such file or directory错误
将一个raspberry下编译好的可执行文件放在android的system/bin下,修改为777权限,运行,出现下面的错误: /system/bin/sh: XXX: No such file o ...
【Java知识点专项练习】之接口和抽象类的区别
接口和抽象类的区别接口(interface)可以说成是抽象类的一种特例,接口中的所有方法都必须是抽象的.接口中的方法定义默认为public abstract类型,接口中的成员变量类型默认为publi ...
Qt——布局管理器
教程地址运行截图: 代码: #include "mainwindow.h" #include <QApplication> #include <QHBoxLay ...
purge recyclebin之后dba_segments仍然有BIN$段
现象: purge recyclebin之后dba_segments仍然有BIN$段. 如下,执行了purge recyclebin之后: SQL> select segment_name,SE ...
Dropbox 在 Ubuntu 上需要认证授权的问题
在 Ubuntu 上,通过 Ubuntu软件中心搜索下载安装了 Dropbox . 运行时,弹出如下图的提示. 输入密码,点击授权后,没有出现 Dropbox 的运行界面. 再次点击运行,仍会出 ...
Ubuntu16.04安装Mono、MonoDevelop运行C#代码
Ubuntu16.04安装MonoDevelop运行C#代码在Ubuntu上安装Mono 运行下面代码授权注册repo源并更新软件列表: Add the Mono repository to you ...
ngnix +tomcat7 简单配置
1.下载tomcat7 修改conf 文件夹下的server.xml文件 1.<Server port="8205" shutdown="SHUTDOWN" ...
理解proc目录与linux进程、ps命令、netstat命令的关系
零.proc目录简介 proc目录是虚拟文件系统(VFS)的一种实现,保存了进程信息(pid目录)和一些系统信息. 一.系统的信息 1.cpuinfo和meminfo两个文件查看CPU和内存相关信息 ...
ELK系列六：Logstash的Filter模块
Date过滤 input { stdin{ codec => plain } } filter { date { match => ["message", " ...
如何防御mimikatz致敬Mimikatz攻防杂谈学习笔记
零.绪论:mimikatz简介 mimikatz是一款出色的内网渗透工具,可以抓取windows主机的明文密码.NTLMhash值或者kerberos对应的缓存凭据.mimikatz的使用在获取权限后 ...

sql server 存储机制

sql server 存储机制的更多相关文章

随机推荐

热门专题