SQL Server 表分区之水平表分区

什么是表分区？

表分区分为水平表分区和垂直表分区，水平表分区就是将一个具有大量数据的表，进行拆分为具有相同表结构的若干个表；而垂直表分区就是把一个拥有多个字段的表，根据需要进行拆分列，然后根据某一个字段进行关联。

表分区分为以下五个步骤：

1、创建文件组

2、创建数据文件

3、创建分区函数

4、创建分区方案

5、创建分区表

水平表分区

创建文件组：

语法：

-- 创建文件组语法

alter database <数据库名> add filegroup <文件组名>

alter database Test add filegroup GroupOne

alter database Test add filegroup GroupTwo

alter database Test add filegroup GroupThree

alter database Test add filegroup GroupFour

alter database Test add filegroup GroupFive

创建数据文件到指定文件组：

语法：

-- 创建数据文件到指定文件组语法

alter database <数据库名称> add file <文件属性> to filegroup <文件组名称>

<文件属性>

(

    name=文件的逻辑名称,

    filename=文件的物理名称,

    size=文件初始大小,

    filegrowth=文件自动增长量(数值或百分比),

    maxsize=文件增长的最大值

)

alter database Test add file

(

    name=N'OneFile',

    filename=N'D:\DataDB\OneFile.mdf',

    size=3MB,

    filegrowth=10%,

    maxsize=unlimited    -- 无限大小

)

to filegroup GroupOne

alter database Test add file

(

    name=N'TwoFile',

    filename=N'D:\DataDB\TwoFile.mdf',

    size=3MB,

    filegrowth=10%,

    maxsize=unlimited    -- 无限大小

)

to filegroup GroupTwo

alter database Test add file

(

    name=N'ThreeFile',

    filename=N'D:\DataDB\ThreeFile.mdf',

    size=3MB,

    filegrowth=10%,

    maxsize=unlimited    -- 无限大小

)

to filegroup GroupThree

alter database Test add file

(

    name=N'FourFile',

    filename=N'D:\DataDB\FourFile.mdf',

    size=3MB,

    filegrowth=10%,

    maxsize=unlimited    -- 无限大小

)

to filegroup GroupFour

alter database Test add file

(

    name=N'FiveFile',

    filename=N'D:\DataDB\FiveFile.mdf',

    size=3MB,

    filegrowth=10%,

    maxsize=unlimited    -- 无限大小

)

to filegroup GroupFive

创建分区函数：

创建一个分区函数，创建分区函数的目的是告诉 SQL Server 以什么方式对分区表进行分区。

语法：

create partition function    -- 创建分区函数

Part_Fun(int)    -- 分区函数名（分区列类型）

as range [left/right]    -- 左置/右置，即边界值的存储位置，如果设置为右置，边界值存到下一个表

for values ('1000','2000'，'3000'，'4000'，'5000')        -- 设置每个分区表的边界值

create partition function

Part_Fun(int)

as range right

for values ('1000','2000','3000','4000','5000')

删除分区函数：

--删除分区函数语法

drop partition function <分区函数名>

--删除名为 Part_Fun 的分区函数

drop partition function Part_Fun

PS：只有当分区函数没有应用到分区方案中时，指定的分区函数才能被删除。

创建分区方案：

分区方案的作用是将分区函数生成的分区映射到文件组中去。分区函数的作用是告诉SQL Server，如何将数据进行分区，而分区方案的作用则是告诉 SQL Server 将已分区的数据放在哪个文件组中。

语法：

--创建分区方案语法

create partition scheme        -- 创建分区方案

<分区方案名称>    -- 分区方案名称

as partition <分区函数名称>    -- 指定分区函数名称

to (文件组名称,，，，)    -- 指定分区函数划分出来的数据对应存放的文件组

create partition scheme        -- 创建分区方案

Part_Plan    -- 分区方案名称

as partition Part_Fun    -- 分区函数名称

to ('GroupOne','GroupTwo','GroupThree','GroupFour','GroupFive') -- 分区文件组

一执行，结果报错了。

不对呀，我明明建立的是五个分区文件组，分区函数也是分为五份的啊。其实这里的意思应该就是后续数据的问题了，首先不可能保证这个表永远就 5000 条数据的，所以他在这里的意思就是后续数据存储的文件组。这里我把后续数据放在最后一个文件组里面。

create partition scheme        -- 创建分区方案

Part_Plan    -- 分区方案名称

as partition Part_Fun    -- 分区函数名称

to ('GroupOne','GroupTwo','GroupThree','GroupFour','GroupFive','GroupFive') -- 分区文件组

删除分区方案：

--删除分区方案语法

drop partition scheme<分区方案名称>

--删除名为 Part_Plan 的分区方案

drop partition scheme Part_Plan

PS：当没有分区表引用该分区方案时，才能对其进行删除。

创建分区表：

语法：

--创建分区表语法

create table <表名>    -- 表名称

(

    column1        int        not null  primary key nonclustered,    -- 字段名称、字段类型、是否可空、主键约束、非聚集索引

    column2        int        not null

) on <分区方案名>(分区列名)        -- 分区方案的名称（指定要依据分区的列名）

create table US_Info

(

    ID        int        not null    primary key identity(1,1),

    Name    nvarchar(32)    null,

    CreateTime    nvarchar(32)    null

)on Part_Plan(ID)

PS：如果在表中创建有主键、唯一索引、聚集索引，则分区依据列必须为该列之一。即分区依据列必须建立在主键、唯一索引、聚集索引之上。

创建分区索引：

语法：

--创建分区索引语法

create [ unique [ clustered | nonclustered ] ]  -- unique 唯一    clustered 聚集    nonclustered 非聚集

index <索引名称>    -- 指定索引名称

on <表名>(列名)        -- 指定表名（指定列名）

on <分区方案名>(分区依据列名)    -- 分区方案名称（分区依据列名）

create nonclustered

index Part_Non_Name

on US_Info(Name)

on Part_Plan(ID)

在表 US_Info 中插入5000条数据：

declare @I    int

set @I=1

while(@I<=5000)

begin

    insert into US_Info(Name,CreateTime)

    values('名称'+convert(nvarchar,@I),Convert(nvarchar,GETDATE(),121))

    set @I=@I+1

end

select * from US_Info

查询指定值位于数据表哪个分区中：

-- 查询指定值位于数据表哪个分区中

select $partition.Part_Fun('3050')    -- 返回 4，表示位于第四个分区中

查询分区表中，每个分区存在的数据的行数：

--查看分区表中，每个分区存在的数据的行数

select $partition.Part_Fun(ID) as Part_Num,count(1) as R_Count

from US_Info

group by  $partition.Part_Fun(ID)

查询指定分区中的数据：

-- 查询指定分区中的数据

select * from US_Info

where $partition.Part_Fun(ID)=3

拆分分区：

在分区函数中新增一个边界值，即可将 1 个分区拆分为 2 个。

--将第 3 个分区拆分为 2 个分区

alter partition function Part_Fun()

split range(N'2500')

一执行，报错了，拆分不了，因为前面我们已经用分区函数指定了分区和文件组，那就要先添加一个文件组。

为分区方案指定下一个文件组：

-- 添加一个文件组 GroupSix

alter database Test add filegroup GroupSix

-- 添加一个数据文件

alter database Test add file

(

    name=N'SixFile',

    filename=N'D:\DataDB\SixFile.mdf',

    size=3MB,

    filegrowth=10%,

    maxsize=unlimited    -- 无限大小

)

to filegroup GroupSix

-- 为分区方案指定下一个文件组

alter partition scheme Part_Plan  -- 分区方案名称

next used GroupSix    -- 下一个文件组名称

然后再来对分区进行拆分：

--将第 3 个分区拆分为 2 个分区

alter partition function Part_Fun()    -- 分区函数

split range        -- 分割界限

(N'2500')  -- 分区界限值

合并分区：

与拆分分区相反，去除一个边界值即可。

-- 将第 3 个分区与第 4 个分区合并

alter partition function Part_Fun()     -- 分区函数

merge range        -- 合并界限

(N'2500')  -- 合并界限值

复制分区表中的数据到普通表：

复制分区表中的数据到普通表需要满足以下条件：

数据表的结构必须相同，即字段数量、字段类型等，字段与字段之间必须对应。

两个表必须位于同一文件组，所以创建普通表的时候就需要指定文件组。

create table US_Info_back        -- 创建普通表的表名

(

    ID        int        not null    primary key identity(1,1),    -- 列定义

    Name    nvarchar(32)    null,

    CreateTime    nvarchar(32)    null

)on GroupThree    -- 指定文件组

将分区表中的数据复制到普通表：

-- 将分区表 US_Info 中的第 3 个分区的数据复制到普通表 US_Info_back 中

alter table US_Info

switch partition 3

to US_Info_back

select * from US_Info_back

将普通表中的数据复制到分区表：

--将普通表 US_Info_back 中的数据复制到分区表 US_Info 中的第 6 个分区

alter table US_Info_back    -- 普通表名

switch to US_Info    -- 分区表名

partition 6        -- 指定分区

PS：将普通表中的数据复制到分区表时，需要先删除分区表的索引。

将普通表转换为分区表：

当数据库已经存在数据的时候，就不能像上面那样直接建立分区表了，只能将普通表转换为分区表，只需在该普通表上创建一个聚集索引，并在该聚集索引中使用分区方案即可。

如果是已经存在的聚集索引，那么需要删除然后重新建立，并使用分区方案。

现在我有一个现成的表 UserInfo，因为它存在一个主键，而建立主键时，系统会自动为主键列添加聚集索引，因为这个聚集索引没法删除，所以我现在要先删除这个主键，然后重新建立一个主键，并设置为非聚集索引，然后为主键创建一个聚集索引（会覆盖非聚集索引），并使用分区方案指定分区列即可。

-- 根据 指定表名 查询 表的约束

exec sp_helpconstraint UserInfo      -- UserInfo 表名

-- 根据指定主键约束名删除指定表的主键约束

alter table UserInfo drop constraint PK__UserInfo__5A2040BBA6D6767A 

-- 添加主键约束，但设置为非聚集索引

alter table UserInfo add constraint PK__UserInfo__5A2040BBA6D6767A primary key nonclustered (U_Id)

-- 添加一个聚集索引，并使用分区方案指定分区的列

create clustered index CLU_StuNo -- 索引名称

on UserInfo(U_Id)  -- 指定添加索引的表（添加索引的列）

on Part_Plan(U_Id)        -- 分区方案名称（分区依据的列）

为这个表也插入5000条数据，看看效果：

declare @I    int

select @I=U_Id from UserInfo order by U_Id desc

while(@I<=5000)

begin

    insert into UserInfo(U_No,U_Name,U_Pwd)

    values('demo'+convert(nvarchar,@I),'demo'+convert(nvarchar,@I),'40D1C69C7B86064EA140C13CE8ED0E15')

    set @I=@I+1

end

select * from UserInfo

go

查看分区表中，每个分区存在的数据的行数：

--查看分区表中，每个分区存在的数据的行数

select $partition.Part_Fun(U_Id) as Part_Num,count(1) as R_Count

from UserInfo

group by  $partition.Part_Fun(U_Id)

order by Part_Num

查看数据库分区信息 SQL（复制来的）：

SELECT OBJECT_NAME(p.object_id) AS ObjectName,

      i.name                   AS IndexName,

      p.index_id               AS IndexID,

      ds.name                  AS PartitionScheme,

      p.partition_number       AS PartitionNumber,

      fg.name                  AS FileGroupName,

      prv_left.value           AS LowerBoundaryValue,

      prv_right.value          AS UpperBoundaryValue,

      CASE pf.boundary_value_on_right

            WHEN 1 THEN 'RIGHT'

            ELSE 'LEFT' END    AS Range,

      p.rows AS Rows

FROM sys.partitions                  AS p

JOIN sys.indexes                     AS i

      ON i.object_id = p.object_id AND i.index_id = p.index_id

JOIN sys.data_spaces                 AS ds

      ON ds.data_space_id = i.data_space_id

JOIN sys.partition_schemes           AS ps

      ON ps.data_space_id = ds.data_space_id

JOIN sys.partition_functions         AS pf

      ON pf.function_id = ps.function_id

JOIN sys.destination_data_spaces     AS dds2

      ON dds2.partition_scheme_id = ps.data_space_id AND dds2.destination_id = p.partition_number

JOIN sys.filegroups                  AS fg

      ON fg.data_space_id = dds2.data_space_id

LEFT JOIN sys.partition_range_values AS prv_left

      ON ps.function_id = prv_left.function_id AND prv_left.boundary_id = p.partition_number - 1

LEFT JOIN sys.partition_range_values AS prv_right

      ON ps.function_id = prv_right.function_id AND prv_right.boundary_id = p.partition_number

WHERE OBJECTPROPERTY(p.object_id, 'ISMSShipped') = 0

UNION ALL

SELECT

      OBJECT_NAME(p.object_id)    AS ObjectName,

      i.name                      AS IndexName,

      p.index_id                  AS IndexID,

      NULL                        AS PartitionScheme,

      p.partition_number          AS PartitionNumber,

      fg.name                     AS FileGroupName,

      NULL                        AS LowerBoundaryValue,

      NULL                        AS UpperBoundaryValue,

      NULL                        AS Boundary,

      p.rows                      AS Rows

FROM sys.partitions AS p

JOIN sys.indexes AS i ON i.object_id = p.object_id AND i.index_id = p.index_id

JOIN sys.data_spaces AS ds ON ds.data_space_id = i.data_space_id

JOIN sys.filegroups AS fg ON fg.data_space_id = i.data_space_id

WHERE OBJECTPROPERTY(p.object_id, 'ISMSShipped') = 0

ORDER BY ObjectName,IndexID,PartitionNumber

SQL Server 表分区之水平表分区的更多相关文章

SQL Server中查询数据库及表的信息语句
/* -- 本文件主要是汇总了 Microsoft SQL Server 中有关数据库与表的相关信息查询语句. -- 下面的查询语句中一般给出两种查询方法, -- A方法访问系统表,适应于SQL 20 ...
Sql Server中不常用的表运算符之UNPIVOT
在Sql Server中不常用的表运算符之PIVOT中,介绍了PIVOT表运算符,现在来说说与之相对应的另一个表运算符UNPIVOT. 从名字可以看出,这个运算符的作用与PIVOT刚好相反,是将一行的 ...
Sql Server中不常用的表运算符之APPLY(2)
在Sql Server中不常用的表运算符之APPLY(1)中提到,SQL2005中新支持的APPLY的特性:1.可以直接将表表达式(表值函数或者子查询)作为APPLY语句的右表连接左表.2.由于使用A ...
SQL Server查询性能优化——堆表、碎片与索引（二）
本文是对 SQL Server查询性能优化——堆表.碎片与索引(一)的一些总结. 第一:先对 SQL Server查询性能优化——堆表.碎片与索引(一)中的例一的SET STATISTICS IO之 ...
Sql server 浅谈用户定义表类型
1.1 简介 SQL Server 中,用户定义表类型是指用户所定义的表示表结构定义的类型.您可以使用用户定义表类型为存储过程或函数声明表值参数,或者声明您要在批处理中或在存储过程或函数的主体中使用的 ...
SQL Server 2008 查询所有用户表
SQL Server 2008 查询所有用户表的T-SQL语句是: SELECT * FROM sysobjects WHERE [xtype] = 'U' 或者是: SELECT * FROM sy ...
SQL Server中的临时表和表变量
SQL Server中的临时表和表变量作者:DrillChina出处:blog2008-07-08 10:05 在SQL Server的性能调优中,有一个不可比拟的问题:那就是如何在一段需要长时间的 ...
【转载】SQL Server - 使用 Merge 语句实现表数据之间的对比同步
原文地址:SQL Server - 使用 Merge 语句实现表数据之间的对比同步表数据之间的同步有很多种实现方式,比如删除然后重新 INSERT,或者写一些其它的分支条件判断再加以 INSERT ...
Oracle和sql server中复制表结构和表数据的sql语句
在Oracle和sql server中,如何从一个已知的旧表,来复制新生成一个新的表,如果要复制旧表结构和表数据,对应的sql语句该如何写呢?刚好阿堂这两天用到了,就顺便把它收集汇总一下,供朋友们参考 ...

随机推荐

文字编码和Unicode
文字编码和Unicode 说明文字: https://blog.csdn.net/fengzhishang2019/article/details/7859064 Java 程序: https://w ...
转:centos7 安装与使用 postgreSQL
一. 安装与基本说明都非常的详细. https://www.digitalocean.com/community/tutorials/how-to-install-and-use-postgresql ...
HTTPS 原理与证书实践
1.1 网络安全知识 1.1.1 网结安全出现背景网络就是实现不同主机之间的通讯,网络出现之初利用TCP/IP协议簇的相关协议概念,已经满足了互连两台主机之间可以进行通汛的目的,虽然看似简简单单几句 ...
logback-kafka-appender
logback 日志写入kafka队列 logback-kafka-appender Logback incompatibility Warning Due to a bug in logback-c ...
Ubuntu/Centos 系统上安装与配置Apache
一.在线安装: Ubuntu:sudo apt-get install apache2 Centos: sudo yum install apache2 二.安装后的位置: 1.服务地址:/etc/i ...
NGINX proxy_pass 域名解析问题
前两天发现一个问题,当使用proxy_pass的时候,发现域名对应IP是缓存的,这样一旦VIP变化之后,就会报错,下面就来详细分析一下这个问题. 一.问题说明 location = /test { i ...
zip 文件下载函数封装
代码: export default { /** * 下载文件 */ exportFile: (fileUrl) => { if (fileUrl) { let exportFrame = do ...
js setTimeout setInterval 第三个参数说明
1.api setTimeout: https://developer.mozilla.org/zh-CN/docs/Web/API/Window/setTimeout var timeoutID = ...
Java RSA （SHA1withRSA）签名和验签
static { try { SIGNATURE = Signature.getInstance("SHA1withRSA", "BC"); } catch ( ...
Java项目持续集成检查项
1) 检查项:使用Super POM. 2) 检查项:GroupID应该以特定名称开头.3) 检查项:版本号符合规范.版本号必须是三段数字,之后加或不加-SNAPSHOT.4) 检查项 ...

SQL Server 表分区之水平表分区

SQL Server 表分区之水平表分区的更多相关文章

随机推荐

热门专题