sql server 大数据处理

对SQL Server数据表进行分区的过程分为三个步骤：

　　1)建立分区函数

　　2)建立分区方案

　　3)对表格进行分区

　　第一个步骤：建立分区函数

　　分区函数定义[u]how[/u]，即你想要SQL Server如何对数据进行分区。这里就不以某一个表格作为例子，而是总体概括分割数据的技术。

　　分区是通过指定每个分区的分割界线实现的。例如，假定我们有一个Customers表格，里面包含了企业所有的客户的信息，客户信息以唯一的客户号进行辨识，客户号从1到1000000。我们可以运用以下的分区函数(这里称之为customer_Partfunc)把这个表格平均分为四个分区：

　　CREATE PARTITION FUNCTION customer_partfunc (int)
　　AS RANGE RIGHT
　　FOR VALUES (250000, 500000, 750000)

　　这些分割界线指定了四个分区。第一个分区包含所有值小于250000的记录。第二个分区包含所有值在250000和499999之间的记录。而第三个分区包含所有值在500000和749999之间的记录。其他所有大于或等于750000的记录都包含在第四个分区里。

　　注意这个例子中使用了“RANGE RIGHT”从句。这说明分界值是在分区的右边。同样，如果使用的是“RANGE LEFT”从句，那么第一个分区就会包含所有值小于或等于250000的记录;第二个分区就会包含所有值在250001和500000之间的记录，如此类推。

　　第二个步骤：建立分区方案

　　一旦建立完定义如何对数据进行分区的分区函数之后，下一步就是建立一个分区方案，定义[u]where[/u]，即你想在哪里对数据进行分区。这是一个很直接明了的过程，例如，如果我有四个文件组，名称分别从“fg1”到“fg4”，那么就可以使用以下分区方案：

　　CREATE PARTITION SCHEME customer_partscheme
　　AS PARTITION customer_partfunc
　　TO (fg1, fg2, fg3, fg4)

　　注意我们现在把一个分区函数连接到了分区方案，但是我们还没有把分区方案连接到任何具体的数据库表格。这就是重复使用功能发挥功能的时候。我们可以通过这个功能把分区方案(或者只是分区函数)用于数据库表格的任何数据上。

　　第三个步骤：对表格进行分区

　　建立好分区方案之后，就可以开始对表格进行分区了。这是最简单的一个步骤，只需要在表格创建语句中添加“ON”从句，指定表格分区方案和要应用该分区方案的表列。你不需要指定分区函数，因为分区方案已经定义了分区函数。

　　举个例子，假设你想要用上述的分区方案来创建一个客户表格，你需要使用以下Transact-SQL语句：

　　CREATE TABLE customers (FirstName nvarchar(40), LastName nvarchar(40), CustomerNumber int)
　　ON customer_partscheme (CustomerNumber)

sql server 大数据处理的更多相关文章

SQL Server 大数据搬迁之文件组备份还原实战
一.本文所涉及的内容(Contents) 本文所涉及的内容(Contents) 背景(Contexts) 解决方案(Solution) 搬迁步骤(Procedure) 搬迁脚本(SQL Codes) ...
C# & SQL Server大数据量插入方式对比
以下内容大部分来自: http://blog.csdn.net/tjvictor/article/details/4360030 部分内容出自互联网,实验结果为亲测. 最近自己开发一个向数据库中插入大 ...
[转]Sql server 大数据量分页存储过程效率测试附代码
本文转自:http://www.cnblogs.com/lli0077/archive/2008/09/03/1282862.html 在项目中,我们经常遇到或用到分页,那么在大数据量(百万级以上)下 ...
Microsoft Soft SQL Server 大数据----分区表性能测试
分区表 MSSQL有一个大数据储存方案,可以提高效率那就是分区表. 使用起来跟普通表没有区别.至于具体原理自己度娘吧. 真正性能的提高,是依赖于硬件的加入.也是就说,当把一个表设置成分区表,每一个分区 ...
SQL Server 大数据量insert into xx select慢的解决方案
最近项目有个需求,把一张表中的数据根据一定条件增删改到另外一张表.按理说这是个很简单的SQL.可是在实际过程中却出现了超级长时间的执行过程. 后来经过排查发现是大数据量insert into xx s ...
SQL Server 大数据量分页建议方案
简单的说就是这个 select top(20) * from( select *, rowid = row_number() over(order by xxx) from tb with(noloc ...
sql server 大数据，统计分组查询，数据量比较大计算每秒钟执行数据执行次数
-- 数据量比较大的情况,统计十分钟内每秒钟执行次数 ); -- 开始时间 ); -- 结束时间 declare @num int; -- 结束时间 set @begintime = '2019-08 ...
清理ms sql server 大日志文件数据
1.手动分离数据库: 2.手动删除日志文件: 3.重新生成日志文件: CREATE DATABASE FMIS0 ON (FILENAME = 'E:\FMIS0_DATA\FMIS0-Date') ...
SQL SERVER大数据分页
select * from (select rownum r, a.* from (select * from table_name order by ndatetime desc ) a wher ...

随机推荐

【spring boot 系列】spring data jpa 全面解析（实践 + 源码分析）
前言本文将从示例.原理.应用3个方面介绍spring data jpa. 以下分析基于spring boot 2.0 + spring 5.0.4版本源码概述 JPA是什么? JPA (Java ...
Codeforces908G. New Year and Original Order
给n<=10^700,问1到n中每个数在各数位排序后得到的数的和.答案膜1e9+7. 一看就是数位DP啦..然而并没有什么思路.. 可以尝试统计n(i,j)表示数j在第i位的出现次数,知道了这个 ...
SOJ 3531_Number Pyramids
[题意]给定一个数top及最底层元素个数n,构成一个以给top为塔尖,层数为n的如杨辉三角的金字塔,求有多少种 [分析]最终种数其实只与最底层的n个数的组合数有关,上层的每个都数是由最底层数相加得来 ...
Caocao's Bridges-HDU4738(Tarjin+求桥)
http://acm.hdu.edu.cn/showproblem.php?pid=4738 题目大意: 给定n个点和m条边和每条边的价值,求桥的最小价值(最小桥) 看着挺简单的但是有好多细节: ...
Remove Duplicates from Sorted List （链表）
Given a sorted linked list, delete all duplicates such that each element appear only once. For examp ...
选择器的使用(empty选择器)
<!DOCTYPE html><html xmlns="http://www.w3.org/1999/xhtml"><head><meta ...
list去掉重复元素
需求: 有list 里面含有重复元素,要求去掉重复元素: solution 1: >>> a [1, 2, 2, 1, 3, 4, 5, 6, 5] >>> set ...
dubbo的jmeter压测时jar包的热加载/动态加载
在做dubbo的jmeter压测时,需要把jar包放入jmeter的lib/ext目录下,但是jmeter启动的时候会自动加载这个目录lib目录及lib/ext目录,这样启动后放入这些目录下的jar包 ...
百度编辑器ueditor给上传的图片加入水印
百度编辑器本身是没有为上传图片加入水印的功能,想要在上传的时候加入图片水印,也非常easy.以 ueditor 1.2.6 为例.打开php文件夹以下的imageUp.php文件,查找"$i ...
spring中编程式事务控制
step1:配置xml文件  <bean id="transactionManager" class="org.spr ...

sql server 大数据处理

sql server 大数据处理的更多相关文章

随机推荐

热门专题