Distributed3：SQL Server 分布式数据库性能测试

我在三台安装SQL Server 2012的服务器上搭建分布式数据库，把产品环境中一年近1.4亿条数据大致均匀地存储在这三台服务器中，每台Server 存储4个月的数据，物理机的系统配置基本相同：内存16G，双核 CPU 3.6GHz，软件环境是Windows Server 2012 R，和SQL Server 2012。

1，创建水平分区视图

基础表是dbo.Commits，每个基础表大致存储4个月的数据，近5000万条记录：

CREATE TABLE [dbo].[Commits]

(

    [CommitID] [bigint] IDENTITY(1,1) NOT FOR REPLICATION NOT NULL,

    [AuthorID] [bigint] NOT NULL,

    [CreatedDate] [datetime2](7) NOT NULL,

    [CreatedDateKey] [int] NOT NULL,

 CONSTRAINT [PK__Commits_CommitID] PRIMARY KEY CLUSTERED

(

    [CommitID] ASC,

    [CreatedDateKey] ASC

)

)

创建分区视图，Linked Server的Alias是db2 和 db3，Catalog 是 tdw（test data warehouse）：

CREATE view [dbo].[view_commits]

as

select [CommitID]

      ,[AuthorID]

      ,[CreatedDate]

      ,[CreatedDateKey]

from dbo.commits c with(nolock)

where c.[CreatedDateKey] between 20150900 and 20160000

union ALL

select [CommitID]

      ,[AuthorID]

      ,[CreatedDate]

      ,[CreatedDateKey]

from db3.tdw.dbo.commits c with(nolock)

where c.[CreatedDateKey] between 20150000 and 20150500

union ALL

select [CommitID]

      ,[AuthorID]

      ,[CreatedDate]

      ,[CreatedDateKey]

from db2.tdw.dbo.commits c with(nolock)

where c.[CreatedDateKey] between 20150500 and 20150900

WITH check OPTION;

GO

2，查询性能测试

Test1，在基础表上测试，基础表是全部的数据，cost：79s

select count(0)

from dbo.commits_total c  with(nolock)

where day(c.[CreatedDate])=1

Test2，使用分区视图测试，cost=134s，比Test1的查询性能明显降低。

select count(0)

from dbo.view_commits c  with(nolock)

where day(c.[CreatedDate])=1

3，使用OpenQuery查询

OpenQuery把查询语句直接发送到Linked Server上执行，返回查询的结果，cost:105s，还是很高，相对提高20%的性能。

select sum(t.cnt) as cnt

from

(

    select count(0) as cnt

    from dbo.commits c  with(nolock)

    where day(c.[CreatedDate])=1

    UNION all

    select p.cnt

    from openquery(db2,

    N'select count(0) as cnt

    from dbo.commits c  with(nolock)

    where day(c.[CreatedDate])=1') as p

    UNION all

    select p.cnt

    from openquery(db3,

    N'select count(0) as cnt

    from dbo.commits c  with(nolock)

    where day(c.[CreatedDate])=1') as p

) as t

4，使用C# 多线程编程

创建三个Task同时运行在三台Server上，Cost：28s

static void Main(string[] args)

{

    List<Task> tasks = new List<Task>();

    int c1=, c2=, c3=;

    Task t1 = new Task(()=>

    {

        c1= GetCount("xxx");

    });

    Task t2 = new Task(() =>

    {

        c2=  GetCount("xxx");

    });

    Task t3 = new Task(() =>

    {

        c3= GetCount("xxx");

    });

    tasks.Add(t1);

    tasks.Add(t2);

    tasks.Add(t3);

    Stopwatch sw = new Stopwatch();

    sw.Start();

    t1.Start();

    t2.Start();

    t3.Start();

    Task.WaitAll(tasks.ToArray());

    int sum = c1 + c2 + c3;

    sw.Stop();

    Console.Read();

}

static int GetCount(string str)

{

    using (SqlConnection con = new SqlConnection(str))

    {

        con.Open();

        var cmd = con.CreateCommand();

        cmd.CommandText = @" select count(0) as cnt

        from dbo.commits c  with(nolock)

        where day(c.[CreatedDate]) = 1";

        int count = (int)cmd.ExecuteScalar();

        con.Close();

        return count;

    }

}

5，结论

将数据水平切分，分布式部署在不同的SQL Server上，其查询性能并不一定比单一DB性能更好。
使用OpenQuery函数将查询语句在Remote Server上执行，返回查询结果，能够优化Linked Server 的查询性能。
在使用分布式数据库查询数据时，针对特定的应用，编写特定的代码，这需要fore-end 更多的参与。

参考doc：

Top 3 Performance Killers For Linked Server Queries

[翻译]——SQL Server使用链接服务器的5个性能杀手

Distributed3：SQL Server 分布式数据库性能测试的更多相关文章

Distributed4：SQL Server 分布式数据库性能测试
我使用三台SQL Server 2012 搭建分布式数据库,将一年的1.4亿条数据大致均匀存储在这三台Server中,每台Server 存储4个月的数据,Physical Server的配置基本相同, ...
SQL Server分布式数据库技术(LinkedServer,CT,SSB)
SQL Server自定义业务功能的数据同步在不同业务需求的驱动下,数据库的模块化拆分将会面临一些比较特殊的业务逻辑处理需求.例如,在数据库层面的数据同步需求.同步过程中,可能会有一些比较复杂的业务 ...
SQL Server 2012 数据库笔记
慕课网首页实战路径猿问手记 Python 手记 \ SQL Server 2012 数据库笔记 SQL Server 2012 数据库笔记 2016-10-25 16:29:33 1 ...
SQL Server 2008 数据库镜像部署实例之一数据库准备
SQL Server 2008 数据库镜像部署实例之一数据库准备一.目标利用Sql Server 2008 enterprise X64,建立异步(高性能)镜像数据库,同时建立见证服务器实现自动 ...
SQL SERVER 分布式事务(DTC)
BEGIN DISTRIBUTED TRANSACTION指定一个由 Microsoft 分布式事务处理协调器 (MS DTC) 管理的 Transact-SQL 分布式事务的起始. 语法BEGIN ...
Microsoft SQL server 2012数据库学习总结（一）
一.Microsoft SQL Server2012简介 1.基本概要 Microsoft SQL Server 2012是微软发布的新一代数据平台产品,全面支持云技术与平台,并且能够快速构建相应的解 ...
让PDF.NET支持不同版本的SQL Server Compact数据库
最近项目中需要用到嵌入式数据库,我们选用的数据开发框架是PDF.NET(http://www.pwmis.com/SqlMap/),之前的博文已经总结了让PDF.NET支持最新的SQLite,今天我们 ...
Linux下使用FreeTDS访问MS SQL Server 2005数据库(包含C测试源码)
Linux下使用FreeTDS访问MS SQL Server 2005数据库(包含C测试源码) http://blog.csdn.net/helonsy/article/details/7207497 ...
如何转换SQL Server 2008数据库到SQL Server 2005
背景介绍: 公司一套系统使用的是SQL SERVER 2008数据库,突然一天收到邮件,需要将这套系统部署到各个不同地方(海外)的工厂,需要在各个工厂部署该数据库,等我将准备工作做好,整理文档 ...

随机推荐

Configuration Manager 和内容位置（包源文件）
Configuration Manager 2007 中的内容位置涉及 Configuration Manager 2007 客户端如何查找播发和软件更新的包源文件.当客户端需要查找内容时,它会将内容 ...
linux在当前目录下根据文件名查找文件
grep -rl "python" ./ 查找./目录下文件名中包含python的文件 find | grep luoluo将当前目录下(包括子目录)的文件名中含有luoluo的文 ...
如何避免HBase写入过快引起的各种问题
首先我们简单回顾下整个写入流程 client api ==> RPC ==> server IPC ==> RPC queue ==> RPC handler ==> w ...
剑指offer 09变态跳台阶
一只青蛙一次可以跳上1级台阶,也可以跳上2级……它也可以跳上n级.求该青蛙跳上一个n级的台阶总共有多少种跳法. java版本: public class Solution { public stati ...
Sublime Text3 使用总结
一.简介: Sublime Text 3是一款强大而精巧的文本编辑器 [点击下载].它的界面友好.功能非凡.性能极佳可令代码高亮.语法提示.自动完成更重要的是,它支持众多插件扩展——锦上添花.强之又强 ...
November 24th 2016 Week 48th Thursday
All the bright precious things fade so fast. 所有的光鲜靓丽都敌不过时间. What is permanent? Thoughts and ideas. P ...
sql 模糊查询优化
在sql语句中使用 like模糊查询时,应该尽量避免%%,因为模糊查询是比较慢的,当出现这样的情况时,应该考虑优化. 举个例子:我在表中查询2012 年创建的记录 SELECT * FROM `com ...
用asp连接Access数据库制作简单登陆界面
[题外话:最近做Internet作业,在这写一个适合初学入门的ASP连接ACCESS数据库做登陆界面的简单的例子,以慰藉我一口气把以前做过的系统中的PHP代码全改成ASP代码来临时应付作业的心情... ...
NPOI保存到服务器和导出到客户端
保存到服务器 <a class="easyui-linkbutton" href="javascript:void(0);" onclick=" ...
关于onscroll函数兼容各浏览器的方法分析
关于window.onscroll函数兼容各浏览器的方法分析 1.当前文档的渲染模式是决定onscroll函数兼容性根本原因目前浏览器的排版引擎有三种模式:怪异模式(Quirks mode).接近标 ...

Distributed3：SQL Server 分布式数据库性能测试

Distributed3：SQL Server 分布式数据库性能测试的更多相关文章

随机推荐

热门专题