问题描述


有序的GUID性能对比,堪比自增ID integer

一个大神告诉我NEWSEQUENTIALID() 在数据迁移的时候会有问题(感谢大神指点),所以我就深挖一下这个函数。

    关于NEWSEQUENTIALID() 的用法 参照  NEWSEQUENTIALID()

NEWSEQUENTIALID 是对 Windows UuidCreateSequential 函数的包装。

https://msdn.microsoft.com/zh-cn/library/ms189786(v=sql.120).aspx

我们系统中对UuidCreateSequential 方法的扩展是这样写的,代码如下:

    public static class GuidExtension
{
[DllImport("rpcrt4.dll", SetLastError = true)]
public static extern int UuidCreateSequential(out Guid guid);
private const int RPC_S_OK = ; public static Guid CreateRpcrt4Guid()
{
Guid guid;
int result = UuidCreateSequential(out guid);
if (result == RPC_S_OK)
{
byte[] guidBytes = guid.ToByteArray();
Array.Reverse(guidBytes, , );
Array.Reverse(guidBytes, , );
Array.Reverse(guidBytes, , ); return new Guid(guidBytes);
}
else
return Guid.NewGuid();
} }

  有以下几个缺点:

  1、暴漏MAC地址:NEWSEQUENTIALID函数最后6个字符是网卡的MAC地址

  可以执行看一下

create table #t
(
id uniqueidentifier not null default newsequentialid()
,name varchar(100)
)
go insert into #t(name)
output inserted.id
values('a')

  2、如果进行数据迁移,到另一台机器上,MAC地址改变就会引起页的争用。

    因为GUID在的SQL Server的值大小的比对是这样的:

with uids as (
select id = 1, uuid = cast ('00000000-0000-0000-0000-010000000000' as uniqueidentifier)
union select id = 2, uuid = cast ('00000000-0000-0000-0000-000100000000' as uniqueidentifier)
union select id = 3, uuid = cast ('00000000-0000-0000-0000-000001000000' as uniqueidentifier)
union select id = 4, uuid = cast ('00000000-0000-0000-0000-000000010000' as uniqueidentifier)
union select id = 5, uuid = cast ('00000000-0000-0000-0000-000000000100' as uniqueidentifier)
union select id = 6, uuid = cast ('00000000-0000-0000-0000-000000000001' as uniqueidentifier)
union select id = 7, uuid = cast ('00000000-0000-0000-0100-000000000000' as uniqueidentifier)
union select id = 8, uuid = cast ('00000000-0000-0000-0010-000000000000' as uniqueidentifier)
union select id = 9, uuid = cast ('00000000-0000-0001-0000-000000000000' as uniqueidentifier)
union select id = 10, uuid = cast ('00000000-0000-0100-0000-000000000000' as uniqueidentifier)
union select id = 11, uuid = cast ('00000000-0001-0000-0000-000000000000' as uniqueidentifier)
union select id = 12, uuid = cast ('00000000-0100-0000-0000-000000000000' as uniqueidentifier)
union select id = 13, uuid = cast ('00000001-0000-0000-0000-000000000000' as uniqueidentifier)
union select id = 14, uuid = cast ('00000100-0000-0000-0000-000000000000' as uniqueidentifier)
union select id = 15, uuid = cast ('00010000-0000-0000-0000-000000000000' as uniqueidentifier)
union select id = 16, uuid = cast ('01000000-0000-0000-0000-000000000000' as uniqueidentifier)
)
select * from uids order by uuid desc

输出结果:

  类似 汉字的三点水偏旁(为了好记)


从这里可以看出,MAC地址对GUID的大小有这最高的决定性,这就导致在数据迁移的时候出问题。

COMB解决方案


COMB 类型的GUID 基本设计思路是这样的:既然GUID数据生成是随机的造成索引效率低下,影响了系统的性能,那么能不能通过组合的方式,保留GUID的前10个字节,用后6个字节表示GUID生成的时间(DateTime),这样我们将时间信息与GUID组合起来,在保留GUID的唯一性的同时增加了有序性,以此来提高索引效率。

前十个字节是通过随机数生成

private static readonly RNGCryptoServiceProvider RandomGenerator = new RNGCryptoServiceProvider();

      byte[] randomBytes = new byte[];
RandomGenerator.GetBytes(randomBytes);

后六个字节用时间生成

      long timestamp = DateTime.UtcNow.Ticks / 10000L;
byte[] timestampBytes = BitConverter.GetBytes(timestamp); if (BitConverter.IsLittleEndian)
{
Array.Reverse(timestampBytes);
}

最后组合起来

    byte[] guidBytes = new byte[];
Buffer.BlockCopy(randomBytes, , guidBytes, , );
Buffer.BlockCopy(timestampBytes, , guidBytes, , ); return new Guid(guidBytes);

这个解决方法是被大家所认可的,唯一感觉不好的地方是,在快速获取很多的GUID的时候,时间是一样的,加上随机生成的数据,这一组数据是大小不一的。假如数据库里有很多数据,这一组数据肯定比他们都大,性能应该没有问题。

github地址:

https://github.com/nhibernate/nhibernate-core/blob/master/src/NHibernate/Id/GuidCombGenerator.cs#L25-L72

https://github.com/jhtodd/SequentialGuid/

我的解决方法


总结上面的方法,UuidCreateSequential 前面10个字节有序,后6个是MAC地址。COMBO解决方案是前面10个随机,后六个是时间。我是将这两个结合起来

前10个去UuidCreateSequential 方法的值,后6个取时间

代码:

public static Guid NewSequentialGuid()
{
const int RPC_S_OK = ;
Guid guid;
int result = UuidCreateSequential(out guid); if (result != RPC_S_OK)
{
throw new System.ComponentModel.Win32Exception(System.Runtime.InteropServices.Marshal.GetLastWin32Error());
}
else
{
       //这里把UuidCreateSequential函数返回的数据做处理
byte[] guidBytes = guid.ToByteArray();
Array.Reverse(guidBytes, , );
Array.Reverse(guidBytes, , );
Array.Reverse(guidBytes, , );

       //这里用时间
long timestamp = DateTime.UtcNow.Ticks / 10000L;
byte[] timestampBytes = BitConverter.GetBytes(timestamp); if (BitConverter.IsLittleEndian)
{
Array.Reverse(timestampBytes);
}
       //最后把时间赋值给后6位
Buffer.BlockCopy(timestampBytes, , guidBytes, , );
return new Guid(guidBytes);
} } [System.Runtime.InteropServices.DllImport("rpcrt4.dll", SetLastError = true)]
private static extern int UuidCreateSequential(out Guid guid);

这里可以在程序调用,作为DBA在数据库使用的话可以将这个方法添加到程序集里,需要有些改动

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Data.SqlTypes; public class FunctionNewGuid
{
  //这里需要添加SqlFunction属性
  //返回类型是数据库类型
[Microsoft.SqlServer.Server.SqlFunction]
public static SqlGuid NewSequentialGuid()
{
const int RPC_S_OK = ;
Guid guid;
int result = UuidCreateSequential(out guid); if (result != RPC_S_OK)
{
throw new System.ComponentModel.Win32Exception(System.Runtime.InteropServices.Marshal.GetLastWin32Error());
}
else
{
byte[] guidBytes = guid.ToByteArray();
Array.Reverse(guidBytes, , );
Array.Reverse(guidBytes, , );
Array.Reverse(guidBytes, , ); long timestamp = DateTime.UtcNow.Ticks / 10000L;
byte[] timestampBytes = BitConverter.GetBytes(timestamp); if (BitConverter.IsLittleEndian)
{
Array.Reverse(timestampBytes);
}
Buffer.BlockCopy(timestampBytes, , guidBytes, , );
return new SqlGuid(guidBytes);
} } [System.Runtime.InteropServices.DllImport("rpcrt4.dll", SetLastError = true)]
private static extern int UuidCreateSequential(out Guid guid);
}

编译生成DLL后,注册到数据库

--设置数据库是可信任
ALTER DATABASE TEST SET TRUSTWORTHY ON --创建程序集
CREATE ASSEMBLY SQLCLR FROM 'D:\SQLCLR.DLL'
WITH PERMISSION_SET = UNSAFE --用程序集方法创建函数
CREATE FUNCTION func_NewSequentialGuid()
RETURNS uniqueidentifier
AS external name SQLCLR.FunctionNewGuid.NewSequentialGuid

    

测试代码:

批量请求:


select dbo.func_NewSequentialGuid()
union
select dbo.func_NewSequentialGuid()
union
select dbo.func_NewSequentialGuid()
union
select dbo.func_NewSequentialGuid()
union
select dbo.func_NewSequentialGuid()

结果:

多次请求:


create table #t
(
uuid uniqueidentifier
,id int identity
)
go insert into #t(uuid)
values(dbo.func_NewSequentialGuid())
go 10 select * from #t

git地址

https://gitee.com/wangzhanbo/cms/tree/master/Library

如果有问题,希望大家指正。。。

SQL Server 有序GUID,SequentialGuid,的更多相关文章

  1. SQL Server报“GUID应包含带4个短划线的32位数”

    转自:http://www.seayee.net/article/info_106.html 最近在配置一台服务器的MS SQL Server 2005的维护计划自动备份数据库,能创建维护计划,但设置 ...

  2. SQL Server to MySQL

    使用 Navicat 导入向导迁移 会遇到以下问题 SQL Server 中的 GUID 类型字段会变成 {guid} 多个外层花括号, 导致程序问题. 部分字段类型长度不大一致, 需要手工调整. . ...

  3. [O]SQL SERVER下有序GUID和无序GUID作为主键&聚集索引的性能表现

     背景 前段时间学习<Microsoft SQL Server 2008技术内幕:T-SQL查询>时,看到里面关于无序GUID作为主键与聚集索引的建议,无序GUID作为主键以及作为聚集索引 ...

  4. SQL SERVER下有序GUID和无序GUID作为主键&聚集索引的性能表现

     背景 前段时间学习<Microsoft SQL Server 2008技术内幕:T-SQL查询>时,看到里面关于无序GUID作为主键与聚集索引的建议,无序GUID作为主键以及作为聚集索引 ...

  5. SQL Server中的GUID

    GUID(Global unique identifier)全局唯一标识符,它是由网卡上的标识数字(每个网卡都有唯一的标识号)以及 CPU 时钟的唯一数字生成的的一个 16 字节的二进制值. GUID ...

  6. SQL Server中字符串转化为GUID的标量函数实现

        还是工作中遇到的需求,有时候和外部的系统对接,进行数据的核对功能,外部的系统有时候主键字段列数据类是UNIQUEIDENTIFER(GUID)类型的字符串格式,去除了GUID格式中的分隔符“- ...

  7. 根据SQL Server排序规则创建顺序GUID

    public static class GuidUtil { , , , , , , DateTimeKind.Utc).Ticks / 10000L; /// <summary> /// ...

  8. 用sql server的sql语句算一个empty GUID

    在C#中得到一个empty GUID的方法是: Guid id= Guid.Empty; 那么在SQL Server Management Studio中怎样得到一个empty GUID呢? 方法有两 ...

  9. SQL Server GUID 数据迁移至MongoDB后怎样查看?

    关键字:SQL Server NEWID():BSON:MongoDB UUID 1.遇到的问题和困惑 SQL Server中的NEWID数据存储到MongoDB中会是什么样子呢?发现不能简单的通过此 ...

随机推荐

  1. UNIX SHELL基础知识总结(二)

    1. vim,vi及ex的关系 vim不需要安装,vi为ex的“Visual Mode”,Vim是vi的高级版本: 2. Unix Shell 快捷键 Ctrl+a/e将光标定位到 命令的头/尾 Ct ...

  2. JS获取后台返回的JSON数据

    问题:通过$.get从后台获取了一段json串{"id":"1","name":"ww"},然后要拿到这里面的id和na ...

  3. js需要清楚的内存模型

    原型 原型重写 原型继承 组合方式实现继承 函数作用域链

  4. 在 Linux 平台下使用 JNI

    引言 Java 的出现给大家开发带来的极大的方便.但是,如果我们有大量原有的经过广泛测试的非 Java 代码,将它们全部用 Java 来重写,恐怕会带来巨大的工作量和长期的测试:如果我们的应用中需要访 ...

  5. PHP返回404状态码,由服务器处理

    1. 通过header()方法来实现, 最简单的方法,而且对php的版本没什么限制    <?php          header('HTTP/1.1 404 Not Found');     ...

  6. train,dev,test数据集作用

      train为训练语料,用于模型训练:   dev为开发集,用于模型参数调优:   test用于测试

  7. 了解下C#异常时的输出

    Sample Code: try { string re = "1.1".Substring(1,4); } catch (Exception ex) { logger.Error ...

  8. grunt-contrib-cssmin使用指南

    原文:http://riny.net/2014/grunt-cssmin/ grunt-contrib-cssmin v0.7.0 使用cssmin压缩css文件 Getting Started 这个 ...

  9. javaEE Design Patter(2)详解3个设计模式

    Factory (bean creating) Proxy(Agent)(Aop)书有~ Templete(springMVC Facelets)//此处及以上忽略 工厂模式(Factory) 工厂模 ...

  10. Java温故而知新(5)设计模式详解(23种)

    一.设计模式的理解 刚开始“不懂”为什么要把很简单的东西搞得那么复杂.后来随着软件开发经验的增加才开始明白我所看到的“复杂”恰恰就是设计模式的精髓所在,我所理解的“简单”就是一把钥匙开一把锁的模式,目 ...