问题描述


有序的GUID性能对比,堪比自增ID integer

一个大神告诉我NEWSEQUENTIALID() 在数据迁移的时候会有问题(感谢大神指点),所以我就深挖一下这个函数。

    关于NEWSEQUENTIALID() 的用法 参照  NEWSEQUENTIALID()

NEWSEQUENTIALID 是对 Windows UuidCreateSequential 函数的包装。

https://msdn.microsoft.com/zh-cn/library/ms189786(v=sql.120).aspx

我们系统中对UuidCreateSequential 方法的扩展是这样写的,代码如下:

    public static class GuidExtension
{
[DllImport("rpcrt4.dll", SetLastError = true)]
public static extern int UuidCreateSequential(out Guid guid);
private const int RPC_S_OK = ; public static Guid CreateRpcrt4Guid()
{
Guid guid;
int result = UuidCreateSequential(out guid);
if (result == RPC_S_OK)
{
byte[] guidBytes = guid.ToByteArray();
Array.Reverse(guidBytes, , );
Array.Reverse(guidBytes, , );
Array.Reverse(guidBytes, , ); return new Guid(guidBytes);
}
else
return Guid.NewGuid();
} }

  有以下几个缺点:

  1、暴漏MAC地址:NEWSEQUENTIALID函数最后6个字符是网卡的MAC地址

  可以执行看一下

create table #t
(
id uniqueidentifier not null default newsequentialid()
,name varchar(100)
)
go insert into #t(name)
output inserted.id
values('a')

  2、如果进行数据迁移,到另一台机器上,MAC地址改变就会引起页的争用。

    因为GUID在的SQL Server的值大小的比对是这样的:

with uids as (
select id = 1, uuid = cast ('00000000-0000-0000-0000-010000000000' as uniqueidentifier)
union select id = 2, uuid = cast ('00000000-0000-0000-0000-000100000000' as uniqueidentifier)
union select id = 3, uuid = cast ('00000000-0000-0000-0000-000001000000' as uniqueidentifier)
union select id = 4, uuid = cast ('00000000-0000-0000-0000-000000010000' as uniqueidentifier)
union select id = 5, uuid = cast ('00000000-0000-0000-0000-000000000100' as uniqueidentifier)
union select id = 6, uuid = cast ('00000000-0000-0000-0000-000000000001' as uniqueidentifier)
union select id = 7, uuid = cast ('00000000-0000-0000-0100-000000000000' as uniqueidentifier)
union select id = 8, uuid = cast ('00000000-0000-0000-0010-000000000000' as uniqueidentifier)
union select id = 9, uuid = cast ('00000000-0000-0001-0000-000000000000' as uniqueidentifier)
union select id = 10, uuid = cast ('00000000-0000-0100-0000-000000000000' as uniqueidentifier)
union select id = 11, uuid = cast ('00000000-0001-0000-0000-000000000000' as uniqueidentifier)
union select id = 12, uuid = cast ('00000000-0100-0000-0000-000000000000' as uniqueidentifier)
union select id = 13, uuid = cast ('00000001-0000-0000-0000-000000000000' as uniqueidentifier)
union select id = 14, uuid = cast ('00000100-0000-0000-0000-000000000000' as uniqueidentifier)
union select id = 15, uuid = cast ('00010000-0000-0000-0000-000000000000' as uniqueidentifier)
union select id = 16, uuid = cast ('01000000-0000-0000-0000-000000000000' as uniqueidentifier)
)
select * from uids order by uuid desc

输出结果:

  类似 汉字的三点水偏旁(为了好记)


从这里可以看出,MAC地址对GUID的大小有这最高的决定性,这就导致在数据迁移的时候出问题。

COMB解决方案


COMB 类型的GUID 基本设计思路是这样的:既然GUID数据生成是随机的造成索引效率低下,影响了系统的性能,那么能不能通过组合的方式,保留GUID的前10个字节,用后6个字节表示GUID生成的时间(DateTime),这样我们将时间信息与GUID组合起来,在保留GUID的唯一性的同时增加了有序性,以此来提高索引效率。

前十个字节是通过随机数生成

private static readonly RNGCryptoServiceProvider RandomGenerator = new RNGCryptoServiceProvider();

      byte[] randomBytes = new byte[];
RandomGenerator.GetBytes(randomBytes);

后六个字节用时间生成

      long timestamp = DateTime.UtcNow.Ticks / 10000L;
byte[] timestampBytes = BitConverter.GetBytes(timestamp); if (BitConverter.IsLittleEndian)
{
Array.Reverse(timestampBytes);
}

最后组合起来

    byte[] guidBytes = new byte[];
Buffer.BlockCopy(randomBytes, , guidBytes, , );
Buffer.BlockCopy(timestampBytes, , guidBytes, , ); return new Guid(guidBytes);

这个解决方法是被大家所认可的,唯一感觉不好的地方是,在快速获取很多的GUID的时候,时间是一样的,加上随机生成的数据,这一组数据是大小不一的。假如数据库里有很多数据,这一组数据肯定比他们都大,性能应该没有问题。

github地址:

https://github.com/nhibernate/nhibernate-core/blob/master/src/NHibernate/Id/GuidCombGenerator.cs#L25-L72

https://github.com/jhtodd/SequentialGuid/

我的解决方法


总结上面的方法,UuidCreateSequential 前面10个字节有序,后6个是MAC地址。COMBO解决方案是前面10个随机,后六个是时间。我是将这两个结合起来

前10个去UuidCreateSequential 方法的值,后6个取时间

代码:

public static Guid NewSequentialGuid()
{
const int RPC_S_OK = ;
Guid guid;
int result = UuidCreateSequential(out guid); if (result != RPC_S_OK)
{
throw new System.ComponentModel.Win32Exception(System.Runtime.InteropServices.Marshal.GetLastWin32Error());
}
else
{
       //这里把UuidCreateSequential函数返回的数据做处理
byte[] guidBytes = guid.ToByteArray();
Array.Reverse(guidBytes, , );
Array.Reverse(guidBytes, , );
Array.Reverse(guidBytes, , );

       //这里用时间
long timestamp = DateTime.UtcNow.Ticks / 10000L;
byte[] timestampBytes = BitConverter.GetBytes(timestamp); if (BitConverter.IsLittleEndian)
{
Array.Reverse(timestampBytes);
}
       //最后把时间赋值给后6位
Buffer.BlockCopy(timestampBytes, , guidBytes, , );
return new Guid(guidBytes);
} } [System.Runtime.InteropServices.DllImport("rpcrt4.dll", SetLastError = true)]
private static extern int UuidCreateSequential(out Guid guid);

这里可以在程序调用,作为DBA在数据库使用的话可以将这个方法添加到程序集里,需要有些改动

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Data.SqlTypes; public class FunctionNewGuid
{
  //这里需要添加SqlFunction属性
  //返回类型是数据库类型
[Microsoft.SqlServer.Server.SqlFunction]
public static SqlGuid NewSequentialGuid()
{
const int RPC_S_OK = ;
Guid guid;
int result = UuidCreateSequential(out guid); if (result != RPC_S_OK)
{
throw new System.ComponentModel.Win32Exception(System.Runtime.InteropServices.Marshal.GetLastWin32Error());
}
else
{
byte[] guidBytes = guid.ToByteArray();
Array.Reverse(guidBytes, , );
Array.Reverse(guidBytes, , );
Array.Reverse(guidBytes, , ); long timestamp = DateTime.UtcNow.Ticks / 10000L;
byte[] timestampBytes = BitConverter.GetBytes(timestamp); if (BitConverter.IsLittleEndian)
{
Array.Reverse(timestampBytes);
}
Buffer.BlockCopy(timestampBytes, , guidBytes, , );
return new SqlGuid(guidBytes);
} } [System.Runtime.InteropServices.DllImport("rpcrt4.dll", SetLastError = true)]
private static extern int UuidCreateSequential(out Guid guid);
}

编译生成DLL后,注册到数据库

--设置数据库是可信任
ALTER DATABASE TEST SET TRUSTWORTHY ON --创建程序集
CREATE ASSEMBLY SQLCLR FROM 'D:\SQLCLR.DLL'
WITH PERMISSION_SET = UNSAFE --用程序集方法创建函数
CREATE FUNCTION func_NewSequentialGuid()
RETURNS uniqueidentifier
AS external name SQLCLR.FunctionNewGuid.NewSequentialGuid

    

测试代码:

批量请求:


select dbo.func_NewSequentialGuid()
union
select dbo.func_NewSequentialGuid()
union
select dbo.func_NewSequentialGuid()
union
select dbo.func_NewSequentialGuid()
union
select dbo.func_NewSequentialGuid()

结果:

多次请求:


create table #t
(
uuid uniqueidentifier
,id int identity
)
go insert into #t(uuid)
values(dbo.func_NewSequentialGuid())
go 10 select * from #t

git地址

https://gitee.com/wangzhanbo/cms/tree/master/Library

如果有问题,希望大家指正。。。

SQL Server 有序GUID,SequentialGuid,的更多相关文章

  1. SQL Server报“GUID应包含带4个短划线的32位数”

    转自:http://www.seayee.net/article/info_106.html 最近在配置一台服务器的MS SQL Server 2005的维护计划自动备份数据库,能创建维护计划,但设置 ...

  2. SQL Server to MySQL

    使用 Navicat 导入向导迁移 会遇到以下问题 SQL Server 中的 GUID 类型字段会变成 {guid} 多个外层花括号, 导致程序问题. 部分字段类型长度不大一致, 需要手工调整. . ...

  3. [O]SQL SERVER下有序GUID和无序GUID作为主键&聚集索引的性能表现

     背景 前段时间学习<Microsoft SQL Server 2008技术内幕:T-SQL查询>时,看到里面关于无序GUID作为主键与聚集索引的建议,无序GUID作为主键以及作为聚集索引 ...

  4. SQL SERVER下有序GUID和无序GUID作为主键&聚集索引的性能表现

     背景 前段时间学习<Microsoft SQL Server 2008技术内幕:T-SQL查询>时,看到里面关于无序GUID作为主键与聚集索引的建议,无序GUID作为主键以及作为聚集索引 ...

  5. SQL Server中的GUID

    GUID(Global unique identifier)全局唯一标识符,它是由网卡上的标识数字(每个网卡都有唯一的标识号)以及 CPU 时钟的唯一数字生成的的一个 16 字节的二进制值. GUID ...

  6. SQL Server中字符串转化为GUID的标量函数实现

        还是工作中遇到的需求,有时候和外部的系统对接,进行数据的核对功能,外部的系统有时候主键字段列数据类是UNIQUEIDENTIFER(GUID)类型的字符串格式,去除了GUID格式中的分隔符“- ...

  7. 根据SQL Server排序规则创建顺序GUID

    public static class GuidUtil { , , , , , , DateTimeKind.Utc).Ticks / 10000L; /// <summary> /// ...

  8. 用sql server的sql语句算一个empty GUID

    在C#中得到一个empty GUID的方法是: Guid id= Guid.Empty; 那么在SQL Server Management Studio中怎样得到一个empty GUID呢? 方法有两 ...

  9. SQL Server GUID 数据迁移至MongoDB后怎样查看?

    关键字:SQL Server NEWID():BSON:MongoDB UUID 1.遇到的问题和困惑 SQL Server中的NEWID数据存储到MongoDB中会是什么样子呢?发现不能简单的通过此 ...

随机推荐

  1. Java - 自定义异常(尚学堂第六章异常机制作业判断三角形)

    写一个方法void isTriangle(int a,int b,int c),判断三个参数是否能构成一个三角形, 如果不能则抛出异常IllegalArgumentException,显示异常信息 “ ...

  2. KafKa 启动

    Zookeeper 运行kafka需要使用Zookeeper,所以要先启动Zookeeper,如果没有Zookeeper,可以使用kafka自带打包和配置好的Zookeeper 1.进入kafka的b ...

  3. 初次使用github的艰难尝试。

    序言 github是全英文的网站,初次使用在没有翻译成中文的情况下很容易做出很多无意义或误操作. 当对本地的文件进行修改后,有时候只是想更新到fork下来的自己的仓库里,看看改得效果如何 .有时候是想 ...

  4. (转)nginx 常用模块整理

    原文:http://blog.51cto.com/arm2012/1977090 1. 性能相关配置 worker_processes number | auto: worker进程的数量:通常应该为 ...

  5. JAVA学习2:Eclipse集成Maven

    我的环境: Eclipse:eclipse-jee-juno-SR2-win32 Maven:Maven3.0.5 1.Help->Eclipse Marketplace 2.选中要安装的插件, ...

  6. 将Mysql的一张表导出至Excel格式文件

    将Mysql的一张表导出至Excel格式文件 导出语句 进入mysql数据库,输入如下sql语句: select id, name, age from tablename into outfile ' ...

  7. imx6. android6.0经常修改或者用到的目录(未完)

    系统应用apk存放的文件: out/target/product/sabresd_6dq/system/app 系统配置存放目录:(我自己的,也许不对) out/target/product/sabr ...

  8. AngularJS的日期格式化有两种形式

    AngularJS的日期格式化有两种形式,一种是在HTML页面,一种是在JS代码里,都是用到AngularJS的过滤器$filter. HTML: date_expression 即 你在$scope ...

  9. C++运行符重载、友元函数

    Complex.h #pragma once #include <iostream> using namespace std; //表示一个复数 class Complex { priva ...

  10. django-admin管理后台高级自定义

    django自带的admin后台管理系统,在很多网站中被称为django的杀手级的应用.那么django-admin的适用情形倒底有哪些呢,一般 来说对于大型的商业性的项目通常不用采用django-a ...