[C#] 分布式ID自增算法 Snowflake

最近在尝试EF的多数据库移植，但是原始项目中主键用的Sqlserver的GUID。MySQL没法移植了。

其实发现GUID也没法保证数据的递增性，又不太想使用int递增主键，就开始探索别的ID形式。

后来发现twitter的Snowflake算法。

一开始我尝试过直接引用Nuget里的Snowflake的扩展包（有Framework版和Core版），不过有些Bug，就是初始化参数有的时候不一定好用，最大问题是，这个需要实例化对象，并且通过同一个对象来实生成ID，否则会出现ID冲突问题。而且，我们还要考虑对象在内存的生存问题。学习这种算法是够用了，但是用到实际生产中则有很多问题，虽然我们可以通过一些技术来避免这种问题，但是总觉得不够优雅，不符合我的美学！

后来看到这篇博客 C# 实现 Snowflake算法先感谢一下这个大神。但是同样有上述的部分问题，做5线程的并发测试的时候效率不如扩展的。后面我们会提到。

我从这篇博客里摘来了源码，对有的地方做了一些改动使得其更适合（至少我认为是）更适合生产环境。

先贴源码

　　public class SFID

    {

        /// <summary>

        /// 机器码

        /// </summary>

        private static long _workerId;

        /// <summary>

        /// 初始基准时间戳，小于当前时间点即可

        /// 分布式项目请保持此时间戳一致

        /// </summary>

        private static long _twepoch = 0L;

        /// <summary>

        /// 毫秒计数器

        /// </summary>

        private static long sequence = 0L;

        /// <summary>

        /// 机器码字节数。4个字节用来保存机器码(定义为Long类型会出现，最大偏移64位，所以左移64位没有意义)

        /// </summary>

        private static int workerIdBits = ; 

        /// <summary>

        /// 最大机器ID所占的位数

        /// </summary>

        private static long maxWorkerId = -1L ^ -1L << workerIdBits;

        /// <summary>

        /// 计数器字节数，10个字节用来保存计数码

        /// </summary>

        private static int sequenceBits = ;

        /// <summary>

        /// 机器码数据左移位数，就是后面计数器占用的位数

        /// </summary>

        private static int workerIdShift = sequenceBits;

        /// <summary>

        /// 时间戳左移动位数就是机器码和计数器总字节数

        /// </summary>

        private static int timestampLeftShift = sequenceBits + workerIdBits;

        /// <summary>

        /// 一微秒内可以产生计数，如果达到该值则等到下一微妙在进行生成

        /// </summary>

        private static long sequenceMask = -1L ^ -1L << sequenceBits;

        /// <summary>

        /// 最后一次的时间戳

        /// </summary>

        private static long lastTimestamp = -1L;

        /// <summary>

        /// 线程锁对象

        /// </summary>

        private static object locker = new object();

        static SFID()

        {

            _workerId = new Random(DateTime.Now.Millisecond).Next(, (int)maxWorkerId);

            _twepoch = timeGen(, , , , , );

        }

        /// <summary>

        /// 机器编号

        /// </summary>

        public static long WorkerID

        {

            get { return _workerId; }

            set

            {

                if (value >  && value < maxWorkerId)

                    _workerId = value;

                else

                    throw new Exception("Workerid must be greater than 0 or less than " + maxWorkerId);

            }

        }

        /// <summary>

        /// 获取新的ID

        /// </summary>

        /// <returns></returns>

        public static long NewID()

        {

            lock (locker)

            {

                long timestamp = timeGen();

                if (lastTimestamp == timestamp)

                { //同一微妙中生成ID

                    sequence = (sequence + ) & sequenceMask; //用&运算计算该微秒内产生的计数是否已经到达上限

                    if (sequence == )

                    {

                        //一微妙内产生的ID计数已达上限，等待下一微妙

                        timestamp = tillNextMillis(lastTimestamp);

                    }

                }

                else

                { //不同微秒生成ID

                    sequence = ; //计数清0

                }

                if (timestamp < lastTimestamp)

                {

                    //如果当前时间戳比上一次生成ID时时间戳还小，抛出异常，因为不能保证现在生成的ID之前没有生成过

                    throw new Exception(string.Format("Clock moved backwards.  Refusing to generate id for {0} milliseconds", lastTimestamp - timestamp));

                }

                lastTimestamp = timestamp; //把当前时间戳保存为最后生成ID的时间戳

                return (timestamp - _twepoch << timestampLeftShift) | _workerId << workerIdShift | sequence;

            }

        }

        /// <summary>

        /// 获取下一微秒时间戳

        /// </summary>

        /// <param name="lastTimestamp"></param>

        /// <returns></returns>

        private static long tillNextMillis(long lastTimestamp)

        {

            long timestamp = timeGen();

            while (timestamp <= lastTimestamp)

            {

                timestamp = timeGen();

            }

            return timestamp;

        }

        /// <summary>

        /// 当前时间戳

        /// </summary>

        /// <returns></returns>

        private static long timeGen()

        {

            return (long)(DateTime.UtcNow - new DateTime(, , , , , , DateTimeKind.Utc)).TotalMilliseconds;

        }

        /// <summary>

        /// 指定时间戳

        /// </summary>

        /// <param name="Time">指定时间</param>

        /// <returns></returns>

        private static long timeGen(int Year, int Month, int Day, int Hour, int Minute, int Second)

        {

            var UtcTime = new DateTime(Year, Month, Day, Hour, Minute, Second, DateTimeKind.Utc);

            return (long)(UtcTime - new DateTime(, , , , , , DateTimeKind.Utc)).TotalMilliseconds;

        }

    }

说下使用，理论上如果是单机部署，不用做任何配置工作

直接 SFID.NewID() 就可以使用。

如果分布式的话

.Net Framework项目在Application_Start中，.Net Core项目在Configure中添加 SFID.WorkerID = 1L; 就可以 1L换成你的不同机器代号就可以，建议从配置文件读取可以保证代码一致性。另外不要部署ID相同的服务器，很可能会出现ID冲突。

因为就用了4位，所以最大只支持16台机器，如果不够用，可以去改workerIdBits的值，但是注意，这样会压缩ID的使用寿命，如果改为10位的话，大概可以用69年。

起始时间，我的为了保持一致使用了2010年1月1日0时。ID的使用寿命则是以这个时间点进行计算的。如果觉得不够用修代码中构造方法里的时间。但是注意多台保持一致。否则不能保证ID顺序递增。

然后大概说说修改思路。

1、关于实例化ID算法对象这个事，我觉得与其每次都初始化，然后费了半天劲保持对象生存，不如直接使用单例模式。所以方法不需要再单独实例化。

但是这么做也是有缺点的，如果我想业务A和业务B分别使用不同ID的序列，那么多实例模式则更适合，两个不同的业务，占位可以不一样，并且允许出现相同ID，更节省ID，效率也相对较高。

2、关于效率不高的问题，其实是原来的代码中计数器位过短造成的，并发达到数量达到可分配ID的峰值后，线程就会锁死不再发放ID，直到下一毫秒。

知道问题就很好解决了，调整大计数器长度，压缩服务器编号占位（我觉得实际生产中，很少有机会会用到1K台机器并发）。

以上，有问题或者有错误欢迎指出，可以直接给我发消息或者邮件我

[C#] 分布式ID自增算法 Snowflake的更多相关文章

id生成器，分布式ID自增算法（Snowflake 算法）
接口: /** * id生成器 */ public interface IdGenerator { String next(); } 实现类: /** * 分布式ID自增算法<br/> * ...
适用于分布式ID的雪花算法
基于Java实现的适用于分布式ID的雪花算法工具类,这里存一下日后好找 /** * 雪花算法生成ID */ public class SnowFlakeUtil { private final sta ...
分布式ID生成 - 雪花算法
雪花算法是一种生成分布式全局唯一ID的经典算法,关于雪花算法的解读网上多如牛毛,大多抄来抄去,这里请参考耕耘的小象大神的博客ID生成器,Twitter的雪花算法(Java) 网上的教程一般存在两个问题 ...
分布式ID的雪花算法及坑
分布式ID生成是目前系统的常见刚需,其中以Twitter的雪花算法(Snowflake)比较知名,有Java等各种语言的版本及各种改进版本,能生成满足分布式ID,返回ID为Long长整数但是这里有一 ...
生成主键ID,唯一键id,分布式ID生成器雪花算法代码实现
工具类: package com.ihrm.common.utils; import java.lang.management.ManagementFactory; import java.net. ...
分布式ID系列（5）——Twitter的雪法算法Snowflake适合做分布式ID吗
介绍Snowflake算法 SnowFlake算法是国际大公司Twitter的采用的一种生成分布式自增id的策略,这个算法产生的分布式id是足够我们我们中小公司在日常里面的使用了.我也是比较推荐这一种 ...
分布式ID解决方案
开发十年,就只剩下这套Java开发体系了 >>> 在游戏开发中,我们使用分布式ID.有很多优点便于合服便于ID管理等等一.单服各自ID系统的弊端 1. 列如合服在游戏上 ...
大型互联网公司分布式ID方案总结
ID是数据的唯一标识,传统的做法是利用UUID和数据库的自增ID,在互联网企业中,大部分公司使用的都是Mysql,并且因为需要事务支持,所以通常会使用Innodb存储引擎,UUID太长以及无序,所以并 ...
分布式id生成方案总结
本文已经收录自 JavaGuide (60k+ Star[Java学习+面试指南] 一份涵盖大部分Java程序员所需要掌握的核心知识.) 本文授权转载自:https://juejin.im/post/ ...

随机推荐

C#设计模式(0)-认识设计模式
简介世界上本没有路,走的人多了也就成了路:世界上本来没有设计模式.用的人多了,也就成了设计模式.所以,我们不是严格按照它的定义去执行,可以根据自己的实际场景.需求去变通.领悟了其中的思想,实现属于自 ...
小明历险记：规则引擎drools教程一
小明是一家互联网公司的软件工程师,他们公司为了吸引新用户经常会搞活动,小明常常为了做活动加班加点很烦躁,这不今天呀又来了一个活动需求,我们大家一起帮他看看. 小明的烦恼活动规则是根据用户购买订单的金 ...
Java获取指定时间的毫秒值的方法
有以下两种方法获取指定时间的毫秒值: 1.Calendar类先由getInstance获取Calendar对象,然后用clear方法将时间重置为(1970.1.1 00:00:00),接下来用set ...
jmeter - 关联之正则表达式提取器
如果有这样的情况:一个完整的操作流程,需要先完成某个操作,获得某个值或数据信息,然后才能进行下一步的操作(也就是常说的关联/将上一个请求的响应结果作为下一个请求的参数): 在jmeter中,可以利用正 ...
普通程序员如何入门AI
毫无疑问,人工智能是目前整个互联网领域最火的行业,随着AlphaGo战胜世界围棋冠军,以及各种无人驾驶.智能家居项目的布道,人们已经意识到了AI就是下一个风口.当然,程序员是我见过对于新技术最敏感的一 ...
01迷宫洛谷 p1141
题目描述有一个仅由数字0与1组成的n×n格迷宫.若你位于一格0上,那么你可以移动到相邻4格中的某一格1上,同样若你位于一格1上,那么你可以移动到相邻4格中的某一格0上. 你的任务是:对于给定的迷宫, ...
[js高手之路] vue系列教程 - 组件定义与使用上部(7)
组件是vue框架比较核心的内容,那么什么是组件呢? 通俗点讲:组件是由一堆html, css, javascript组成的代码片段, 作用是为了实现模块的重用组件的基本用法: <div id= ...
mysql对binlog的处理
--mysql对binlog的处理 ------------------------2014/05/28 Binlog是mysql以二进制形式打印的日志,它默认不加密,不压缩.每个正常的binlog文 ...
Qt图片按原比例缩放
1.选择图片 QString strFilePath = QFileDialog::getOpenFileName(this, tr("Select file"), QStanda ...
【环境搭建】使用Jekyll搭建Github博客
前言昨天花了差不多一天的时间,使用Jekyll搭建起了一套Github博客,感觉不错,也特将搭建过程记录下来,方便有需要的朋友自行搭建. 搭建步骤本环境是在Linux环境下搭建完成的安装前建议使 ...

[C#] 分布式ID自增算法 Snowflake

[C#] 分布式ID自增算法 Snowflake的更多相关文章

随机推荐

热门专题