分布式自增ID算法snowflake

分布式系统中，有一些需要使用全局唯一ID的场景，这种时候为了防止ID冲突可以使用36位的UUID，但是UUID有一些缺点，首先他相对比较长，另外UUID一般是无序的，作为索引非常不好，严重影响性能。

snowflake的结构如下(每部分用-分开):

0 - 0000000000 0000000000 0000000000 0000000000 0 - 00000 - 00000 - 000000000000

第一个部分，是 1 个 bit：0，这个是无意义的。
第二个部分是 41 个 bit：表示的是时间戳。
第三个部分是 5 个 bit：表示的是机房 id，10001。
第四个部分是 5 个 bit：表示的是机器 id，1 1001。
第五个部分是 12 个 bit：表示的序号，就是某个机房某台机器上这一毫秒内同时生成的 id 的序号，0000 00000000。

snowflake生成的ID整体上按照时间自增排序，并且整个分布式系统内不会产生ID碰撞（由datacenter和workerId作区分），并且效率较高。经测试snowflake每秒能够产生26万个ID。

 /**

  * Twitter_Snowflake<br>

  * SnowFlake的结构如下(每部分用-分开):<br>

  * 0 - 0000000000 0000000000 0000000000 0000000000 0 - 00000 - 00000 -

  * 000000000000 <br>

  * 1位标识，由于long基本类型在Java中是带符号的，最高位是符号位，正数是0，负数是1，所以id一般是正数，最高位是0<br>

  * 41位时间截(毫秒级)，注意，41位时间截不是存储当前时间的时间截，而是存储时间截的差值（当前时间截 - 开始时间截)

  * 得到的值），这里的的开始时间截，一般是我们的id生成器开始使用的时间，由我们程序来指定的（如下下面程序IdWorker类的startTime属性）。41位的时间截，可以使用69年，年T

  * = (1L << 41) / (1000L * 60 * 60 * 24 * 365) = 69<br>

  * 10位的数据机器位，可以部署在1024个节点，包括5位datacenterId和5位workerId<br>

  * 12位序列，毫秒内的计数，12位的计数顺序号支持每个节点每毫秒(同一机器，同一时间截)产生4096个ID序号<br>

  * 加起来刚好64位，为一个Long型。<br>

  * SnowFlake的优点是，整体上按照时间自增排序，并且整个分布式系统内不会产生ID碰撞(由数据中心ID和机器ID作区分)，并且效率较高，经测试，SnowFlake每秒能够产生26万ID左右。

  */

 public class SnowflakeId {

     /** 开始时间截 (2015-01-01) */

     private final long twepoch = 1420041600000L;

     /** 机器id所占的位数 */

     private final long workerIdBits = 5L;

     /** 数据标识id所占的位数 */

     private final long datacenterIdBits = 5L;

     /** 支持的最大机器id，结果是31 (这个移位算法可以很快的计算出几位二进制数所能表示的最大十进制数) */

     private final long maxWorkerId = -1L ^ (-1L << workerIdBits);

     /** 支持的最大数据标识id，结果是31 */

     private final long maxDatacenterId = -1L ^ (-1L << datacenterIdBits);

     /** 序列在id中占的位数 */

     private final long sequenceBits = 12L;

     /** 机器ID向左移12位 */

     private final long workerIdShift = sequenceBits;

     /** 数据标识id向左移17位(12+5) */

     private final long datacenterIdShift = sequenceBits + workerIdBits;

     /** 时间截向左移22位(5+5+12) */

     private final long timestampLeftShift = sequenceBits + workerIdBits + datacenterIdBits;

     /** 生成序列的掩码，这里为4095 (0b111111111111=0xfff=4095) */

     private final long sequenceMask = -1L ^ (-1L << sequenceBits);

     /** 工作机器ID(0~31) */

     private long workerId;

     /** 数据中心ID(0~31) */

     private long datacenterId;

     /** 毫秒内序列(0~4095) */

     private long sequence = 0L;

     /** 上次生成ID的时间截 */

     private long lastTimestamp = -1L;

     /**

      * @param workerId     工作ID (0~31)

      * @param datacenterId 数据中心ID (0~31)

      */

     public SnowflakeId(long workerId, long datacenterId) {

         if (workerId > maxWorkerId || workerId < 0) {

             throw new IllegalArgumentException(

                     String.format("worker Id can't be greater than %d or less than 0", maxWorkerId));

         }

         if (datacenterId > maxDatacenterId || datacenterId < 0) {

             throw new IllegalArgumentException(

                     String.format("datacenter Id can't be greater than %d or less than 0", maxDatacenterId));

         }

         this.workerId = workerId;

         this.datacenterId = datacenterId;

     }

     /**

      * 获得下一个ID (该方法是线程安全的)

      *

      * @return SnowflakeId

      */

     public synchronized long nextId() {

         long timestamp = timeGen();

         // 如果当前时间小于上一次ID生成的时间戳，说明系统时钟回退过这个时候应当抛出异常

         if (timestamp < lastTimestamp) {

             throw new RuntimeException(String.format(

                     "Clock moved backwards.  Refusing to generate id for %d milliseconds", lastTimestamp - timestamp));

         }

         // 如果是同一时间生成的，则进行毫秒内序列

         if (lastTimestamp == timestamp) {

             sequence = (sequence + 1) & sequenceMask;

             // 毫秒内序列溢出

             if (sequence == 0) {

                 // 阻塞到下一个毫秒,获得新的时间戳

                 timestamp = tilNextMillis(lastTimestamp);

             }

         }

         // 时间戳改变，毫秒内序列重置

         else {

             sequence = 0L;

         }

         // 上次生成ID的时间截

         lastTimestamp = timestamp;

         // 移位并通过或运算拼到一起组成64位的ID

         return ((timestamp - twepoch) << timestampLeftShift) //

                 | (datacenterId << datacenterIdShift) //

                 | (workerId << workerIdShift) //

                 | sequence;

     }

     /**

      * 阻塞到下一个毫秒，直到获得新的时间戳

      *

      * @param lastTimestamp 上次生成ID的时间截

      * @return 当前时间戳

      */

     protected long tilNextMillis(long lastTimestamp) {

         long timestamp = timeGen();

         while (timestamp <= lastTimestamp) {

             timestamp = timeGen();

         }

         return timestamp;

     }

     /**

      * 返回以毫秒为单位的当前时间

      *

      * @return 当前时间(毫秒)

      */

     protected long timeGen() {

         return System.currentTimeMillis();

     }

     /** 测试 */

     public static void main(String[] args) {

         long startTime = System.currentTimeMillis();

         SnowflakeId snowflakeId = new SnowflakeId(0, 0);

         for (int i = 0; i < 1000; i++) {

             long id = snowflakeId.nextId();

             System.out.println(Long.toBinaryString(id));

             System.out.println(id);

         }

         long endTime = System.currentTimeMillis();

         System.out.println("生成1000个id的时间：" + (endTime - startTime));

     }

 }

运行结果：

...
生成1000个id的时间：16

效率非常高，1000个id才花费16ms

分布式自增ID算法snowflake的更多相关文章

Twitter分布式自增ID算法snowflake原理解析
以JAVA为例 Twitter分布式自增ID算法snowflake,生成的是Long类型的id,一个Long类型占8个字节,每个字节占8比特,也就是说一个Long类型占64个比特(0和1). 那么一个 ...
Twitter分布式自增ID算法snowflake原理解析(Long类型)
Twitter分布式自增ID算法snowflake,生成的是Long类型的id,一个Long类型占8个字节,每个字节占8比特,也就是说一个Long类型占64个比特(0和1). 那么一个Long类型的6 ...
详解Twitter开源分布式自增ID算法snowflake(附演算验证过程)
详解Twitter开源分布式自增ID算法snowflake,附演算验证过程 2017年01月22日 14:44:40 url: http://blog.csdn.net/li396864285/art ...
分布式自增ID算法-Snowflake详解
1.Snowflake简介互联网快速发展的今天,分布式应用系统已经见怪不怪,在分布式系统中,我们需要各种各样的ID,既然是ID那么必然是要保证全局唯一,除此之外,不同当业务还需要不同的特性,比如像并 ...
基于.NET Standard的分布式自增ID算法--Snowflake
概述本篇文章主要讲述分布式ID生成算法中最出名的Snowflake算法.搞.NET开发的,数据库主键最常见的就是int类型的自增主键和GUID类型的uniqueidentifier. 那么为何还要引 ...
Twitter的分布式自增ID算法snowflake
snowflake 分布式场景下获取自增id git:https://github.com/twitter/snowflake 解读: http://www.cnblogs.com/relucent/ ...
Twitter的分布式自增ID算法snowflake (Java版)
概述分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的. 有些时候我们希望能使用一种 ...
分布式自增ID算法snowflake (Java版)
概述分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的. 有些时候我们希望能使用一种 ...
Twitter的分布式自增ID算法snowflake（雪花算法） - C#版
概述分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的.有些时候我们希望能使用一种简 ...

随机推荐

[树链剖分]BZOJ3589动态树
题目描述别忘了这是一棵动态树, 每时每刻都是动态的. 小明要求你在这棵树上维护两种事件事件0: 这棵树长出了一些果子, 即某个子树中的每个节点都会长出K个果子. 事件1: 小明希望你求出几条树枝上 ...
【多线程与并发】Java并发工具类
主要有两类 ①并发流程控制相关:CountDownLatch.CyclicBarrier.Semaphore ②线程间交换数据相关:Exchanger: CountDownLatch 作用:允许一个或 ...
Oracle的存储的三大物理文件
分享一下我老师大神的人工智能教程!零基础,通俗易懂!http://blog.csdn.net/jiangjunshow 也欢迎大家转载本篇文章.分享知识,造福人民,实现我们中华民族伟大复兴! 一. ...
Spark（四十七）：Spark UI 数据可视化
导入: 1)Spark Web UI主要依赖于流行的Servlet容器Jetty实现: 2)Spark Web UI(Spark2.3之前)是展示运行状况.资源状态和监控指标的前端,而这些数据都是由度 ...
https://zhuanlan.zhihu.com/p/32553477
科普:QUIC协议原理分析
改变jupyter notebook的主题背景
https://study.163.com/provider/400000000398149/index.htm?share=2&shareId=400000000398149( 欢迎关注博 ...
mongodb的开机自启动
一.背景 Linux轻松的在rc.local中写上启动脚本,reboot~发现没有启动成功.这不科学啊,查看日志发现“permission denied” 二.解决 Linux系统下,使用自定配置文件 ...
Kotlin集合——Set集合
Kotlin集合——Set集合转 https://www.jianshu.com/p/3c95d7729d69 Kotlin的集合类由两个接口派生:Collection和Map. Kotlin的 ...
maven项目新检出后不编译爬坑记及 mvn clean package报错 WagonTransporterFactory: java.util.NoSuchElementException 异常【我】
从SVN新检出一个maven项目,配置好后,发现项目无法编译(只有一个test包中的代码显示编译报错,其他所有包中的代码都不编译,也不报错), 先注释掉报错的test包中的所有内容, 用Eclipse ...
faster_rcnn mAP

分布式自增ID算法snowflake

分布式自增ID算法snowflake的更多相关文章

随机推荐

热门专题