引言

唯一ID可以标识数据的唯一性，在分布式系统中生成唯一ID的方案有很多，常见的方式大概有以下三种：

依赖数据库，使用如MySQL自增列或Oracle序列等。
UUID随机数
snowflake雪花算法(本文将要讨论)

数据库和UUID方案的不足之处

1.采用数据库自增序列

读写分离时，只有主节点可以进行写操作，可能有单点故障的风险

分表分库，数据迁移合并等比较麻烦

2.UUID随机数

采用无意义字符串，没有排序

UUID使用字符串形式存储，数据量大时查询效率比较低

雪花算法原理

SnowFlake算法生成id的结果是一个64bit大小的整数，它的结构如下图：

其中

1bit，不用，因为二进制中最高位是符号位，1表示负数，0表示正数。生成的id一般都是用整数，所以最高位固定为0。

41bit-时间戳，用来记录时间戳，毫秒级。

41位可以表示个数字，
如果只用来表示正整数（计算机中正数包含0），可以表示的数值范围是：0 至，减1是因为可表示的数值范围是从0开始算的，而不是1。
也就是说41位可以表示个毫秒的值，转化成单位年则是年

10bit-工作机器id，用来记录工作机器id。

可以部署在个节点，包括5位datacenterId和5位workerId
5位（bit）可以表示的最大正整数是，即可以用0、1、2、3、....31这32个数字，来表示不同的datecenterId或workerId

12bit-序列号，用来记录同毫秒内产生的不同id。

12位（bit）可以表示的最大正整数是，即可以用0、1、2、3、....4094这4095个数字，来表示同一机器同一时间截（毫秒)内产生的4095个ID序号。

由于在Java中64bit的整数是long类型，所以在Java中SnowFlake算法生成的id就是long来存储的。

SnowFlake可以保证：

所有生成的id按时间趋势递增
整个分布式系统内不会产生重复id（因为有datacenterId和workerId来做区分）

Java实现

Twitter官方给出的算法实现是用Scala写的，这里不做分析，可自行查看。

public class IdWorker{

    //下面两个每个5位，加起来就是10位的工作机器id

    private long workerId;    //工作id

    private long datacenterId;   //数据id

    //12位的序列号

    private long sequence;

    public IdWorker(long workerId, long datacenterId, long sequence){

        // sanity check for workerId

        if (workerId > maxWorkerId || workerId < 0) {

            throw new IllegalArgumentException(String.format("worker Id can't be greater than %d or less than 0",maxWorkerId));

        }

        if (datacenterId > maxDatacenterId || datacenterId < 0) {

            throw new IllegalArgumentException(String.format("datacenter Id can't be greater than %d or less than 0",maxDatacenterId));

        }

        System.out.printf("worker starting. timestamp left shift %d, datacenter id bits %d, worker id bits %d, sequence bits %d, workerid %d",

                timestampLeftShift, datacenterIdBits, workerIdBits, sequenceBits, workerId);

        this.workerId = workerId;

        this.datacenterId = datacenterId;

        this.sequence = sequence;

    }

    //初始时间戳

    private long twepoch = 1288834974657L;

    //长度为5位

    private long workerIdBits = 5L;

    private long datacenterIdBits = 5L;

    //最大值

    private long maxWorkerId = -1L ^ (-1L << workerIdBits);

    private long maxDatacenterId = -1L ^ (-1L << datacenterIdBits);

    //序列号id长度

    private long sequenceBits = 12L;

    //序列号最大值

    private long sequenceMask = -1L ^ (-1L << sequenceBits);

    //工作id需要左移的位数，12位

    private long workerIdShift = sequenceBits;

   //数据id需要左移位数 12+5=17位

    private long datacenterIdShift = sequenceBits + workerIdBits;

    //时间戳需要左移位数 12+5+5=22位

    private long timestampLeftShift = sequenceBits + workerIdBits + datacenterIdBits;

    //上次时间戳，初始值为负数

    private long lastTimestamp = -1L;

    public long getWorkerId(){

        return workerId;

    }

    public long getDatacenterId(){

        return datacenterId;

    }

    public long getTimestamp(){

        return System.currentTimeMillis();

    }

     //下一个ID生成算法

    public synchronized long nextId() {

        long timestamp = timeGen();

        //获取当前时间戳如果小于上次时间戳，则表示时间戳获取出现异常

        if (timestamp < lastTimestamp) {

            System.err.printf("clock is moving backwards.  Rejecting requests until %d.", lastTimestamp);

            throw new RuntimeException(String.format("Clock moved backwards.  Refusing to generate id for %d milliseconds",

                    lastTimestamp - timestamp));

        }

        //获取当前时间戳如果等于上次时间戳（同一毫秒内），则在序列号加一；否则序列号赋值为0，从0开始。

        if (lastTimestamp == timestamp) {

            sequence = (sequence + 1) & sequenceMask;

            if (sequence == 0) {

                timestamp = tilNextMillis(lastTimestamp);

            }

        } else {

            sequence = 0;

        }

        //将上次时间戳值刷新

        lastTimestamp = timestamp;

        /**

          * 返回结果：

          * (timestamp - twepoch) << timestampLeftShift) 表示将时间戳减去初始时间戳，再左移相应位数

          * (datacenterId << datacenterIdShift) 表示将数据id左移相应位数

          * (workerId << workerIdShift) 表示将工作id左移相应位数

          * | 是按位或运算符，例如：x | y，只有当x，y都为0的时候结果才为0，其它情况结果都为1。

          * 因为个部分只有相应位上的值有意义，其它位上都是0，所以将各部分的值进行 | 运算就能得到最终拼接好的id

        */

        return ((timestamp - twepoch) << timestampLeftShift) |

                (datacenterId << datacenterIdShift) |

                (workerId << workerIdShift) |

                sequence;

    }

    //获取时间戳，并与上次时间戳比较

    private long tilNextMillis(long lastTimestamp) {

        long timestamp = timeGen();

        while (timestamp <= lastTimestamp) {

            timestamp = timeGen();

        }

        return timestamp;

    }

    //获取系统时间戳

    private long timeGen(){

        return System.currentTimeMillis();

    }

    //---------------测试---------------

    public static void main(String[] args) {

        IdWorker worker = new IdWorker(1,1,1);

        for (int i = 0; i < 30; i++) {

            System.out.println(worker.nextId());

        }

    }

}

算法中大量使用位运算，计算机对位运算操作非常快，这里不对位运算做过多解释。

雪花算法（SnowFlake）的更多相关文章

雪花算法-snowflake
雪花算法-snowflake 分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的. 有 ...
分布式系统-主键唯一id,订单编号生成-雪花算法-SnowFlake
分布式系统下我们每台设备(分布式系统-独立的应用空间-或者docker环境) * SnowFlake的优点是,整体上按照时间自增排序,并且整个分布式系统内不会产生ID碰撞(由数据中心ID和机器ID作 ...
Twitter雪花算法 SnowFlake算法的java实现
概述 SnowFlake算法是Twitter设计的一个可以在分布式系统中生成唯一的ID的算法,它可以满足Twitter每秒上万条消息ID分配的请求,这些消息ID是唯一的且有大致的递增顺序. 原理 Sn ...
【Java】分布式自增ID算法---雪花算法 (snowflake，Java版)
一般情况,实现全局唯一ID,有三种方案,分别是通过中间件方式.UUID.雪花算法. 方案一,通过中间件方式,可以是把数据库或者redis缓存作为媒介,从中间件获取ID.这种呢,优点是可以体现全局的递增 ...
雪花算法(snowflake)delphi版
雪花算法简单描述: + 最高位是符号位,始终为0,不可用. + 41位的时间序列,精确到毫秒级,41位的长度可以使用69年.时间位还有一个很重要的作用是可以根据时间进行排序. + 10位的机器标识,1 ...
雪花算法 Snowflake & Sonyflake
唯一ID算法Snowflake相信大家都不墨生,他是Twitter公司提出来的算法.非常广泛的应用在各种业务系统里.也因为Snowflake的灵活性和缺点,对他的改造层出不穷,比百度的UidGener ...
分布式唯一ID生成方案选型！详细解析雪花算法Snowflake
分布式唯一ID 使用RocketMQ时,需要使用到分布式唯一ID 消息可能会发生重复,所以要在消费端做幂等性,为了达到业务的幂等性,生产者必须要有一个唯一ID, 需要满足以下条件: 同一业务场景要全局 ...
Twitter雪花算法SnowFlake算法的java实现
https://juejin.im/post/5c75132f51882562276c5065 package javaDemo; /** * twitter的snowflake算法 -- java实 ...
一秒可生成500万ID的分布式自增ID算法—雪花算法 (Snowflake，Delphi 版)
概述分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的. 有些时候我们希望能使用一种 ...
分布式ID生成系统 UUID与雪花（snowflake）算法
Leaf——美团点评分布式ID生成系统 -https://tech.meituan.com/MT_Leaf.html 网游服务器中的GUID(唯一标识码)实现-基于snowflake算法-云栖社区-阿 ...

随机推荐

问题排查不再愁，Nacos 上线推送轨迹功能
简介: 微服务体系下,注册中心的调用和配置变更是家常便饭,例如阿里每天就有百万级变更.亿级推送.可是,一旦出现调用或配置异常,问题排查就成了用户最大的困惑:是注册和配置中心导致的,还是上下游业务自身的 ...
EMR StarRocks 极速数据湖分析原理解析
简介:数据湖概念日益火热,本文由阿里云开源大数据 OLAP 团队和 StarRocks 数据湖分析团队共同为大家介绍" StarRocks 极速数据湖分析 "背后的原理. [首月9 ...
阿里云何万青：南坡VS北坡，阿里云高性能计算行业实践
简介:北坡模式:借助于云上大计算性能突破来提供HPC服务,切入的重点更加聚焦于云服务. 随着数字化转型的深入,行业应用对算力提出更高要求.为满足不同行业灵活的业务形态与计算需求,以云计算技术为服务模 ...
vue框架keepAlive缓存的坑
页面跳转顺序index=>detail2=>detail3(三个页面不是单独请求数据,后两个页面是第一个页面数据的传递) detail2页面与methods同级: beforeRouteL ...
vue-cli快速搭建项目的几个文件（三）
==========有加载动画的app.vue=========== <template> <div id="app"> <keep-al ...
CF746 期望+逆序对
Link 题意:给定一个 \(1\) 到 \(n\) 的排列,等概率选一段区间 \([l, r]\) 随机排序,求期望逆序对数. \[E = \dfrac{\sum(cnt_{[1, n]} - cn ...
Spirng 当中 Bean的作用域
Spirng 当中 Bean的作用域 @ 目录 Spirng 当中 Bean的作用域每博一文案 1. Spring6 当中的 Bean的作用域 1.2 singleton 默认 1.3 protot ...
六：大数据架构 - Flink + AI
Flink 在AI 中的价值其实和大数据Lambda架构中流批统一这两个概念有关系,Flink为大数据实时化带来的价值也将同样使AI受益大数据的发展过程从Google奠基性的"三架马车& ...
【保姆级Python入门教程】马哥手把手带你安装Python、安装Pycharm、环境配置教程
您好,我是 @马哥python说 ,一枚10年程序猿. 我的社群中小白越来越多,咨询讨论的问题很多集中在python安装上,故输出此文,希望对大家起步有帮助. 下面开始,先安装Python,再安装py ...
GitHub总是打不开
终极解决方案 http://tool.chinaz.com/dns?type=1&host=github.com&ip= github.com vim /etc/hosts 添加下面内 ...

雪花算法（SnowFlake）

引言

雪花算法原理

Java实现

雪花算法（SnowFlake）的更多相关文章

随机推荐

热门专题