引言

唯一ID可以标识数据的唯一性，在分布式系统中生成唯一ID的方案有很多，常见的方式大概有以下三种：

依赖数据库，使用如MySQL自增列或Oracle序列等。
UUID随机数
snowflake雪花算法(本文将要讨论)

数据库和UUID方案的不足之处

1.采用数据库自增序列

读写分离时，只有主节点可以进行写操作，可能有单点故障的风险

分表分库，数据迁移合并等比较麻烦

2.UUID随机数

采用无意义字符串，没有排序

UUID使用字符串形式存储，数据量大时查询效率比较低

雪花算法原理

SnowFlake算法生成id的结果是一个64bit大小的整数，它的结构如下图：

其中

1bit，不用，因为二进制中最高位是符号位，1表示负数，0表示正数。生成的id一般都是用整数，所以最高位固定为0。

41bit-时间戳，用来记录时间戳，毫秒级。

41位可以表示个数字，
如果只用来表示正整数（计算机中正数包含0），可以表示的数值范围是：0 至，减1是因为可表示的数值范围是从0开始算的，而不是1。
也就是说41位可以表示个毫秒的值，转化成单位年则是年

10bit-工作机器id，用来记录工作机器id。

可以部署在个节点，包括5位datacenterId和5位workerId
5位（bit）可以表示的最大正整数是，即可以用0、1、2、3、....31这32个数字，来表示不同的datecenterId或workerId

12bit-序列号，用来记录同毫秒内产生的不同id。

12位（bit）可以表示的最大正整数是，即可以用0、1、2、3、....4094这4095个数字，来表示同一机器同一时间截（毫秒)内产生的4095个ID序号。

由于在Java中64bit的整数是long类型，所以在Java中SnowFlake算法生成的id就是long来存储的。

SnowFlake可以保证：

所有生成的id按时间趋势递增
整个分布式系统内不会产生重复id（因为有datacenterId和workerId来做区分）

Java实现

Twitter官方给出的算法实现是用Scala写的，这里不做分析，可自行查看。

public class IdWorker{

    //下面两个每个5位，加起来就是10位的工作机器id

    private long workerId;    //工作id

    private long datacenterId;   //数据id

    //12位的序列号

    private long sequence;

    public IdWorker(long workerId, long datacenterId, long sequence){

        // sanity check for workerId

        if (workerId > maxWorkerId || workerId < 0) {

            throw new IllegalArgumentException(String.format("worker Id can't be greater than %d or less than 0",maxWorkerId));

        }

        if (datacenterId > maxDatacenterId || datacenterId < 0) {

            throw new IllegalArgumentException(String.format("datacenter Id can't be greater than %d or less than 0",maxDatacenterId));

        }

        System.out.printf("worker starting. timestamp left shift %d, datacenter id bits %d, worker id bits %d, sequence bits %d, workerid %d",

                timestampLeftShift, datacenterIdBits, workerIdBits, sequenceBits, workerId);

        this.workerId = workerId;

        this.datacenterId = datacenterId;

        this.sequence = sequence;

    }

    //初始时间戳

    private long twepoch = 1288834974657L;

    //长度为5位

    private long workerIdBits = 5L;

    private long datacenterIdBits = 5L;

    //最大值

    private long maxWorkerId = -1L ^ (-1L << workerIdBits);

    private long maxDatacenterId = -1L ^ (-1L << datacenterIdBits);

    //序列号id长度

    private long sequenceBits = 12L;

    //序列号最大值

    private long sequenceMask = -1L ^ (-1L << sequenceBits);

    //工作id需要左移的位数，12位

    private long workerIdShift = sequenceBits;

   //数据id需要左移位数 12+5=17位

    private long datacenterIdShift = sequenceBits + workerIdBits;

    //时间戳需要左移位数 12+5+5=22位

    private long timestampLeftShift = sequenceBits + workerIdBits + datacenterIdBits;

    //上次时间戳，初始值为负数

    private long lastTimestamp = -1L;

    public long getWorkerId(){

        return workerId;

    }

    public long getDatacenterId(){

        return datacenterId;

    }

    public long getTimestamp(){

        return System.currentTimeMillis();

    }

     //下一个ID生成算法

    public synchronized long nextId() {

        long timestamp = timeGen();

        //获取当前时间戳如果小于上次时间戳，则表示时间戳获取出现异常

        if (timestamp < lastTimestamp) {

            System.err.printf("clock is moving backwards.  Rejecting requests until %d.", lastTimestamp);

            throw new RuntimeException(String.format("Clock moved backwards.  Refusing to generate id for %d milliseconds",

                    lastTimestamp - timestamp));

        }

        //获取当前时间戳如果等于上次时间戳（同一毫秒内），则在序列号加一；否则序列号赋值为0，从0开始。

        if (lastTimestamp == timestamp) {

            sequence = (sequence + 1) & sequenceMask;

            if (sequence == 0) {

                timestamp = tilNextMillis(lastTimestamp);

            }

        } else {

            sequence = 0;

        }

        //将上次时间戳值刷新

        lastTimestamp = timestamp;

        /**

          * 返回结果：

          * (timestamp - twepoch) << timestampLeftShift) 表示将时间戳减去初始时间戳，再左移相应位数

          * (datacenterId << datacenterIdShift) 表示将数据id左移相应位数

          * (workerId << workerIdShift) 表示将工作id左移相应位数

          * | 是按位或运算符，例如：x | y，只有当x，y都为0的时候结果才为0，其它情况结果都为1。

          * 因为个部分只有相应位上的值有意义，其它位上都是0，所以将各部分的值进行 | 运算就能得到最终拼接好的id

        */

        return ((timestamp - twepoch) << timestampLeftShift) |

                (datacenterId << datacenterIdShift) |

                (workerId << workerIdShift) |

                sequence;

    }

    //获取时间戳，并与上次时间戳比较

    private long tilNextMillis(long lastTimestamp) {

        long timestamp = timeGen();

        while (timestamp <= lastTimestamp) {

            timestamp = timeGen();

        }

        return timestamp;

    }

    //获取系统时间戳

    private long timeGen(){

        return System.currentTimeMillis();

    }

    //---------------测试---------------

    public static void main(String[] args) {

        IdWorker worker = new IdWorker(1,1,1);

        for (int i = 0; i < 30; i++) {

            System.out.println(worker.nextId());

        }

    }

}

算法中大量使用位运算，计算机对位运算操作非常快，这里不对位运算做过多解释。

雪花算法（SnowFlake）的更多相关文章

雪花算法-snowflake
雪花算法-snowflake 分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的. 有 ...
分布式系统-主键唯一id,订单编号生成-雪花算法-SnowFlake
分布式系统下我们每台设备(分布式系统-独立的应用空间-或者docker环境) * SnowFlake的优点是,整体上按照时间自增排序,并且整个分布式系统内不会产生ID碰撞(由数据中心ID和机器ID作 ...
Twitter雪花算法 SnowFlake算法的java实现
概述 SnowFlake算法是Twitter设计的一个可以在分布式系统中生成唯一的ID的算法,它可以满足Twitter每秒上万条消息ID分配的请求,这些消息ID是唯一的且有大致的递增顺序. 原理 Sn ...
【Java】分布式自增ID算法---雪花算法 (snowflake，Java版)
一般情况,实现全局唯一ID,有三种方案,分别是通过中间件方式.UUID.雪花算法. 方案一,通过中间件方式,可以是把数据库或者redis缓存作为媒介,从中间件获取ID.这种呢,优点是可以体现全局的递增 ...
雪花算法(snowflake)delphi版
雪花算法简单描述: + 最高位是符号位,始终为0,不可用. + 41位的时间序列,精确到毫秒级,41位的长度可以使用69年.时间位还有一个很重要的作用是可以根据时间进行排序. + 10位的机器标识,1 ...
雪花算法 Snowflake & Sonyflake
唯一ID算法Snowflake相信大家都不墨生,他是Twitter公司提出来的算法.非常广泛的应用在各种业务系统里.也因为Snowflake的灵活性和缺点,对他的改造层出不穷,比百度的UidGener ...
分布式唯一ID生成方案选型！详细解析雪花算法Snowflake
分布式唯一ID 使用RocketMQ时,需要使用到分布式唯一ID 消息可能会发生重复,所以要在消费端做幂等性,为了达到业务的幂等性,生产者必须要有一个唯一ID, 需要满足以下条件: 同一业务场景要全局 ...
Twitter雪花算法SnowFlake算法的java实现
https://juejin.im/post/5c75132f51882562276c5065 package javaDemo; /** * twitter的snowflake算法 -- java实 ...
一秒可生成500万ID的分布式自增ID算法—雪花算法 (Snowflake，Delphi 版)
概述分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的. 有些时候我们希望能使用一种 ...
分布式ID生成系统 UUID与雪花（snowflake）算法
Leaf——美团点评分布式ID生成系统 -https://tech.meituan.com/MT_Leaf.html 网游服务器中的GUID(唯一标识码)实现-基于snowflake算法-云栖社区-阿 ...

随机推荐

在kubernetes集群中使用虚拟节点创建1万Pod-支持在线教育业务
使用虚拟节点提升k8s集群容量和弹性在kubernetes集群中添加虚拟节点的方式已被非常多的客户普遍使用,基于虚拟节点可以极大提升集群的Pod容量和弹性,灵活动态的按需创建ECI Pod,免去集群 ...
Maxcompute-UNION数据类型对齐的方法
简介: 怎么对齐两段union脚本的数据类型第1章问题概述 1.1 UNION中隐式类型转换问题近期参与的一个私有云项目要升级,因为maxcompute要升级到更新的版本,对之 ...
Arthas 初探--安装初步适用
简介: 由于在项目中遇到一种情况,某段代码在进行单元测试和在 tomcat 容器中运行的性能相差数百倍,因此需要分析在不同环境下某个方法执行的具体时间,从而确定问题.Arthas 可以做到无侵入的监控 ...
如何利用 AHAS 保障 Web 服务稳如磐石？
简介:应用高可用服务 AHAS (Application High Availability Service) 是经阿里巴巴内部多年高可用体系沉淀下来的云产品,基于阿里开源流控降级组件 Sentin ...
Hologres揭秘：如何支持超高QPS在线服务（点查）场景
简介: 本期我们将揭秘Hologres如何支持超高QPS在线服务(点查)场景. Hologres(中文名交互式分析)是阿里云自研的一站式实时数仓,这个云原生系统融合了实时服务和分析大数据的场景,全面兼 ...
Quick BI V4.0功能“炸弹”来袭，重磅推出即席分析、模板市场、企业微信免密登录等强势功能
简介: 2021年7月,Quick BI公共云版本迭代新功能:重磅推出即席分析.模板市场,分析门槛再降低:推出企业微信无缝对接,移动端类目个性配置及管理提升多端能力:数据建模配置交互升级至拖拽模式提升 ...
[FE] Js DOM 操作的几个常见错误
1.setTimeout 匿名函数传参问题,匿名函数形参是不能直接在内部使用的,匿名函数传参需要按顺序从 setTimeout 的第三个参数开始依次传递. 2. Js clone出来的 dom 节点, ...
7.deployment扩容-查看pod使用的CPU-统计ready状态节点数量
官方文档:https://kubernetes.io/zh-cn/docs/tasks/run-application/scale-stateful-set/题目1: 将名为loadbalancer的 ...
深入学习和理解Django模板层：构建动态页面
title: 深入学习和理解Django模板层:构建动态页面 date: 2024/5/5 20:53:51 updated: 2024/5/5 20:53:51 categories: 后端开发 t ...
超轻量级的c#版基于文件的日志记录工具，可定制输出格式，可指定日志文件
这是我自己个人编写的日志记录,主要使用在只需要记录日志,偶尔到文件中查看一下日志记录的情况.我自己写的一些服务之类的是使用了这个的,代码很少,使用很简单. 第一步搜索和安装我的Nuget包搜索和安 ...

雪花算法（SnowFlake）

引言

雪花算法原理

Java实现

雪花算法（SnowFlake）的更多相关文章

随机推荐

热门专题