雪花算法生成全局唯一ID
系统中某些场景少不了全局唯一ID的使用,来保证数据的唯一性。除了通过数据库自带的自增id来保证 id 的唯一性,通常为了保证的数据的可移植性会选择通过程序生成全局唯一 id。
百度了不少php相关的生成方式,得到的大多是随机字符串和内置的 uniqid()函数。不过经过 ab 测试,在并发情况下重复度是很高的。
偶然看到了一篇 Twitter的分布式自增ID算法 snowflake 的文章,得到的全局唯一都是纯数字。这一点对于数据库来说,在此列上创建索引并通过此字段关联查询的时候是比较好的。
需要值得注意的是:snowflake的结构是64位的,所以需要在64位的PHP上运行。可以通过 phpinfo() 查看PHP的位数。一般 Linux 上的 PHP都可以满足。
下面是相关代码:
<?php
/***
* Author:阿远
* Class SnowflakeIdWorker
*/
class SnowflakeIdWorker{
/** 开始时间截 (2018-01-01) */
const twepoch = 1514736000000;
/** 机器id所占的位数 */
const workerIdBits = 10;
//支持的最大机器id,结果是1023 (这个移位算法可以很快的计算出几位二进制数所能表示的最大十进制数)
const maxWorkerId = (-1 ^ (-1 << self::workerIdBits));
//序列在id中占的位数
const sequenceBits = 12;
//机器ID向左移12位
const workerIdShift = self::sequenceBits;
//时间截向左移22位(10+12)
const timestampLeftShift = self::workerIdBits + self::sequenceBits;
//序列号值的最大值,这里为4095 (0b111111111111=0xfff=4095)
const sequenceMask = (-1 ^ (-1 << self::sequenceBits));
//工作机器ID(0~1023):默认0
private $workerId = 0;
//毫秒内序列(0~4095):标识符,常驻内存
static $sequence = 0 ;
//上次生成ID的时间截
static $lastTimestamp = -1;
/***
* 构造函数:设置当前机器id
* SnowflakeIdWorker constructor.
* @param $workerId
*/
public function __construct($workerId)
{
//转换类型
$workerId = (int) $workerId;
//判断参数合法性
if($workerId < 0 || $workerId > self::maxWorkerId){
die('error...');
}
//设置当前机器id
$this->workerId = $workerId;
}
public function nextId(){
//获取当前毫秒时间戳
$timestamp = $this->timeGen();
//获取上一次生成id时的毫秒时间戳
$lastTimestamp = self::$lastTimestamp;
//如果当前时间小于上一次ID生成的时间戳,说明系统时钟回退过这个时候应当抛出异常
if($timestamp < $lastTimestamp){
die('error...');
}
//如果是同一毫秒内生成的,则进行毫秒序列化
if($timestamp == $lastTimestamp){
//获取当前序列号值
self::$sequence = (self::$sequence + 1) & self::sequenceMask;
//毫秒序列化值溢出(就是超过了4095)
if(self::$sequence == 0){
//阻塞到下一秒,获得新的时间戳
$timestamp = $this->tilNextMillis($lastTimestamp);
}
}
//如果不是同一毫秒,那么重置毫秒序列化值
else{
self::$sequence = 0;
}
//重置上一次生成的时间戳
self::$lastTimestamp = $timestamp;
//移位并通过或运算拼到一起组成64位的ID
return
//时间戳左移 22 位
(($timestamp - self::twepoch) << self::timestampLeftShift) |
//机器id左移 12 位
($this->workerId << self::workerIdShift) |
//或运算序列号值
self::$sequence;
}
/****
* 阻塞到下一个毫秒,直到获得新的时间戳
* @param $lastTimestamp 上次生成ID的时间截
* @return float 当前毫秒时间戳
*/
private function tilNextMillis($lastTimestamp){
//重新获取当前时间戳
$timestamp = $this->timeGen();
//如果等于上一次获取的时间戳,仍然重新获取
while($timestamp <= $lastTimestamp){
$timestamp = $this->timeGen();
}
//返回新的时间戳
return $timestamp;
}
/***
* 返回当前毫秒时间戳
* @return float
*/
private function timeGen(){
return (float)sprintf("%.0f", microtime(true) * 1000);
}
}
//调用
header("Content-Type: text/html; charset=utf-8");
//
$work1 = new SnowflakeIdWorker(1);
for($i=0; $i<10;$i++) {
echo $i."--".$work1->nextId()."<br/>";
}
参考资料:Twitter的分布式自增ID算法snowflake
雪花算法生成全局唯一ID的更多相关文章
- 如何在高并发分布式系统中生成全局唯一Id
月整理出来,有兴趣的园友可以关注下我的博客. 分享原由,最近公司用到,并且在找最合适的方案,希望大家多参与讨论和提出新方案.我和我的小伙伴们也讨论了这个主题,我受益匪浅啊…… 博文示例: 1. ...
- 如何在高并发分布式系统中生成全局唯一Id(转)
http://www.cnblogs.com/heyuquan/p/global-guid-identity-maxId.html 又一个多月没冒泡了,其实最近学了些东西,但是没有安排时间整理成博文, ...
- (转)如何在高并发分布式系统中生成全局唯一Id
又一个多月没冒泡了,其实最近学了些东西,但是没有安排时间整理成博文,后续再奉上.最近还写了一个发邮件的组件以及性能测试请看 <NET开发邮件发送功能的全面教程(含邮件组件源码)> ,还弄了 ...
- 常见的生成全局唯一id有哪些?他们各有什么优缺点?
分布式系统中全局唯一id是我们经常用到的,生成全局id方法由很多,我们选择的时候也比较纠结.每种方式都有各自的使用场景,如果我们熟悉各种方式及优缺点,使用的时候才会更方便.下面我们就一起来看一下常见的 ...
- 面试官:如何在分布式场景下生成全局唯一 ID?
在分布式系统中,有一些场景需要使用全局唯一 ID ,可以和业务场景有关,比如支付流水号,也可以和业务场景无关,比如分库分表后需要有一个全局唯一 ID,或者用作事务版本号.分布式链路追踪等等,好的全局唯 ...
- 生成全局唯一ID
在实际业务处理中,有时需要生成全局唯一ID来区别同类型的不同事物,介绍一下几种方式及其C++实现 //获取全局唯一ID //server_id为服务的id,因当同一个服务部署在多个服务器上时,需要区别 ...
- 高并发分布式系统中生成全局唯一Id汇总
数据在分片时,典型的是分库分表,就有一个全局ID生成的问题.单纯的生成全局ID并不是什么难题,但是生成的ID通常要满足分片的一些要求: 1 不能有单点故障. 2 以时间为序,或者ID里包含时间 ...
- 游戏服务器生成全局唯一ID的几种方法
在服务器系统开发时,为了适应数据大并发的请求,我们往往需要对数据进行异步存储,特别是在做分布式系统时,这个时候就不能等待插入数据库返回了取自动id了,而是需要在插入数据库之前生成一个全局的唯一id,使 ...
- SnowFlake 生成全局唯一id
public class SnowFlakeUtil { private long workerId; private long datacenterId; private long sequence ...
随机推荐
- Spark 颠覆 MapReduce 保持的排序记录
在过去几年,Apache Spark的採用以惊人的速度添加着,通常被作为MapReduce后继,能够支撑数千节点规模的集群部署. 在内存中数 据处理上,Apache Spark比MapReduce更加 ...
- Machine_learning--score
辛苦了2个半月,终须学完了machine-learning watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvY2hyaXN0cHJpbmNlMDA3/font ...
- Gulp帮你自己主动搞定coffee和scss的compile
今天继续说说gulp的watch,能够自己主动搞定非常多事情.不用每次都去敲命令了! 上次说到用gulp能够非常方便的进行css,js,html的压缩.而且能够对coffee和scss进行编译. cs ...
- ACdream 1112 Alice and Bob (博弈&&素数筛选优化)
题目链接:传送门 游戏规则: 没次能够将一堆分成两堆 x = a*b (a!=1&&b!=1)x为原来堆的个数,a,b为新堆的个数. 也能够将原来的堆的个数变成原来堆的约数y.y!=x ...
- python 004 执行环境对比
对比:os.system os.popen subprocess.Popen subprocess.call 为什么要搞这么多? # --*--encoding: utf-8--*-- import ...
- 自适应阈值分割—大津法(OTSU算法)C++实现
大津法是一种图像灰度自适应的阈值分割算法,是1979年由日本学者大津提出,并由他的名字命名的.大津法按照图像上灰度值的分布,将图像分成背景和前景两部分看待,前景就是我们要按照阈值分割出来的部分.背景和 ...
- iOS版本、iPhone版本、Xcode版本比对
iOS版本 iPhone版本 Xcode版本 其他 2003年 Xcode1.0 2005年4月29日 Xcode2.0 2007年1月9日 iPhone OS(iOS1): 虚拟键盘.谷歌地图 第一 ...
- C++ this指针 全部
在每一个成员函数中都包含一个特殊的指针,这个指针的名字是固定的.叫做this.它是指向本类对象的指针,它的值是当前被调用的成员函数所在的对象的起 始地址.例如:当调用成员函数a.volume ...
- PCB SLOT槽孔数量计算方法,同CAM350孔数一致 实现方法
最近有好几个写脚本的朋友问我,SLOT槽孔孔的如何计算的,要求孔数与CAM350孔数保持一致. 前几年通过在CAM350里面不断测试,结果是:CAM 350中SLOT槽孔,孔与孔之间最高位,凸位高度值 ...
- Electron桌面应用:环境搭建
目录 一.简介 二.市场 三.安装 1.安装node版本 2.安装国内的npm包管理器 3.安装electron 4.验证electron否安装成功 5.使用git克隆一个electron简单的项目, ...