mongodb的ObjectId最后三个字节有趣的地方

ObjectId 由12个字节组成，其中组成如下：

a 4-byte timestamp value, representing the ObjectId’s creation, measured in seconds since the Unix epoch

a 5-byte random value

a 3-byte incrementing counter, initialized to a random value

前4个字节为以秒为单位的时间戳

中间5个字节为随机字符串

最后3个字节是一个随机数，并且递增

3个字节24位，也就是1秒内生成2的24次，即16777216个不重复的ObjectId。

但是请看文档中的描述，incrementing counter, initialized to a random value

当时我看到这里就想，为什么不能从0开始呢，比如某一秒的第一个 ObjectId 是5ebc0b522d5c8f0c0c【000000】，接着是5ebc0b522d5c8f0c0c【000001】、5ebc0b522d5c8f0c0c【000002】 ... 一直到最大值，然后下一秒，又是从【000000】开始。

因为如果使用随机数，那么有可能某一秒的第一个 ObjectId 是5ebc0b522d5c8f0c0c【fffffe】，那接下来这一秒还需要生成 ObjectId，岂不是溢出了，不能用了？

后来实验了一下，发现不是我想象的那样。

在 shell 中执行 db.foo.insertOne({ t: "t" })，发现随机数的递增与时间戳无关，也就是当前连接第一次生成随机数后，后面执行的操作都会使用这个随机数递增，而不会生成另一个随机数。

第一次执行，生成ObjectId如 {这一秒的时间戳}{随机字符串}28c060

下一个ObjectId => {这一秒的时间戳}{随机字符串}28c061

下一个ObjectId => {这一秒的时间戳}{随机字符串}28c062

......

一直到最大值，然后再从 000000 开始算起

所以 mongodb 确实是能在1秒内生成不重复的16777216个ObjectId

注意，随机字符串在同一个 shell 连接中是相同的。

插个题外话：mongodb从3.4版本开始，中间5个字节就已经改为随机字符串了，而不是3个字节表示机器标识码+2个字节表示进程号。至于为什么，官网没说，可以看其他开发者的猜想

mongodb的ObjectId最后三个字节有趣的地方的更多相关文章

MongoDB中ObjectId的误区，以及引起的一系列问题
近期对两个应用进行改造,在上线过程中出现一系列问题(其中一部分是由于ObjectId误区导致的) 先来了解下ObjectId: TimeStamp 前 4位是一个unix的时间戳,是一个int类别,我 ...
[MongoDB]MongoDB的ObjectId组成
一.ObjectId的组成首先通过终端命令行,向mongodb的collection中插入一条不带“_id”的记录.然后,通过查询刚插入的数据,发现自动生成了一个objectId“5e4fa350b6 ...
在UTF-8中，一个汉字为什么需要三个字节？
UNICODE是万能编码,包含了所有符号的编码,它规定了所有符号在计算机底层的二进制的表示顺序.有关Unicode为什么会出现就不叙述了,Unicode是针对所有计算机的使用者定义一套统一的编码规范, ...
请问utf-8的中文是一个汉字占三个字节长度吗？
这是个好问题,可以当作一个笔试题.先从字符编码讲起. 1.美国人首先对其英文字符进行了编码,也就是最早的ascii码,用一个字节的低7位来表示英文的128个字符,高1位统一为0: 2.后来欧洲人发现尼 ...
搭建高可用mongodb集群（三）—— 深入副本集内部机制
在上一篇文章<搭建高可用mongodb集群(二)—— 副本集> 介绍了副本集的配置,这篇文章深入研究一下副本集的内部机制.还是带着副本集的问题来看吧! 副本集故障转移,主节点是如何选举的? ...
字符集之在UTF-8中，一个汉字为什么需要三个字节？
(一)在UTF-8中,一个汉字为什么需要三个字节? UNICODE是万能编码,包含了所有符号的编码,它规定了所有符号在计算机底层的二进制的表示顺序.有关Unicode为什么会出现就不叙述了,Unico ...
lua去掉字符串中的UTF-8的BOM三个字节
废话不多说,还是先说点吧,项目中lua读取的text文件如果有BOM,客户端解析就会报错,所以我看了看,任务编辑器swGameTaskEditor 在写入文件的时候,也不知道为什么有的文件就是UTF- ...
在UTF-8中，一个汉字为什么需要三个字节？（转）
http://www.cnblogs.com/web21/p/6092414.html UNICODE是万能编码,包含了所有符号的编码,它规定了所有符号在计算机底层的二进制的表示顺序.有关Unicod ...
搭建高可用mongodb集群（三）—— 深入副本集内部机制
在上一篇文章<搭建高可用mongodb集群(二)-- 副本集> 介绍了副本集的配置,这篇文章深入研究一下副本集的内部机制.还是带着副本集的问题来看吧! 副本集故障转移,主节点是如何选举的? ...

随机推荐

LA3971组装电脑
题意: 你有b块钱,想要组装一台电脑,给你提供一些零件,每种零件提供一个或几个,组装电脑的前提是每种零件只能也必须选择一个,每种零件都有自己的种类,名字,价格,还有品质,要求是在能配成电脑 ...
华为USG6000V防火墙简单配置案例
如图,PC1是企业内网用户,要通过防火墙NAT方式( 1.1.1.105-1.1.1.106 )访问Internet,Server是企业的FTP服务器,通过静态NAT方式供外网用户访问,对外的地址是1 ...
UVA10827球面上的最大和
题意: 最大子矩阵的加强版,就是给你一个n*n的矩阵,每个格子里面都有数字,然后我们在里面选择一个矩阵,使得矩阵中所有数字的和最大,而且这个题目说这个n*n的矩阵的最右边和最左边是相邻的,最 ...
在 GitHub 学习，成长为自己想要的样子｜HelloGitHub 访谈
万事开头难,我们经过长期的策划和筹备,终于推出了 HelloGitHub 采访系列「开源项目作者的访谈」.这是一个采访个人开源项目作者的栏目,内容侧重于开源项目作者与开源的故事. 我们深知想要做好一个 ...
Python学习笔记-StatsModels 统计回归（3）模型数据的准备
1.读取数据文件回归分析问题所用的数据都是保存在数据文件中的,首先就要从数据文件读取数据. 数据文件的格式很多,最常用的是 .csv,.xls 和 .txt 文件,以及 sql 数据库文件的读取 . ...
游戏中的2D OBB碰撞模型的碰撞算法介绍和实践
前言上一篇博文说道,射线与场景中模型上的所有三角形求交时,会大幅度影响效率且花费比较多的时间,因此会采取使用包围盒的形式,进行一个加速求交.在此文中介绍OBB碰撞模型的碰撞算法 OBB的碰撞模型有 ...
10-10-12分页机制（xp）
虚拟地址到物理地址虚拟地址空间就是32位系统的那4GB,这4GB空间的地址称为虚拟地址.虚拟地址经过分段机制后转化为线性地址,一般虚拟地址都等于线性地址,因为大多数段寄存器的基地址都为0,只有FS段 ...
linux下将一个大的文件拆分成若干小文件
命令:split,例子: 以行数拆分 -l参数: split –l 50 原始文件拆分后文件名前缀说明:以50行对文件进行拆分,最后一个文件的行数没有50行以实际行数进行分配,比如有一个名为 wl ...
关于有符号数和无符号数的转换 - C/C++
转载自:http://www.94cto.com/index/Article/content/id/59973.html 1.引例: 今天在做了一道关于有符号数和无符号数相互转换及其左移/右移的问题, ...
activiti知识点梳理
一.Activiti是什么 Alfresco 软件在 2010 年 5 月17 日宣布 Activiti业务流程管理(BPM)开源项目的正式启动,其首席架构师由业务流程管理 BPM的专家 Tom Ba ...

mongodb的ObjectId最后三个字节有趣的地方

mongodb的ObjectId最后三个字节有趣的地方的更多相关文章

随机推荐

热门专题