由于微信不允许外部链接,你需要点击文章尾部左下角的 "阅读原文",才能访问文中链接。

生物信息很多文章都提到:DNA 序列的 100 万个碱基数据(兆碱基)大致相当于计算机 1 兆的存储空间。借着这个问题,我们今天来聊一聊计算机存储和数据传输中 Kb、KB、Bps、bps 的一些区别,看看所谓的兆碱基到底是使用哪一种标准(单位)怎么计算出来的。


计算机存储容量单位

bit (binary digit):亦称二进制位,指二进制中的一位,是信息的最小单位。位的值只会是 0 或 1。虽然计算机也提供对位的判断和操作,但是计算机指令一般以字节(Byte)为单位。在大多数的计算机系统中,八位是一个字节。一位的值通常以存储电容是否带电来衡量。

B (Byte):字节。8 个二进制位构成1个”字节(Byte)”,它是电脑存储空间的基本计量单位。1 字节 (Byte)=8(bit) 位,就是有 8 个二进制数组成。1 个英文字符是 1 个字节,也就是 1B;1 个汉字为 2 个字符,也就是 2B。

GB(Gigabyte):吉字节,是一种十进制的信息计量单位。Gibibyte(giga binary byte 的缩写)则是二进制信息计量的一个单位,简称 GiB。吉字节(Gigabyte)常容易和二进制的信息计量单位 Gibibyte 混淆。

Gibibyte 与 Gigabyte 常常被混淆,前者的计算方式是二进制,后者的计算方式是十进制。现今的计算上,常把 Gigabyte 以二进制的方式计算,即 
230=1,073,741,824
。(因为 Windows 对 GB 这个信息计量单位的误用,因此在 Windows 中显示的 “1GB”,其实应是指 “1GiB”,但 Windows 却显示为 “1GB”,而常造成误解。误用会普遍化的一大因素,是因为 Windows 的操作系统占有率高),由于两种换算方法的不同,使容量在计算上相差了 7.3%,所以常有 Windows 系统报告的容量比硬盘标示的容量还要小的情况发生。但在苹果公司的 OS X 操作系统中,对于存储设备的容量计算方式与硬盘厂商一致,均为 1GB = 1,000,000,000(
10
)字节的十进制,避免了计算和使用上的麻烦。

—— 维基百科 - Gibibyte,
https://zh.wikipedia.org/wiki/Gibibyte

K、M、G 都是 KB、MB、GB 的简称。由于混淆已经普遍化,Gigabyte 往往是指 Gibibyte,所以平时我们说的 1 兆存储就是1M(MB),1G 存储就是 1GB)。我们的照片一般是 104KB、209KB、1.45MB、2.45MB、3.32MB 等等。

在说明其他储存单位的换算前,我们来看看两个标准:SI、IEC。

国际单位制(SI)

国际单位制(简称 SI,来自于法语 Système International d’Unités),是世界上最普遍采用的标准度量系统。国际单位制以七个基本单位(米(m),千克(kg),秒(s),安培(A),开尔文(K),摩尔(mol),坎德拉(cd))为基础,由此建立起一系列相互换算关系明确的”一致单位”。另有二十个基于十进制的词头,当加在单位名称或符号前的时候,可用于表达该单位的倍数或分数。

国际电工委员会(IEC)

国际电工委员会(IEC, International Electrotechnical Commission)成立于 1906 年,至今已有 90 多年的历史。它是世界上成立最早的国际性电工标准化机构,负责有关电气工程和电子工程领域中的国际标准化工作。

IEC 的宗旨是,促进电气、电子工程领域中标准化及有关问题的国际合作,增进国际间的相互了解。为实现这一目的,IEC出版包括国际标准在内的各种出版物,并希望各成员在本国条件允许的情况下,在本国的标准化工作中使用这些标准。

目前 IEC 的工作领域已由单纯研究电气设备、电机的名词术语和功率等问题扩展到电子、电力、微电子及其应用、通讯、视听、机器人、信息技术、新型医疗器械和核仪表等电工技术的各个方面。IEC标准的权威性是世界公认的,截止到2008年12月底,IEC 已制定了 5425 个国际标准。

不同标准下储存单位的次方单位:

比特率单位

在电信和计算领域,比特率(Bit rate)是指单位时间内传输送或处理的比特的数量。比特率经常在电信领域用作连接速度、传输速度、信息传输速率和数字带宽容量的同义词。

在数字多媒体领域,比特率是单位时间播放连续的媒体如压缩后的音频或视频的比特数量。在这个意义上讲,它相当于术语数字带宽消耗量,或吞吐量。

比特率规定使用”比特每秒”(bit/s 或 bps)为单位,经常和国际单位制词头关联在一起:

  • bps(bit/s),即 bit pro second(位每秒);

  • Kbps(Kbit/s),即 Kilobit pro second(千位每秒);

  • Mbps(Mbit/s),即 Milionbit pro second(百万位每秒)。

其中,bit 即比特,通常用 b(小写)表示,指一位二进制位,Milionbit=1000Kilobit=1000 000bit,所以1Mbps=1000 000bps;

bps 和 Bps

bps 是通常用来衡量带宽的单位,常见于表示数据机及网络通讯的传输速率,指每秒钟传输的二进制位数。例如 GigabitEthernet 端口。

5 minute input rate 38410000 bits/sec, 6344 packets/sec
382410000 bits/sec = 382.41Mbps

通常电脑(软件)上显示的上传下载速度(如下面的阿里云 OSSBrowser、Google Chrome 数据下载速度),则是指每秒种传输的字节数(Byte)通常用 B(大写)表示:MB 即百万字节也称兆字节;KB 即千字节;B 即字节。

  • 1B=8b

  • 1MB=1024KB=1024*1024B

  • 1Mbps=1000Kbps=1000/8KBps=125KBps

我们通常说的 1M 带宽即指 1Mbps,因此 1M 的带宽下载的速度一般不会超过 125KB 每秒。2M、3M 带宽的下载速度分别不会超过 250KB、375KB 每秒。

数据传输速率的衡量单位 K 是十进制含义,但数据存储的 K 是2进制含义。

1kbit/s 就是 1000bit/s,而 KB 是 1024 个字节,注意 KB(KByte) 和 kbit 的区别,另外,数据传输速率的单位是 bit/s 记作:bps 。

在实际应用中:

  • 1kbps=1000bps

  • 1Mbps=1000,000bps

  • 1bps=0.000001bps

1Mbps 与 1m/s 是有区别的,1m/s 指的是 1024KB/s,而 1Mbps 指的是(1000/8)KB/s 也就是 125KB/S。

记住 K 和 k 是没区别的  ,区别在于 bps 属于位每秒的单位,而 m/s ,KB/s 这两个属于字节每秒的单位,一字节等于 8 位,即 1k=8b。

兆碱基

所以,在文章开头提到的 DNA 序列的 100 万个碱基数据(兆碱基)大致相当于计算机 1 兆的存储空间。其实也就是这么计算来得:

一个碱基就是一个英文字母,而一个英文字母是 1 个字节(Byte),所以 100 万个碱基就是 1000,000 Byte。按照 SI 国际单位的十进制标准,正好相当于 1 MB,如果按照 IEC 国际电工委员会的二进制标准,应该为:1000,000 / 1024 /1024 ≈ 0.95 MB,则是大致相当于计算机 1 兆的存储空间。

参考资料:


  • Wiki: Gibibyte,维基百科

  • Wiki:比特率,维基百科

  • 沙翁,《什么是Mbps、Kbps、bps、kb、mb及其换算和区别》,博客园

  • 大任Dren,《bit、Byte、bps、Bps、pps、Gbps的单位详细说明及换算》,CSDN-专业IT技术社

·end·

—如果喜欢,快分享给你的朋友们吧—

我们一起愉快的玩耍吧

本文分享自微信公众号 - 生信科技爱好者(bioitee)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

从兆碱基到 Kb、KB、Bps、bps 之间的区别的更多相关文章

  1. Kb,KB,Kbps,Mb,Mbps等一些列概念

    先普及一下Kb,KB,Kbps,Mb,Mbps等一些列概念 1Byte = 8bit1KB (Kilobyte 千字节)=1024Byte1MB (Megabyte,兆字节,简称“兆”)=1024KB ...

  2. Kib Kb KB KIB 区别

    今天和同事聊了一下Kib Kb KB KIB这几个单位的含义及其区别,自己在网上也查了查资料,总结如下: Ki 和 K 只是数学单位 Ki = 1024 K  = 1000 这二者之间没有任何联系 B ...

  3. 什么是Mbps、Kbps、bps、kb、mb及其换算和区别

    Mbps 即 Milionbit pro second(百万位每秒): Kbps 即 Kilobit pro second(千位每秒): bps 即 bit pro second(位每秒): 速度单位 ...

  4. 转 什么是Mbps、Kbps、bps、kb、mb及其换算和区别

    Mbps 即 Milionbit pro second(百万位每秒): Kbps 即 Kilobit pro second(千位每秒): bps 即 bit pro second(位每秒): 速度单位 ...

  5. 理论基础知识之————KB Kb Kbps 相关单位的区别和换算

    换算公式 8bit(位)=1Byte(字节) 1024Byte(字节)=1KB 1024KB=1MB 1024MB=1GB 1024GB=1TB 容量是大写的  B 而传输的速度是小写的  b bps ...

  6. 网络基础知识-bps、Bps、pps的区别

    在计算机科学中,bit是表示信息的最小单位,叫做二进制位:一般用0和1表示.Byte叫做字节,由8个位(8bit)组成一个字节(1Byte),用于表示计算机中的一个字符.bit(比特)与Byte(字节 ...

  7. KB,Kb单位换算,网络带宽中的Kbps和KB/s到底是什么意思? (注:B和b的区别)

    B是指字节(Byte)1个字节有8个比特组成    b是指比特(bit)代表一个2进制位(值为0或1) 上过网的朋友应该会听说过网络带宽这个词,可是这个网络带宽的单位到底是什么,为什么有的人说Kbps ...

  8. bit、byte、kb、mb、g的区别

    1Byte=8bit1KB=1024Byte(字节)=8*1024bit1MB=1024KB1GB=1024MB1TB=1024GB bit是计算机数据的最小单元.要么是0,要么是1. byte 关键 ...

  9. bit,byte,word,bps,Bps,比特,字节,字, 一图看懂

  10. b,B,KB,MB,GB,TB,PB,EB,ZB,YB,BB,NB,DB的含义,之间的关系

    1bit=1位2进制信息 1B (byte 字节)1KB(Kilobyte 千字节)=2(10)B=1024B=2(10)B: 1MB(Megabyte 兆字节)=2(10)KB=1024KB=2(2 ...

随机推荐

  1. Learning with Mini-Batch

    在机器学习中,学习的目标是选择期望风险\(R_{exp}\)(expected loss)最小的模型,但在实际情况下,我们不知道数据的真实分布(包含已知样本和训练样本),仅知道训练集上的数据分布.因此 ...

  2. ABAP READ内表新老语法对比

    1.读取内表行新语法 740新语法中,对标READ,提出了新的语法,如下: 1.1.根据字段值查找 "-----------------------------@斌将军----------- ...

  3. 我为什么推荐Nuxt3

    我为什么推荐Nuxt3? 大家好,我今天想和你们分享一个非常棒的前端框架--Nuxt3.自从我接触了Nuxt3,我发现它在前端开发领域具有很多优点.我想逐一向你们介绍Nuxt3的优势,并向大家推荐一些 ...

  4. Windows Powershell无法切换anaconda的问题

    前言 近期做大创发现power shell启动以后activate环境之后没有反应,遂进行如下操作 启用默认配置 使用管理员模式打开Powershell 输入conda init powershell ...

  5. golang pprof 监控系列(3) —— memory,block,mutex 统计原理

    golang pprof 监控系列(3) -- memory,block,mutex 统计原理 大家好,我是蓝胖子. 在上一篇文章 golang pprof监控系列(2) -- memory,bloc ...

  6. [Linux]调整swap

    在启动Tomcat的过程中,tomcat/catalina.out中报出如下故障: > /opt/govern/wydaas/logs/catalina.out # There is insuf ...

  7. 1.UML之类图

    前言 在实际软件开发中,很多人都忽视了先设计后编码的理念,特别是像我这样的新手菜鸟:但在我亲戚的指导下,我便开启了一个简单项目的先设计关卡. 今天的重中之重---UML,学习了它,我们在编写项目代码时 ...

  8. 性能最快的代码分析工具,Ruff 正在席卷 Python 圈!

    几天前,Python 开源社区又出了一个不小的新闻:HTTPX 和 Starlette 在同一天将在用的代码分析工具(flake8.autoflake 和 isort)统一替换成了 Ruff. HTT ...

  9. TiDB与MySQL的SQL差异及执行计划简析

    作者:京东零售 肖勇 一. 前言导读 TiDB作为NewSQL,其在对MySQL(SQL92协议)的兼容上做了很多,MySQL作为当下使用较广的事务型数据库,在IT界尤其是互联网间使用广泛,那么对于开 ...

  10. JVM调优笔记(一)--Nacos GC引发的服务批量下线问题

    故障背景 线上批量发服务下线的告警邮件,偶发nacos连接超时.采用了spring boot admin(以下称sba)进行服务监控. 原因分析 因为sba服务是基于nacos对其它服务进行监控,所以 ...