[转帖]SCSI、ISCSI、iSER、NVMe、NVMe-oF、NVMe-oF over RDMA
在存储系统中,上层协议可以泛指“指令”,也就是比如“读出从某某开始的多少长度的扇区”,指令包含三大关键信息:
(1)操作码:Opreation Code,或称为OP code;比如write、read等等。
(2)起始地址:从哪里开始读。如果是文件的话,精确到字节,如果是硬盘,精确到LBA(扇区)。
(3)长度:从起始地址往后多长的一段字节或者扇区。
那么,指令如何传递给对端的设备?你可以自己将上述指令的二进制码再编码一下,用手电筒的亮灭传递给对方,对方收到之后闪一下手电筒表示已经收到。此时,手电筒编码、收到后怎么表示收到,这也是一种协议,属于传输层协议。而手电筒就是物理层的接口,最终通过物理层,也就是光在真空中传播来将信息发送到对方。
同理,SCSI指令/协议和NVMe指令/协议,是存储系统面向机械盘和固态介质分别开发的两种上层协议。它们可以被over到传输层协议+网络层/链路层/物理层接口上传输到对方,比如SCSI over FC,SCSI over SAS,[(SCSI over TCP) over IP] ethernet (ISCSI),SCSI over RDMA over IB(SRP),SCSI over TCP over IP over IB。以及NVMe over PCIe over标准插槽、NVMe over PCIe over M.2接口、NVMe over PCIe overSFF8639接口等等。NVMe最好是直接over到PCIe上,因为目前来讲,PCIe的物理层+链路层+网络层+传输层还是非常高效的,算是开放式IT设备外部IO总线里速率较高使用最广泛的。当然,如果是为了扩展性考虑,也可以把NVMe over TCP/IP over 以太网,或者NVMe over RDMA over以太网/IB,或者NVMe over FC等等。
底层接口,同样是手电筒,有人用灯丝灯泡的,有人用led的,有人用袖珍的,有人用手提的,有人用头戴的。这就是接口不同,但它们传递的信息编码、物理层都是一样的。比如,PCIe可以用标准插槽,也可以用自定义插槽,但里面的信号针脚数量都是一样的。
各类存储系统使用的协议及接口
存储系统中的硬件物理接口,包括:
(1)SCSI协议及接口:
最原始的上层协议及底层接口标准。有人可能蒙了,SCSI不是上层协议的名字吗,为何底层物理接口也叫SCSI?因为SCSI这个标准最早的时候把上层协议一直到底层传输协议、网络层、物理层全给定义了。其定义了:表示层到物理层。 目前已被淘汰。
(2)IDE协议及接口
承载ATA协议,面向消费级,与SCSI接口处于同一个时代。同属并行总线接口,最大接2个设备。物理层速率比同时代SCSI接口低。其定义了:传输层到物理层。目前已被淘汰。
(3)FC协议及接口
用于存储系统时则承载SCSI协议,理论上可以承载任何上层协议。分为FCAL和FC Fabric两种网络层拓扑。磁盘接入的是FCAL拓扑。其定义了:传输层到物理层。
(4)SATA协议及接口
仅用于承载ATA协议。其用于取代IDE接口。属于串行总线,每个通道只能接入一个设备。其定义了:传输层到物理层。
(5)SAS协议及接口
在存储系统中用于取代FCAL接口。其定义了:传输层到物理层。
(6)PCIe协议及接口
承载PCIe传输协议。其可以承载各种上层协议。用于存储系统时,一般直接承载NVMe协议,也可以承载SCSI协议,但后者没有普及。其定义了:传输层到物理层。
(7)emmc协议及接口
(8)ufs协议及接口
上述的SCSI、FC、SAS等各种协议都相应定义了自己的物理层连接器形态。但这并不意味着某种连接器只能承载当初定义它的那个协议。比如:SATA连接器可以承载以太网物理层信号等等,有个原则就是,为高速率传输协议定义的连接器,可以承载低速率传输协议,反之则不行。
SCSI
小型计算机系统接口(SCSI,Small Computer System Interface)是一种用于计算机及其周边设备之间(硬盘、软驱、光驱、打印机、扫描仪等)系统级接口的独立处理器标准。SCSI标准定义命令、通信协议以及实体的电气特性(换成OSI的说法,就是占据物理层、链接层、套接层、应用层),最大部分的应用是在存储设备上(例如硬盘、磁带机);但,其实SCSI可以连接的设备包括有扫描仪、光学设备(像CD、DVD)、打印机……等等
SCSI是一套完整的数据传输协议,其主要功能是在主机和存储设备之间传送命令、状态和块数据。在各类存储技术中,SCSI技术可谓是最重要的脊梁。
SCSI协议位于操作系统和外部资源之间,它具有一系列的功能组件,操作系统对外部设备(如磁盘、磁带、光盘、打印机等)的I/O操作均可以通过SCSI协议来实现,一般情况下,SCSI协议都嵌入到设备驱动器或者主机适配器的板载逻辑中。
例如,应用程序一般将数据作为文件来访问。尽管数据最终都将在磁盘上以数据块的方式存放,但是文件的检索需要一系列功能将未加工的块数据装配成应用程序能够操作的连续文件。这个过程的第一步由应用程序通过操作系统所连接的文件系统承担。文件系统以目录、文件夹和文件的方式来创建人们可读的数据抽象。当一个用户的应用程序打开一个文件时,会引发一系列的进程。它们使用底层SCSI命令,控制数据块从存储系统到内存的安全传输。因此在文件系统层次中,数据传输在文件描述和块I/O之间进行。
正像文件系统描述了对用户应用程序数据的抽象一样,物理存储设备被描述成文件系统的抽象。例如,在Windows中的E盘或者Linux中的/dev/sda可以是一个单独的磁盘、一个大磁盘的一部分或者多磁盘的条带阵列。文件系统依赖于卷管理功能,它将各种存储设备看作可以并发的、很容易访问的资源。设备的虚拟化将物理存储转换成逻辑存储,并且承担了在磁盘上放置数据块所需的复杂任务。文件/数据块转换和映射功能可以像一个单独的卷管理应用程序那样复杂,也可以像适配卡设备驱动程序接口那么简单明了。例如,Windows NT提供了Windows磁盘管理程序,为物理磁盘分配逻辑驱动器名。适配卡的设备驱动程序负责将它的资源作为一个物理SCSI实体,出现在Windows磁盘管理程序中。Windows磁盘管理程序可以为这些资源分配逻辑名,文件系统按顺序使用这些逻辑名为目录和文件确定位置。
如下图所示,逻辑抽象的层次从实际的物理SCSI设备一直到同主机系统的连接。在操作系统层次,一般的访问方法允许对SCSI设备进行统一的处理,而不考虑它们在系统中的物理连接。在保存文件时,文件系统并不关心逻辑驱动器是一个SCSI单元、一个Fibre Channel阵列还是千兆以太网的某个IP存储设备。在各种情况下,逻辑实体和物理存储的映射完成主机系统和合适的目标SCSI命令的发送,它在二者之间用来传输数据块。
SCSI协议虽然是目前最为流行的数据传输协议,但是也存在着很多的缺点,如:SCSi总线上设备数限制为15,不适用于多服务器多存储设备的网络结构;SCSI总线的长度限制在25米,不适用于构造各种网络拓扑结构等。
NVMe协议
nvme协议全称为Non-VolatitControllerInterface高级主机控制接口,既是一种接口也是一种协议
iSCSI
iSCSI(Internet Small Computer System Interface,发音为/ˈаɪskʌzi/),Internet小型计算机系统接口,又称为IP-SAN,是一种基于因特网及SCSI-3协议下的存储技术,由IETF提出,并于2003年2月11日成为正式的标准。与传统的SCSI技术比较起来,iSCSI技术有以下三个革命性的变化:
把原来只用于本机的SCSI协议透过TCP/IP网络发送,使连接距离可作无限的地域延伸;
连接的服务器数量无限(原来的SCSI-3的上限是15);
由于是服务器架构,因此也可以实现在线扩容以至动态部署。
iSCSI利用了TCP/IP的port 860 和 3260 作为沟通的渠道。透过两部计算机之间利用iSCSI的协议来交换SCSI命令,让计算机可以透过高速的局域网集线来把SAN模拟成为本地的储存装置。
iSCSI使用 TCP/IP 协议(一般使用TCP端口860和3260)。 本质上,iSCSI 让两个主机通过 IP 网络相互协商然后交换SCSI命令。这样一来,iSCSI 就是用广域网仿真了一个常用的高性能本地存储总线,从而创建了一个存储局域网(SAN)。
iSER
iSER 代表“用于 RDMA 的 iSCSI 扩展”(iSCSI Extensions for RDMA)。它是 iSCSI 数据传输模型的扩展,iSCSI 是 TCP/IP 的存储网络标准。iSER在利用 iSCSI 组件的同时使用RDMA 协议套件 。
即RDMA可以和成熟的iSCS协议配合,优化iSCSI的消息和数据传输,但同时保持iSCSI良好的管理型和可路由特性。
ISER 的链接协议是什么?
ISER是iSCSI的RDMA传输,链接协议可以是以太网或InfiniBand,支持任何速度(10、40、56、100Gb/s)。
iSER支持三种传输层,InfiniBand,RoCE和iWARP。
ISER 的优势是什么?
iSER使用RDMA协议套件,为块存储传输提供更高的带宽(0拷贝)。为此,它消除了处理TCP/IP协议栈的CPU开销,同时保留了与iSCSI协议的兼容性。
此外,它具有最低的延迟和最低的CPU利用率。此外,它还享有iSCSI协议的稳定性和优势,如安全性、高可用性等。
由于IB很难一统数据中心网络,而iWARP需要TCP/IP堆栈支持,效率比较差,因此,未来一统数据中心网络的存储协议,最有可能的就是iSER over RoCE。
特别是新的闪存时代,可能会使得iSER更加热门,而iSER目前最大的鼓吹者就是Mellanox,在今年的美国闪存峰会上,他们有一个演讲,讲了iSER要火的一些理由。
首先,闪存的速度越来越快,使得网络协议的时延也成为瓶颈。Intel推广NVMe over Fabric解决这个问题,但Mellanox主推iSER。
因为iSER现在已经支持100G,是目前最快的存储协议之一。
关键是iSER除了支持InfiniBand,还支持RoCE。FCoE淡出后,iSER成为以太网一统数据中心的新希望。
iSER如果利用DCB网络,完全无需TCP/IP堆栈,传输的效率比iWARP要高,但比SRP更好管理,因为它利用了iSCSI成熟的管理技术。
还有,iSER支持所有SCSI/iSCSI的应用,因此,应用都无需改动。只是OS需要驱动,目前Linux和VMware ESXi,Oracle Solaris已经支持,Windows和FreeBSD也会很快支持。存储如Zadara已经支持,网络也有相应的接口卡和数据中心交换机支持。
部署 iSER 有哪些要求?
1、够使用SCSI和iSCSI层的应用程序
2、能够通过RDMA的网络
--支持RDMA的适配器卡(InfiniBand的以太网)。
--以太网交换机(带流量控制或PFC)。
--InfiniBand交换机
3、支持iSER的目标
NVMe-oF
NVMe over Fabrics (NVMe-oF)
NVMe SSD 通过直接连接到计算机或服务器中利用外围组件互连高速 (PCIe) 高速总线。从本质上讲,NVMe 降低了 CPU 开销并简化了降低延迟的操作,增加了每秒输入/输出操作 (IOPS) 和吞吐量。
NVMe-oF支持在主机与固态存储设备或系统之间通过网络进行数据传输。NVMe-oF继承了NVMe的所有优点,包括轻量级和高效的命令集、多核感知和协议并行性。NVMe-oF是真正的网络无关的,因为它支持所有常见的fabrics,包括光纤通道、InfiniBand和以太网。
NVMe-oF over RDMA
InfiniBand,RoCE和iWARP。
[转帖]SCSI、ISCSI、iSER、NVMe、NVMe-oF、NVMe-oF over RDMA的更多相关文章
- IDE SATA SCSI iSCSI等存储硬盘对比与分析
原文地址:http://blog.csdn.net/trochiluses/article/details/21229283 IDE是并口硬盘,(5400-7200转): SATA是串口硬盘,(720 ...
- [转帖]InfiniBand, RDMA, iWARP, RoCE , CNA, FCoE, TOE, RDMA, iWARP, iSCSI等概念
InfiniBand, RDMA, iWARP, RoCE , CNA, FCoE, TOE, RDMA, iWARP, iSCSI等概念 2017-12-15 15:37:00 jhzh951753 ...
- [SPDK/NVMe存储技术分析]008 - RDMA概述
毫无疑问地,用来取代iSCSI/iSER(iSCSI Extensions for RDMA)技术的NVMe over Fabrics着实让RDMA又火了一把.在介绍NVMe over Fabrics ...
- NVMe over Fabrics:概念、应用和实现
对于大部分人来说,NVMe over Fabrics(简称NVMf)还是个新东西,因为其第一个正式版本的协议在今年6月份才发布.但是这并不影响人们对NVMf的关注,因为这项依托于NVMe的技术很可能继 ...
- [知乎]老狼:UFS VS NVMe
https://zhuanlan.zhihu.com/p/26652622 最近某手机厂商的闪存门在知乎上被人踢爆,在所谓“爵士水军”和“友商水军”的口水大战中,至少eMMC, UFS等火星名词被广泛 ...
- [SPDK/NVMe存储技术分析]001 - SPDK/NVMe概述
1. NVMe概述 NVMe是一个针对基于PCIe的固态硬盘的高性能的.可扩展的主机控制器接口. NVMe的显著特征是提供多个队列来处理I/O命令.单个NVMe设备支持多达64K个I/O 队列,每个I ...
- 文章汇总(包括NVMe SPDK vSAN Ceph xfs等)
基础部分 NVMe驱动解析-前言 NVMe驱动解析-注册设备 NVMe驱动解析-关键的BAR空间 NVMe驱动解析-DMA传输(热门) NVMe驱动解析-响应I/O请求 用一个简单的例子窥探NVMe的 ...
- linux nvme的那些workqueue
目前nvme三个常见的使用的workqueue ,主要有nvme_workq,nvme_rdma_wq ,nvme_fc_wq,下面一一描述一下初始化及使用的场景.分别对应于NVME over PCI ...
- linux内核源码分析 - nvme设备的初始化
本文为原创,转载请注明:http://www.cnblogs.com/tolimit/ 本文基于3.18.3内核的分析,nvme设备为pcie接口的ssd,其驱动名称为nvme.ko,驱动代码在dri ...
- NVMe概述
目前企业SSD市场按照接口协议主要分为SATA SSD,PCIe SSD和NVMe SSD,其中SATA SSD沿用了传统的HDD使用的SATA协议,在企业应用和服务器兼容性上具有优势:而PCIe S ...
随机推荐
- CIDR技术划分和计算
CIDR:无类域间路由 由于早期的IP地址的划分会浪费太多的IP地址,所以,现在都是用CIDR表示法,为此引入了子网掩码的概念,即网络位的个数可以任意指定.该方法兼容早期的IP划分方法. CIDR表示 ...
- 第二部分_Shell脚本变量部分超详细解析
Shell脚本变量部分超详细解析 变量的定义 [基本知识补充] 基本符号的意义: 脚本执行和调试方法: 1. 变量是什么? 一句话概括:变量是用来临时保存数据的,该数据是可以变化的数据. [注意] 单 ...
- Java开发如何通过IoT边缘ModuleSDK进行进程应用的开发?
摘要:为解决用户自定义处理设备数据以及自定义协议设备快速接入IOT平台的诉求,华为IoT边缘提供ModuleSDK,用户可通过集成SDK让设备以及设备数据快速上云. 本文分享自华为云社区<[华为 ...
- CPU高速缓存与极性代码设计
摘要:CPU内置少量的高速缓存的重要性不言而喻,在体积.成本.效率等因素下产生了当今用到的计算机的存储结构. 介绍 cpu缓存的结构 缓存的存取与一致 代码设计的考量 最后 CPU频率太快,其处理速度 ...
- 华为云云原生数据库GaussDB加速创新,企业核心数据上云信赖之选
集大会演讲.圆桌讨论.精彩活动及现场直击....一大波华为开发者大会2021干货资料来喽~~!还等什么快快来领取技术福利! 摘要:华为开发者大会(Cloud)上,华为云发布了云原生数据库GaussDB ...
- 云图说|一张图看懂一站式DevOps利器——华为云DevCloud
阅识风云是华为云信息大咖,擅长将复杂信息多元化呈现,其出品的一张图(云图说).深入浅出的博文(云小课)或短视频(云视厅)总有一款能让您快速上手华为云.更多精彩内容请单击此处. 摘要: 华为云DevCl ...
- APP违法使用个人信息?不用怕,华为云VSS为你保驾护航
摘要:华为云VSS漏洞扫描服务移动应用安全检测,为华为云客户提供移动应用的合规检测能力,遵循工信部164号文要求,针对安卓(apk)和鸿蒙(hap)应用进行安全和隐私合规问题检测. 本文分享自华为云社 ...
- 2023年 CISO 需要高度关注的任务和趋势
在过去的几年中,企业一直忙于应对远程办公模式下的安全要求.展望2023年,疫情局面将与过去3年大不相同.根据目前的趋势,未来一年的网络攻击的数量和严重程度都将增加,这将对各规模企业,尤其是未做好准备的 ...
- 限时促销,火山引擎 ByteHouse 为企业带来一波数智升级福利!
更多技术交流.求职机会,欢迎关注字节跳动数据平台微信公众号,回复[1]进入官方交流群 面对庞杂的海量数据,稳定高速的实时数据处理能力,成为了当下企业数智升级过程中备受关注的点. ByteHouse 是 ...
- Java 网络编程 —— 基于 UDP 的数据报和套接字
UDP 简介 UDP(User Datagram Protocol,用户数据报协议)是传输层的另一种协议,比 TCP 具有更快的传输速度,但是不可靠.UDP 发送的数据单元被称为 UDP 数据报,当网 ...