这个问题来源于我书中引用的一幅图:

我们从图中明显可以看某性能测试的结果表明普通机械磁盘的顺序I/O性能指标是53.2M values/s,SSD的顺序I/O性能指标是42.2M values/s,而内存的随机I/O性能指标是36.7M values/s。虽然图中没有给出values的具体含义,但既然使用了相同的单位,应该是它们是可以比较的。由此似乎可以得出结论:磁盘的顺序I/O性能要强于内存的随机I/O性能。

当初引入这幅图的主要目的是想说明Kafka顺序访问磁盘(特别是顺序写入)的性能并不像想象中的那么差。现在看来,这幅图还是有一些问题的,里面具体的数值也值得推敲。

第一就是单位不明确。一般这种测试常见的统计单位应该是MB/s,即磁盘或内存的吞吐量(TPS)或带宽(Bandwidth),但如果这里的values指的就是MB,显然数值又太小了,所以我目前搞不清楚这个values指代的是什么。这是第一个问题。

第二个问题就在于没有分开讨论读和写。很多磁盘的读写TPS差异很大,特别是对于随机I/O来说,不同块大小(block size)的随机IO相差巨大。这张图里面只是笼统地给出了磁盘的顺序I/O和随机I/O性能,没有显式区分出读写来。这是第二个问题。

第三个问题就在于图中的数值与我们平时的印象是矛盾的。一般情况下,我们会认为内存的TPS应该是很高的。即使是随机I/O也不应该比磁盘的要差,但这张图清晰地表明它真的就是差。特别是今天有人拿实际的测试结果反驳了图中的结论。下面我们着重探讨一下第三个问题。

首先是实际测试数据:内存使用的是DDR3的三星内存,TPS测试结果为2500MB/s,但没有说清楚是读TPS还是写TPS,也没有提及使用的chunk大小是多少,更没有说是随机IO访问还是顺序IO访问。不过我们姑且认为是随机IO吧,毕竟我们要PK的就是内存的随机IO。磁盘这边使用的是SSD,经测试最大的顺序读写IO大约是63MB/s,同样没有说到底是读IO还是写IO。测试结果说明SSD磁盘顺序IO TPS远逊于内存IO TPS。那么到底哪个是对的呢?为什么图中显示磁盘顺序IO是能胜过内存随机IO的呢?

针对这个矛盾之处,我个人的看法是这里面存在着田忌赛马的情形,也就是说图中用于比较的SSD和内存应该不是同一个等级的,有可能找了一个很好的SSD去与一个普通的内存条进行比较。拿上面实际的例子而言DDR3的三星内存TPS为2500MB/s,但这不算什么太好的成绩。还存在很多更好的内存产品远不止2500MB/s的吞吐量,比如Corsair Vengeance DDR3宣称能够达到5000+MB/s的随机IO TPS(它是以2MB chunk做的测试)。具体的数据来源详见:https://www.storagereview.com/corsair_vengeance_ddr3_ram_disk_review

至于SSD,顺序IO TPS超过2500MB/s的也有,比如这款基于MLC的Micron P420m SSD就宣称其顺序IO TPS能到3300MB/s。具体的数据来源详见:https://www.storagereview.com/micron_p420m_enterprise_pcie_ssd_review

那么现在如果用Micron P420m SSD和上面的三星内存比,其顺序IO的TPS就超过内存的随机IO TPS。这样看来,这不就是田忌赛马吗?用一个非常好的磁盘去PK一个普通的内存,结果就很可能是图中的那个样子。所以,个人认为不用太纠结图中的数据,只需要了解磁盘顺序读写性能很好或至少不差这个事实就好了:)

另外我感觉这张图还有其他不太合理的地方,比如对于SSD而言,顺序IO性能几乎是随机IO的40倍。的确,随机IO是要慢于顺序IO的,特别是对于写入而言,但在SSD中这不总是成立的。

如果IO size很小或者说写入数据很小(比如小于32MB),随机写入自然是要慢于顺序写入;但当IO size增加到某个程度后(比如和clustered block一样大或是其整数倍),那么随机写和顺序写的表现是差不多的,因为不再需要做过多的拷贝擦除,而且SSD内部的并行机制会开始逐渐起作用,抵消随机写和顺序写之间的差异。从这个角度来说,我觉得图中的两组数值对比过于悬殊了,似乎也有不真实的地方。

总之,我对这张图的结论是图中的数字是有一些水分的,至少没有给出完整的测试说明,缺乏必要的事实基础,但图要呈现的结论依然是成立的,即在某种程度下,磁盘顺序I/O访问(特别是写操作)是能够匹敌内存的随机I/O访问性能的。

关于顺序磁盘IO比内存随机IO快的讨论的更多相关文章

  1. 说说IO(一)- IO的分层

    IO性能对于一个系统的影响是至关重要的.一个系统经过多项优化以后,瓶颈往往落在数据库:而数据库经过多种优化以后,瓶颈最终会落到IO.而IO性能的发展,明显落后于CPU的发展.Memchached也好, ...

  2. 【磁盘】顺序IO比随机IO快

    假设磁盘每秒可以做100个随机I/O操作,并且可以完成每秒10MB的顺序读取(这大概是消费级磁盘现在能达到的水平).如果每行100字节,随机读每秒可以读100行(相当于每秒10000字节=10KB), ...

  3. 顺序、随机IO和Java多种读写文件性能对比

    概述 对于磁盘的读写分为两种模式,顺序IO和随机IO. 随机IO存在一个寻址的过程,所以效率比较低.而顺序IO,相当于有一个物理索引,在读取的时候不需要寻找地址,效率很高. 基本流程 总体结构 我们编 ...

  4. mysql在高内存、IO利用率上的几个优化点 (sync+fsync) 猎豹移动技术博客

    http://dev.cmcm.com/archives/107 Posted on 2014年10月16日 by liuding | 7条评论 以下优化都是基于CentOS系统下的一些优化整理,有不 ...

  5. linux下的CPU、内存、IO、网络的压力测试

    linux下的CPU.内存.IO.网络的压力测试  要远程测试其实很简单了,把结果放到一个微服务里直接在web里查看就可以了,或者同步到其他服务器上 一.对CPU进行简单测试: 1.通过bc命令计算特 ...

  6. MySQL在高内存、IO利用率上的几个优化点

    以下优化都是基于CentOS系统下的一些MySQL优化整理,有不全或有争议的地方望继续补充完善. 一.mysql层面优化 1. innodb_flush_log_at_trx_commit 设置为2设 ...

  7. [转帖]linux下的CPU、内存、IO、网络的压力测试

    linux下的CPU.内存.IO.网络的压力测试 https://www.cnblogs.com/zhuochong/p/10185881.html 一.对CPU进行简单测试: 1.通过bc命令计算特 ...

  8. [转帖]linux下CPU、内存、IO、网络的压力测试,硬盘读写速度测试,Linux三个系统资源监控工具

    linux下CPU.内存.IO.网络的压力测试,硬盘读写速度测试,Linux三个系统资源监控工具 https://blog.51cto.com/hao360/1587165 linux_python关 ...

  9. 转载: 一、linux cpu、内存、IO、网络的测试工具

    来源地址: http://blog.csdn.net/wenwenxiong/article/details/77197997 记录一下 以后好找.. 一.linux cpu.内存.IO.网络的测试工 ...

随机推荐

  1. BZOJ-1043 [HAOI2008]下落的圆盘

    几何题... 先把所有圆储存起来,然后对于每个圆我们求得之后放下的圆挡住了的部分,求个并集,并把没被挡到的周长加进答案. #include <cstdlib> #include <c ...

  2. 微信小程序统一服务消息下发接口 公众号和小程序消息都可以在一个接口推送了

    昨天晚上,2018年9月11日,微信官方又更新了一大波的小程序功能.重点我们来谈谈这个功能,微信叫做统一服务消息下发接口. 这个是官方的文档  统一服务消息 · 小程序https://develope ...

  3. java修炼

    java程序员修炼之道——大牛告诉我们应该好好学习与修炼以下知识与技能   ———————————————————— 一:Java语言学习(对线程(thread),串行化,反射,网络编程,JNI技术, ...

  4. about coroutine

    co 有协作的意思,是让多个 routine 合作来完成某件或者某几件事情,它主要解决的问题就是合理安排一些耗时长的工作的执行时间,让其他的工作有机会得到执行.

  5. 又看了一次EM 算法,还有高斯混合模型,最大似然估计

    先列明材料: 高斯混合模型的推导计算(英文版): http://www.seanborman.com/publications/EM_algorithm.pdf 这位翻译写成中文版: http://w ...

  6. hdu 5950 Recursive sequence 递推式 矩阵快速幂

    题目链接 题意 给定\(c_0,c_1,求c_n(c_0,c_1,n\lt 2^{31})\),递推公式为 \[c_i=c_{i-1}+2c_{i-2}+i^4\] 思路 参考 将递推式改写\[\be ...

  7. [SaltStack] Crontab部署

    salt.states.cron 接着早上安静的时间, 在这里梳理下crontab相关的东东, 主要是crontab的统一管理维护, 包括新增, 修改, 下线等等. 下面就详细看下crontab的sl ...

  8. 多线程设计模式 : Master-Worker模式

    Master-Worker是常用的并行计算模式.它的核心思想是系统由两类进程协作工作:Master进程和Worker进程.Master负责接收和分配任务,Worker负责处理子任务.当各个Worker ...

  9. Chrome 75 将原生支持图片懒加载

    4 月 6 日,Google 的 Chrome & Web 平台工程经理 Addy Osmani 在个人博客发文,介绍到 <img> 和 <iframe> 的 load ...

  10. bzoj 5056: OI游戏

    5056: OI游戏 Time Limit: 1 Sec  Memory Limit: 64 MBSubmit: 204  Solved: 162[Submit][Status][Discuss] D ...