Fio 输出内容的解释

feilianbb 2016-01-11 16:18:54

27828

翻译原文来源

https://tobert.github.io/post/2014-04-17-fio-output-explained.html

fio，又称为Flexible IO Tester，是Jens Axboe编写的应用程序。Jens是Linux Kernel中block IO subsystem的维护者。fio从多个方面来看类似于更古老的ffsb工具，但他们之间似乎没有任何关系。作为一个强大的工具，fio可以产生足够多的任意类型的负载 (arbitrary load)。作为权衡，fio不容易学习，这就是这篇文章的目的。

config
raw output

config

以下是一个50/50读写的垃圾处理IO (Trashing IO)负载，对于多个盘进行的读写。

5分钟，磁盘垃圾处理测试，50/50读写在每个盘上产生相同数量的随机读和写IO，为每个盘产生测试数据。

# a 5 minute disk thrashing benchmark

# generates equal amounts of random read and write IO on every drive

# will generate metrics for each drive

[global]

ioengine=libaio

direct=1

unified_rw_reporting=1

rw=randrw

time_based=1

runtime=300s

<strong># Seagate 7200RPM SAS 512G ST9500430SS (sdb)</strong>

[/dev/disk/by-path/pci-0000:03:00.0-sas-0x5000c5000d7f96d9-lun-0]

write_lat_log=7200RPMSAS-0x5000c5000d7f96d9

<strong># Seagate 7200RPM Enterprise SATA 1TB ST31000340NS (sdg)</strong>

[/dev/disk/by-id/wwn-0x5000c500151229dd]

write_lat_log=7200RPMEnterpriseSATA-0x5000c500151229dd

<strong># Samsung 840 Pro 128GB (on a 3G SATA port) (sdd)</strong>

[/dev/disk/by-id/ata-Samsung_SSD_840_PRO_Series_S1ANNSADB05219A]

write_lat_log=SSDSATA-S1ANNSADB05219A

# 2x SAS drives with GPT partition & MDRAID0 (sdi1 + sdc1)

<strong># Seagate 7200RPM SAS 512G ST9500430SS</strong>

[/dev/disk/by-id/md-uuid-6bb71ed6:e4410fc9:b27af0b7:0afe758d]

write_lat_log=7200RPMSAS-MDRAID0

raw output

以上链接可打开上述fio配置的原始输出。

接下来按照每个部分分析输出内容。这里显示的数据是Samsung 840 Pro SSD，其他盘的数据稍后再深入研究。

对于每一个部分的描述在输出文字下面。

read : io=10240MB, bw=63317KB/s, iops=15829, runt=165607msec

第一行很容易读懂。fio做了10GB的IO，速率63.317MB/s，总IOPS 15829 (默认4k block size)，运行了2分钟45秒。

你看到的第一个延迟(Latency)数据是slat，或称为submission latency。这个值和他的名字很相像，代表“盘需要多久将IO提交到kernel做处理?”。

slat (usec): min=3, max=335, avg= 9.73, stdev= 5.76

我起初认为submission latency对于性能调试没有用，但是下面的数据让我改变了观点。269usec或1/4 ms看起来是噪音(noise)，需要关注一下。我还没有做任何调试，所以我猜测改变scheduler以告诉kernel这不是机械硬盘会有效果。

以下是从其他盘上得到的更多例子。

 slat (usec): min=3, max=335, avg= 9.73, stdev= 5.76 (SATA SSD)

 slat (usec): min=5, max=68,  avg=26.21, stdev= 5.97 (SAS 7200)

 slat (usec): min=5, max=63,  avg=25.86, stdev= 6.12 (SATA 7200)

 slat (usec): min=3, max=269, avg= 9.78, stdev= 2.85 (SATA SSD)

 slat (usec): min=6, max=66,  avg=27.74, stdev= 6.12 (MDRAID0/SAS)

 clat (usec): min=1, max=18600, avg=51.29, stdev=16.79

接下来是completion latency。这是命令提交到kernel到IO做完之间的时间，不包括submission latency。在老版本的fio中，这是估计应用级延迟的最好指标。

lat (usec): min=44, max=18627, avg=61.33, stdev=17.91

在我看来，'lat'是一个新的指标，在man或者文档中都没有描述。分析C代码，似乎这个值是从IO结构体创建时刻开始，直到紧接着clat完成，这个算法最好地表现出了应用程序的行为。

clat percentiles (usec):
| 1.00th=[ 42], 5.00th=[ 45], 10.00th=[ 45], 20.00th=[ 46],
| 30.00th=[ 47], 40.00th=[ 47], 50.00th=[ 49], 60.00th=[ 51],
| 70.00th=[ 53], 80.00th=[ 56], 90.00th=[ 60], 95.00th=[ 67],
| 99.00th=[ 78], 99.50th=[ 81], 99.90th=[ 94], 99.95th=[ 101],
| 99.99th=[ 112]

Completion latency百分数的解释一目了然，可能是输出信息中最有用的部分。我看了代码，这不是slat+clat，而是用了单独的结构体记录。

这个列表可以在config文件中配置。在精简输出模式下有20个这样的格式，%f=%d; %f=%d;... 解析这样的输出格式会很有趣。

作为比较，这里列出一个7200RPM SAS硬盘运行完全相同的负载的统一部分数据。

Seagate 7200RPM SAS 512G ST9500430SS

clat percentiles (usec):

     |  1.00th=[ 3952],  5.00th=[ 5792], 10.00th=[ 7200], 20.00th=[ 8896],

     | 30.00th=[10304], 40.00th=[11456], 50.00th=[12608], 60.00th=[13760],

     | 70.00th=[15168], 80.00th=[16768], 90.00th=[18816], 95.00th=[20608],

     | 99.00th=[23424], 99.50th=[24192], 99.90th=[26752], 99.95th=[28032],

     | 99.99th=[30080]

    bw (KB  /s): min=52536, max=75504, per=67.14%, avg=63316.81, stdev=4057.09

带宽(bandwidth)的意思显而易见，而per=part就不是很好理解。文档上说这个值是指在单个盘上跑多个负载，可以用来看每个进程消耗了多少IO。对于我这样把fio跑在多个盘的情况，这个值意义不大。但由于SSD和机械硬盘混合使用，这个值挺有趣。

下面是另一个SAS硬盘，占测试的所有4个盘总IO的0.36%。

    bw (KB  /s): min=   71, max=  251, per=0.36%, avg=154.84, stdev=18.29

    lat (usec) :   2= 0.01%,   4=0.01%,  10=0.01%,   20=0.01%, 50=51.41%

    lat (usec) : 100=48.53%, 250=0.06%, 500=0.01%, 1000=0.01%

    lat (msec) :   2= 0.01%,   4=0.01%,  10=0.01%,   20=0.01%

latency分布部分我看了几遍才理解。这是一组数据。与三行使用一样的单位不同，第三行使用了毫秒(ms)，使得文本宽度可控。把第三行读成2000, 4000, 10000, 20000微秒(us)就更清晰了。

这组数据表示latency的分布，说明了51.41%的request延迟小于50微秒，48.53%的延迟小于100微秒(但是大于50微秒)，以此类推。

lat (msec) : 4=1.07%, 10=27.04%, 20=65.43%, 50=6.46%, 100=0.01%

如果想用快速脚本解析这些繁琐的数据，你可能需要知道，最后一部分会省略那些没有数据的项。例如，我使用的SAS盘没有IO可以在1毫秒中完成，所以只有一行。

cpu          : usr=5.32%, sys=21.95%, ctx=2829095, majf=0, minf=21

这是用户/系统CPU占用率，进程上下文切换(context switch)次数，主要和次要(major and minor)页面错误数量(page faults)。由于测试是配置成使用直接IO，page faults数量应该极少。

IO depths    : 1=100.0%, 2=0.0%, 4=0.0%, 8=0.0%, 16=0.0%, 32=0.0%, >=64=0.0%

Fio有一个iodepth设置，用来控制同一时刻发送给OS多少个IO。这完全是纯应用层面的行为，和盘的IO queue不是一回事。这里iodepth设成1，所以IO depth在全部时间都是1。

     submit    : 0=0.0%, 4=100.0%, 8=0.0%, 16=0.0%, 32=0.0%, 64=0.0%, >=64=0.0%

     complete  : 0=0.0%, 4=100.0%, 8=0.0%, 16=0.0%, 32=0.0%, 64=0.0%, >=64=0.0%

submit和complete代表同一时间段内fio发送上去和已完成的IO数量。对于产生这个输出的垃圾回收测试用例来说，iodepth是默认值1，所以100%的IO在同一时刻发送1次，放在1-4栏位里。通常来说，只有iodepth大于1才需要关注这一部分数据。

我会找时间测试多种调度策略，这些数据会变得更有趣。

issued    : total=r=2621440/w=0/d=0, short=r=0/w=0/d=0

发送的IO数量。这里出现了奇怪的现象，因为这是50/50的读写负载，照道理应该有相同数量的write。我猜测把unified_rw_reporting打开是的fio把所有的IO都认为是read。

如果你在直接IO测试是看到了IO值很低，那么可能是出问题了。我在Linux kernel中找到参考说这种现象发生在文件末尾EOL或可能是设备的尾端。

latency   : target=0, window=0, percentile=100.00%, depth=1

Fio可以配置一个延迟目标值，这个值可以调节吞吐量直到达到预设的延迟目标。我还没有太多深入了解这部分。在基于时间或和容量的测试中，这行通常看起来一样。四个值分别代表预设的latency_target, latency_window, latency_percentile和iodepth。

Run status group 0 (all jobs):

Fio支持把不同的测试聚合。例如，我可以用一个配置文件混合包含SSD和HDD，但是设置分组(group)把IO单独汇总。我现在还没涉及这个功能，但未来会用到。

MIXED: io=12497MB, aggrb=42653KB/s, minb=277KB/s, maxb=41711KB/s, mint=300000msec, maxt=300012msec

最后，汇总输出吞吐量和时间。io=表示总共完成的IO数量。在基于时间的测试中这是一个变量，在基于容量的测试中，这个值能匹配size参数。aggrb是所有进程/设备的汇总带宽。minb/maxb表示测量到的最小/最大带宽。mint/maxt表示测试的最短和最长耗时。和io=参数类似，时间值对于基于时间的测试应该能匹配runtime参数，对于基于容量的测试是一个变量。

由于我设置了unified_rw_reporting参数运行测试，所以只看到MIXED一行。如果禁用这个参数，对于读和写会有单独的行。

够简单吧？我未来的几周会花更多的时间研究fio，我会发布更多关于配置，输出和图表代码的例子。

Fio 输出内容的解释的更多相关文章

Linux鲜为人知的安全漏洞：不要将输出内容管道给你的shell
将wget或curl输出的内容管道给bash或者sh是一件非常愚蠢的事,例如像下面这样: wget -O - http://example.com/install.sh | sudo sh 命令解释: ...
HAproxy增加日志记录功能和自定义日志输出内容、格式
http://blog.51cto.com/eric1/1854574 一.增加haproxy日志记录功能 1.1 由于数据分析的需要,我们必须打开haproxy日志,记录相关信息. 在配置前,我 ...
使用feof()判断文件结束时会多输出内容的原因
这是原来的代码: #include <stdio.h>int main(){ FILE * fp; int ch; fp = fopen("d:\\aaaaa\ ...
Linux命令执行的屏幕输出内容重定向到日志文件
摘要: 作者:Syn良子出处:http://www.cnblogs.com/cssdongl 转载请注明出处快速mark一下这个命令细节,免得以后使用又忘记了大家都知道可以用echo来输出内容到 ...
C#获取命令行输出内容的方法
获取命令行输出内容的方式有传统和异步两种方式. 传统方式: public static void RunExe(string exePath, string arguments, out string ...
【记录】尝试用android-logging-log4j去实现log输出内容到sd卡中的文件的功能
[背景] 折腾: [记录]给Android中添加log日志输出到文件期间,已经试了: [记录]尝试用android中microlog4android实现log输出到文件的功能但是不好用. 然后就是 ...
WinForm小白的WPF初试一：从PropertyGrid控件，输出内容到Word（上）
学WinForm也就半年,然后转到WPF,还在熟悉中.最近拿到一个任务:从PropertyGrid控件,输出内容到Word.难点有: 一.PropertyGrid控件是WinForm控件,在WPF中并 ...
level分层次输出内容添加leve
代码如下:function getSubComments($parent = 0, $level = 0) { $db = &JFactory::getDBO(); $sql = " ...
paip.输出内容替换在Apache 过滤器filter的设置
paip.输出内容替换在Apache 过滤器filter的设置作者Attilax 艾龙, EMAIL:1466519819@qq.com 来源:attilax的专栏地址:http://blog ...

随机推荐

如何开发一个APP——转自知乎
作者:简单点链接:https://www.zhihu.com/question/22999185/answer/155469014来源:知乎著作权归作者所有.商业转载请联系作者获得授权,非商业转载请注 ...
Flex属性你真的搞清楚了吗？我深表怀疑
背景在使用弹性布局实现两侧宽度固定,中间宽度自适应的效果时,发现自己理解的和实际效果不一致,所以亲自实践验证了一个flex属性的诸多场景的表现,不仅解开了我之前使用过程遇到的疑惑,而且发现了许多自己 ...
问题笔记 - element表格操作状态值
1.必须从传到表里的数据源中取值(scope.row.star)
java.net.BindException: Problem binding to [hadoop103:8031] java.net.BindException
ResourceManger启动失败,Namenode启动成功,这个问题排查了好久在hadoop-2.7.6/logs/yarn-root-resourcemanager-hadoop102.log ...
pandas（3）：索引Index/MultiIndex
目录一.索引概念二.创建索引 ①导入数据时指定索引 ②导入数据后指定索引df.set_index() 三.常用的索引属性四.常用索引方法五.索引重置reset_index() 六.修改索引值( ...
将 Python 打包的 exe 进行反编译
Python 打包成 exe 之后,是否能从二进制文件中恢复出源代码?没有加密的话是可以的. 首先需要解包. 直接从 github 上下载就行:https://github.com/counterce ...
使用Vue-TreeSelect组件的时候，用watch变量方式解决弹出编辑对话框界面无法触发更新的问题
在前篇随笔<使用Vue-TreeSelect组件实现公司-部门-人员级联下拉列表的处理>中介绍了Vue-TreeSelect组件的使用,包括使用v-modal绑定值,normalizer ...
java面试系列<4>——IO
面试系列--javaIO 一.概述 java的IO主要分为以下几类: 磁盘操作:File 字节操作:InputStream 和 OutputStream 字符操作:Reader 和 Writer 对象 ...
JAVAEE_Servlet_21_Cookie
Cookie * Cookie 是什么? - Cookie翻译过来是曲奇饼干的意思 - Cookie可以保存回话状态,但是这个会话状态是保存在客户端上的,只要清除Cookie,或者 Cookie失效, ...
记一次医院.NET公众号系统线程CPU双高分析
一:背景 1. 讲故事上周四有位朋友加wx咨询他的程序出现 CPU + 线程双高的情况,希望我能帮忙排查下,如下图: 从截图看只是线程爆高,没看到 cpu 爆高哈,有意思的是这位朋友说他: 一直在 ...

Fio 输出内容的解释

Fio 输出内容的解释

Fio 输出内容的解释的更多相关文章

随机推荐

热门专题