http://blog.yufeng.info/archives/751

我们在Linux上总是要保存数据的,数据要么保存在文件系统里(如ext3),要么就在裸设备里面。我们在使用这些数据的时候都是通过文件这个抽象来访问的,操作系统会把我们需要的数据给我们,我们通常无需和块设备打交道。

从下图我们可以很清楚的看到:

我们会发现IO是个层次很深的子系统,有很复杂的数据流动线路。

至于操作系统如何去存储和获取这些数据对我们完全是黑盒子的,这通常不是问题。但是如果我们的IO很密集,我们就需要搞清楚IO具体是如何运作的,免的滥用IO和导致设计问题。

这时候你就需要blktrace这样的工具。

blktrace is a block layer IO tracing mechanism which provides detailed information about request queue operations up to user space.

它的作者Jens Axboe, 是内核IO模块的维护者,目前就职于FusionIO, 是个很nice的家伙,同时他还是著名IO评测工具fio的作者。

相关的文档:
users guide: http://pdfedit.petricek.net/bt/file_download.php?file_id=17&type=bug

HP的人写的指南:http://www.gelato.org/pdf/apr2006/gelato_ICE06apr_blktrace_brunelle_hp.pdf

CU上的小伙子写的: http://linux.chinaunix.net/bbs/viewthread.php?tid=1115851&extra=&ordertype=2

目前blktrace在大部分的Linux发行版都支持的,我们可以轻松的安装使用:

$ sudo yum install blktrace

$ sudo  blktrace /dev/sda5 -o - | blkparse -i -   

  ,                 0.000000000       C   W  +  []
, 0.000040884 A W + <- (,)
, 0.000041214 Q W + [(null)]
, 0.000045947 G W + [(null)]
, 0.000046707 P N [(null)]
, 0.000047073 I W + [(null)]
, 0.000048282 A W + <- (,)
, 0.000048357 Q W + [(null)]
, 0.000049137 M W + [(null)]
, 0.000050167 A W + <- (,)
, 0.000050241 Q W + [(null)]
, 0.000050417 M W + [(null)]
, 0.000050984 A W + <- (,)
, 0.000051047 Q W + [(null)]
, 0.000051258 M W + [(null)]
, 0.000051829 U N [(null)]
, 0.000052699 D W + [(null)]
, 0.000108292 C W + []
, 0.000127791 A W + <- (,)
, 0.000128001 Q W + [(null)]
, 0.000128874 G W + [(null)]
, 0.000129373 P N [(null)]
, 0.000129706 I W + [(null)]
, 0.000130551 U N [(null)]
, 0.000131330 D W + [(null)]
, 0.000172705 C W + []
, 1266874889.709337223 A W + <- (,)
, 1266874889.709338011 Q W + [kjournald]
, 1266874889.709343974 G W + [kjournald]
, 1266874889.709346653 P N [kjournald]
, 1266874889.709347728 I W + [kjournald]
, 1266874889.709350795 U N [kjournald]
, 1266874889.709355396 D W + [kjournald]
, 0.504685570 A W + <- (,)
, 0.504686212 Q W + [kjournald]
, 0.504690614 G W + [kjournald]
, 0.504691826 P N [kjournald]
, 0.504692896 I W + [kjournald]
, 0.504694268 A W + <- (,)
, 0.504694448 Q W + [kjournald]
, 0.504695115 M W + [kjournald]
, 0.504696227 A W + <- (,)
, 0.504696357 Q W + [kjournald]
, 0.504696615 M W + [kjournald]
, 0.504697422 A W + <- (,)
, 0.504697565 Q W + [kjournald]
, 0.504697787 M W + [kjournald]
, 0.504698549 A W + <- (,)
, 0.504698677 Q W + [kjournald]
, 0.504698939 M W + [kjournald]
, 0.504699954 U N [kjournald]
, 0.504704050 D W + [kjournald]
, 0.504810390 C W + []
, 0.504842324 A W + <- (,)
, 0.504842594 Q W + [kjournald]
, 0.504844133 G W + [kjournald]
, 0.504845233 P N [kjournald]
, 0.504845703 I W + [kjournald]
, 0.504846958 U N [kjournald]
, 0.504848547 D W + [kjournald]
, 0.504879109 C W + []
CPU2 (,):
Reads Queued: , 0KiB Writes Queued: , 24KiB
Read Dispatches: , 0KiB Write Dispatches: , 24KiB
Reads Requeued: Writes Requeued:
Reads Completed: , 0KiB Writes Completed: , 48KiB
Read Merges: , 0KiB Write Merges: , 12KiB
Read depth: Write depth:
IO unplugs: Timer unplugs:
CPU13 (,):
Reads Queued: , 0KiB Writes Queued: , 4KiB
Read Dispatches: , 0KiB Write Dispatches: , 4KiB
Reads Requeued: Writes Requeued:
Reads Completed: , 0KiB Writes Completed: , 0KiB
Read Merges: , 0KiB Write Merges: , 0KiB
Read depth: Write depth:
IO unplugs: Timer unplugs:
CPU21 (,):
Reads Queued: , 0KiB Writes Queued: , 20KiB
Read Dispatches: , 0KiB Write Dispatches: , 20KiB
Reads Requeued: Writes Requeued:
Reads Completed: , 0KiB Writes Completed: , 0KiB
Read Merges: , 0KiB Write Merges: , 16KiB
Read depth: Write depth:
IO unplugs: Timer unplugs: Total (,):
Reads Queued: , 0KiB Writes Queued: , 48KiB
Read Dispatches: , 0KiB Write Dispatches: , 48KiB
Reads Requeued: Writes Requeued:
Reads Completed: , 0KiB Writes Completed: , 48KiB
Read Merges: , 0KiB Write Merges: , 28KiB
IO unplugs: Timer unplugs: Throughput (R/W): 0KiB/s / 95KiB/s
Events (,): entries
Skips: forward ( - 0.0%)

利用这些信息我们可以很清楚的知道我们IO设备在做什么,花了多少时间,透过它了解我们系统的运作。如何解读这些信息我们可以看手册有详细的解释:

$ man blkparse

同时如果你觉得这些信息太原始,类似btt, seekwatcher这样的工具在blktrace的信息的基础上更深入的挖掘了系统的行为,使用起来也更简单。

我们在实际工作的过程中用blktrace定位了很多问题,比如fsync的延时问题和IO调度器的问题,确实是很实用的一个工具。

祝大家玩的开心。

blktrace 深度了解linux系统的IO运作的更多相关文章

  1. Linux系统 磁盘IO过高排查总结

    最近做的一个电商网站因为磁盘 I/O 过高导致访问速度奇慢,问题存在两个月有余未得到解决办法.此次排查原因的经验可以作下次问题的参考. 1.会看懂 top 系统命令出来的各项参数.此次是无意中发现 u ...

  2. Linux系统:保证数据安全落盘

    在很多IO场景中,我们经常需要确保数据已经安全的写到磁盘上,以便在系统宕机重启之后还能读到这些数据.但是我们都知道,linux系统的IO路径还是很复杂的,分为很多层,每一层都可能会有buffer来加速 ...

  3. [转]linux 系统监控、诊断工具之 IO wait

    1.问题: 最近在做日志的实时同步,上线之前是做过单份线上日志压力测试的,消息队列和客户端.本机都没问题,但是没想到上了第二份日志之后,问题来了: 集群中的某台机器 top 看到负载巨高,集群中的机器 ...

  4. Linux系统编程--文件IO操作

    Linux思想即,Linux系统下一切皆文件. 一.对文件操作的几个函数 1.打开文件open函数 int open(const char *path, int oflags); int open(c ...

  5. Linux系统编程@终端IO

    Linux系统中终端设备种类  终端是一种字符型设备,有多种类型,通常使用tty 来简称各种类型的终端设备.终端特殊设备文件一般有以下几种: 串行端口终端(/dev/ttySn ) ,伪终端(/dev ...

  6. linux:关于Linux系统中 CPU Memory IO Network的性能监测

    我们知道:系统优化是一项复杂.繁琐.长期的工作.通常监测的子系统有以下这些:CPUMemoryIO Network 下面是常用的监测工具 Linux 系统包括很多子系统(包括刚刚介绍的CPU,Memo ...

  7. Linux系统IO分析工具之iotstat常用参数介绍

    Linux系统IO分析工具之iotstat常用参数介绍 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 1>.安装iostat [root@flume115 ~]# yum - ...

  8. Linux系统IO分析工具之iotop常用参数介绍

      Linux系统IO分析工具之iotop常用参数介绍 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 在一般运维工作中经常会遇到这么一个场景,服务器的IO负载很高(iostat中的 ...

  9. 操作系统复习——如何查看一个进程的详细信息,如何追踪一个进程的执行过程 ,如何在 Linux 系统下查看 CPU、内存、磁盘、IO、网卡情况?epoll和select区别?

    1. 如何查看一个进程的详细信息,如何追踪一个进程的执行过程 通过pstree命令(根据pid)进行查询进程内部当前运行了多少线程:# pstree -p 19135(进程号) 使用top命令查看(可 ...

随机推荐

  1. UI基础:UI程序执行顺序(UIApplicationMain()函数),自定义视图 分类: iOS学习-UI 2015-07-02 22:09 68人阅读 评论(0) 收藏

    UI程序的一般执行顺序: 先进入main里面,执行函数UIApplicationMain(),通过该函数创建应用程序对象和指定其代理并实现监听,当执行函数UIApplicationMain()时还会做 ...

  2. tensorflow中 tf.add_to_collection、 tf.get_collection 和 tf.add_n函数

    tf.add_to_collection(name, value)  用来把一个value放入名称是'name'的集合,组成一个列表; tf.get_collection(key, scope=Non ...

  3. 《DSP using MATLAB》Problem 4.8

    代码: %% ---------------------------------------------------------------------------- %% Output Info a ...

  4. 《DSP using MATLAB》Problem 3.20

    代码: %% ------------------------------------------------------------------------ %% Output Info about ...

  5. 一篇文章入门Jmeter性能测试【经典长文】

    孟船长  目录 1.性能测试定义2.为什么要做性能测试3.性能测试指标.性能测试分类4.Jmeter性能测试实战[入门级]5.参考文章链接 1.性能测试定义 百度&知乎 性能测试是通过自动化的 ...

  6. linux内核空间和用户空间详解

    linux驱动程序一般工作在内核空间,但也可以工作在用户空间.下面我们将详细解析,什么是内核空间,什么是用户空间,以及如何判断他们.Linux简化了分段机制,使得虚拟地址与线性地址总是一致,因此,Li ...

  7. MLCC Y5V 和 X7R 电容记录

    MLCC Y5V 和 X7R 电容记录 Y5V 的 MLCC 很少见的,但还是要注意. 自己记录一下,一个 100NF Y5V 电容 ,当温度到达 100度时,容值 为 36NF. 但是 X7R 电容 ...

  8. tomcat catalina.out切割脚本

    shell脚本catalina.out 切割脚本...每天23.30切割.删除七天之前的日志这里3个tomcat实例(1)拷贝日志文件(2)清空日志文件*只能清空如果删除tomcat不重启不会生成新的 ...

  9. 小米盒子 作为nas服务器

    1. webdav缺点:慢优点:方便,不许额外软件 http://blog.csdn.net/laoyiin/article/details/9283023 sw webdav 2. smb缺点:不可 ...

  10. 【转】每天一个linux命令(26):用SecureCRT来上传和下载文件

    原文网址:http://www.cnblogs.com/peida/archive/2012/11/28/2793181.html 用SSH管理linux服务器时经常需要远程与本地之间交互文件.而直接 ...