本文为原创,转载请注明:http://www.cnblogs.com/gistao/

Background

IO可能是我们接触最频繁的系统调用,比如printf到终端,send content到对端,而今天要讨论的仅是Linux平台下访问本机存储设备相关的IO。如果你对IO相关api的优缺点门清,可以忽略这个随笔啦。

read

read的过程大致如下:

  1. 用户malloc出一块内存,然后陷入内核。
  2. 内核从磁盘读取内容拷贝到cache。
  3. 内核将内容拷贝到用户内存。

缺点比较明显,需要两次拷贝,拷贝是非常耗cpu的。

O_DIRECT

open函数的参数里有这样一个flag,意思是说不需要内核做cache了,内核直接把数据memcpy给用户就好了,这样的优点是可以减少memcpy。但缺点也很明显,没有cache了。

pread

多线程代码并发的访问同一文件是常见的,示例代码如下:

pthread_mutex_lock (mutex);

lseek (SEEK_SET+1024);
read (buf); pthread_mutex_unlock (mutex);

这里锁的意义是防治文件指针被其他线程seek走,导致本次read错乱,如何避免掉这个锁呢,就是pread,此函数和read的功能一样,但增加了一个要读取的offset参数,这样就不需要我们显示的加锁了,也许你会联想到strtok和strtok_r。代码改动如下:

pread (fd, buf, offset);

readahead

有时又会遇到下边代码的场景

while (n < max) {
read (buf[i]);
on_handle (buf[i]);
}

read函数是阻塞的,所以执行时间就等于max*time,即串行执行。可不可以非阻塞,就是readahead,此函数意思是在read之前,非阻塞的通知内核一下我要读的内容,内核会并发的预读这些内容进cache,当后续进行read时会大大的减少时间,代码修改成这样:

while (n < max) {
readahead (offset);
} while (n < max) {
read (buf[i]);
on_handle (buf[i]);
}

mmap

mmap的详细原理不在这里讨论,见图

简单来说,是将内核空间映射到了用户空间,这样相比read函数来说减少了一次memcpy

而mmap比O_DIRECT也有个好处是它确实利用了cache,可是对于普通的read来说,它利用的又不够充分,因为并不是每次访问都需要内核参与。不过有个补足办法就是用readahead,它可以传递你的意图(利用cache)给内核,从而避免了缺点。示例代码如下:

readahead (fd , offset);
ptr = mmap (fd);
a = ptr[offset];

aio

从以上可以看出来,IO模式是从阻塞提升到了非阻塞,性能优化围绕着cache和memcpy,那有没有一种非阻塞的,有cache的,最少memcpy的,这些都符合的技术,那应该就是aio了吧,但Linux的aio到现在也没有一个很好的实现,也许过于复杂吧,反过来看下Window平台,这都真不是事。下图是aio模型:

Final

有了mmap+ahead,aio真的还那么重要吗?真的很重要,没有真正的异步,就没有真正的并行编程,不能实现真正的async和await语法糖,比如一个异步方法要求10ms必须返回,而系统调用就得50ms完成,怎么可能是真正的async。但是如果不吹毛求疵,或追求极致的话,目前确实够用了,通过以上总结,希望能在IO编程时给你些选择素材。

Linux IO漫谈的更多相关文章

  1. 【知乎网】Linux IO 多路复用 是什么意思?

    提问一: Linux IO多路复用有 epoll, poll, select,知道epoll性能比其他几者要好.也在网上查了一下这几者的区别,表示没有弄明白. IO多路复用是什么意思,在实际的应用中是 ...

  2. Linux IO模型和网络编程模型

    术语概念描述: IO有内存IO.网络IO和磁盘IO三种,通常我们说的IO指的是后两者. 阻塞和非阻塞,是函数/方法的实现方式,即在数据就绪之前是立刻返回还是等待. 以文件IO为例,一个IO读过程是文件 ...

  3. block_dump观察Linux IO写入的具体文件(mysqld)

      一.使用方法: 二.基本原理: 三.总结 很多情况下开发者调测程序需要在Linux下获取具体的IO的状况,目前常用的IO观察工具用vmstat和iostat,具体功能上说当然是iostat更胜一筹 ...

  4. linux io优化

    场景:xml文件解析入库:并备份 问题:磁盘io异常,经常100%busy: linux io优化方法: 1.修改磁盘挂着参数,修改为writeback模式:对于文件读取频繁的可以设置noatime: ...

  5. Linux IO 调度器

    Linux IO Scheduler(Linux IO 调度器) 每个块设备或者块设备的分区,都对应有自身的请求队列(request_queue),而每个请求队列都可以选择一个I/O调度器来协调所递交 ...

  6. Linux IO工具 iotop备择方案iopp

    iotop毫无疑问linux IO检测上是一个很好的工具,但苦于要求和内核版本Python版本号.我的很多朋友放弃了.我也是.无意中发现iopp,使用c书面,与此iotop它是一个作用.nice! 一 ...

  7. 【转】linux IO子系统和文件系统读写流程

    原文地址:linux IO子系统和文件系统读写流程 我们含有分析的,是基于2.6.32及其后的内核. 我们在linux上总是要保存数据,数据要么保存在文件系统里(如ext3),要么就保存在裸设备里.我 ...

  8. Linux IO时事检测工具iostat

    Linux IO时事检测工具iostat iostat命令用于检测linux系统io设备的负载情况,运行iostat将显示自上次运行该命令以后的统计信息.用户可以通过指定统计的次数和时间来获得所需的统 ...

  9. Linux IO Scheduler(Linux IO 调度器)【转】

    每个块设备或者块设备的分区,都对应有自身的请求队列(request_queue),而每个请求队列都可以选择一个I/O调度器来协调所递交的request.I/O调度器的基本目的是将请求按照它们对应在块设 ...

随机推荐

  1. Epson机械手4轴6轴示意图

    世界坐标系(World Coordinate System,简称WCS)是由三个垂直并相交的坐标轴X轴.Y轴和Z轴构成,一般显示在绘图区域的左下角,如图1-7所示.X轴和Y轴的交点就是坐标原点O,X轴 ...

  2. mongogogog

    $cmp,$eq,$gt,$gte,$lt,$lte,$ne$setEquals,$setIntersection,$setUnion,$setDifference,$setLsSubset,$any ...

  3. Bootstrap <基础三十一>插件概览

    在前面布局组件中所讨论到的组件仅仅是个开始.Bootstrap 自带 12 种 jQuery 插件,扩展了功能,可以给站点添加更多的互动.即使不是一名高级的 JavaScript 开发人员,也可以着手 ...

  4. web.xml中在Servlet中获取context-param和init-param内的参数

    引自:http://blog.csdn.net/yakson/article/details/9203231 web.xml里面可以定义两种参数:1.application范围内的参数,存放在serv ...

  5. 黑马程序员——C语言基础 内存剖析

    Java培训.Android培训.iOS培训..Net培训.期待与您交流! (以下内容是对黑马苹果入学视频的个人知识点总结) (一)进制 进制是一种计数的方式,数值的表示形式.有多种进制十进制.二进制 ...

  6. jquery mobile 输入框无边框

    现在移动开发为主流的时代,少不了使用jquery mobile.但是偶然应项目要求需要把input输入框做成无边框的,不是特别容易的事,网上找了很多都没有一种靠谱的解决方案,只能自食其力了. < ...

  7. win7下KiWi Syslog服务器的安装与配置

    今天就来聊聊日志服务器KiWi Syslog的安装与配置. 首先,所需文件有以下2个: 1.Kiwi_Syslog_Server_9.5.0.Eval.setup.exe[此版本只有14天寿命][Ki ...

  8. 方法的重载overload

    /*方法的重载overload * 重载:在同一个类里可以定义一个或者一个以上的方法 *     参数类型不一致 *     参数数量不一致 *     */ public class Chongza ...

  9. 利用calc计算宽度

    width:calc(100% - 40px)可用 + - * / 进行计算(ie9+) 注:计算符号前后必须跟上空格.

  10. zip压缩命令的使用

    file命令可以查看文件的类型 tar类型 .tar gzip类型   .gz  bzip2类型  .bz2 zip类型    .zip 如果一个压缩文件由tar命令解压的前提,2个条件 1.这个文件 ...