Linux系统编程读书笔记
文件I/O模型
Linux的哲学思想,一切皆文件,这也是Linux文件操作的方便之处。系统调用不会分配缓冲区用以返回信息给调用者。所以必须提前分配大小合适的缓冲区并将缓冲区指针传递给系统调用。
1、open
open以前没有创建功能,后来通过参数可以设置创建文件。一个进程对能够打开的文件描述符的个数有限制的。
open的时候如果指定O_SYNC标志,则会使所有后续输出同步。即调用write会自动都将文件数据和元数据刷新到磁盘。现代的磁盘驱动器均内置大型高速缓存,而默认情况下使用O_SYNC只是将数据传递到该缓存中。如果禁用磁盘上的高速缓存,那么O_SYNC标志堆IO性能影响挺大的。尽量不用O_SYNC。
2、read
read对于普通文件,一般都是用一个循环,一次读请求的字节数,只有读到普通文件末尾返回0,读取的字节数可能小于请求的;但是对于管道,FIFO,socket和终端,在不同环境下也会出现read调用读取的字节数小于请求字节数。默认情况下,从终端读取字符,一遇到换行符,read调用就会结束。
另外,read调用没有在末尾给你添加上一个‘\0’,所以需要显示添加。
3、write
write调用成功,将返回实际写入的文件字节数。
4、close显示
显示关闭不再需要的文件描述符是一个好的编程习惯。
文件I/O缓冲
出于速度和效率的考虑,系统调用I/O和标准C语言库I/O函数在操作磁盘文件的时候会对数据进行缓冲。
缓存cache是为了加快读,缓冲buffer是为了缓冲写。
1、用户缓冲区大小对read和write系统调用I/O性能的影响
前文说的read和write系统调用,这里在说一下。write只是将用户空间缓冲区中的内容复制到内核高速缓存中,做完这些write调用就结束了。在后续某个时刻,内核会将其高速缓存的数据写入(刷新至)磁盘。因此,可以说系统调用和磁盘操作并不同步。如果还没有刷新到磁盘的时候,有进程需要读取这个文件的这几个字节,那么内核会自动从高速缓存提供这些数据,而不是从文件。与此同理,read系统调用只是将内核高速缓存的数据复制到用户空间的缓冲区,内核高速缓存数据被取完之后,内核会将文件的下一段内容读取到内核高速缓存中。采用这中设计,一是read和write系统调用的操作更为迅速,二是减少了内核必须执行的磁盘传输操作。
内存高速缓冲区在Linux中设计为页面大小,所以,当用户空间缓冲区的大小大于等于页面大小的时候效率比较高。Linux内核尽可能多的分配高速缓存页。当内存空间紧张的时候,会对一些修改过的缓存页进行刷新并释放空间。
2、stdio库的缓冲
C语言函数库的I/O函数(比如 fprintf()/fscanf() fputs()/fgets() fputc()/fgetc())缓冲大块数据减少系统调用。
我们可以调用setvbuf来设置stdio的缓冲模式。
(1)_IONBF 不对I/O进行缓冲 对每个库函数立即调用读写系统调用
(2)_IOLBF 采用行缓冲I/O 只要有一行或者满了执行读写系统调用
(3)_IOFBF 采用全缓冲I/O 缓冲区满了才执行读写系统调用
设置不同的模式,read和write的调用时机是不一样的。不缓冲——调用库函数往缓冲区里放入数据,放入后立马write到内核的高速缓存区。行缓冲——调用库函数往缓冲区中放入数据,只要数据中含有换行符或者缓冲区满了,就会write到内核的高速缓存区。全缓冲——调用库函数往缓冲区中放入数据,只有满了的时候才会调用write系统调用将数据写入内核高速缓存区。读的时候同理。
3、I/O缓冲小结
I/O系统调用其实就是将缓冲区的内容与内核高速缓存区进行复制,没有缓冲模式。但是stdio库函数会根据缓冲模式进行复制。

Linux系统编程读书笔记的更多相关文章
- tcpdump dns包(linux高性能编程读书笔记2)
tcpdump -i eth0 -nt -s 500 port domain host -t A www.baidu.com www.baidu.com is an alias for www.a ...
- 读书笔记之Linux系统编程与深入理解Linux内核
前言 本人再看深入理解Linux内核的时候发现比较难懂,看了Linux系统编程一说后,觉得Linux系统编程还是简单易懂些,并且两本书都是讲Linux比较底层的东西,只不过侧重点不同,本文就以Linu ...
- C++Windows核心编程读书笔记
转自:http://www.makaidong.com/%E5%8D%9A%E5%AE%A2%E5%9B%AD%E6%96%87/71405.shtml "C++Windows核心编程读书笔 ...
- Linux系统编程博客参考
通过看前人的博客更易于把握知识要点 http://www.cnblogs.com/mickole/category/496206.html <Linux系统编程> http://www.c ...
- CSAPP 并发编程读书笔记
CSAPP 并发编程笔记 并发和并行 并发:Concurrency,只要时间上重叠就算并发,可以是单处理器交替处理 并行:Parallel,属于并发的一种特殊情况(真子集),多核/多 CPU 同时处理 ...
- Linux系统编程温故知新系列 --- 01
1.大端法与小端法 大端法:按照从最高有效字节到最低有效字节的顺序存储,称为大端法 小端法:按照从最低有效字节到最高有效字节的顺序存储,称为小端法 网际协议使用大端字节序来传送TCP分节中的多字节整数 ...
- linux系统编程之错误处理
在linux系统编程中,当系统调用出现错误时,有一个整型变量会被设置,这个整型变量就是errno,这个变量的定义在/usr/include/errno.h文件中 #ifndef _ERRNO_H /* ...
- LINUX系统编程 由REDIS的持久化机制联想到的子进程退出的相关问题
19:22:01 2014-08-27 引言: 以前对wait waitpid 以及exit这几个函数只是大致上了解,但是看REDIS的AOF和RDB 2种持久化时 均要处理子进程运行完成退出和父进程 ...
- Node.js高级编程读书笔记Outline
Motivation 世俗一把,看看前端的JavaScript究竟能做什么. 顺便检验一下自己的学习能力. Audience 想看偏后台的Java程序员关于前端JavaScript的认识的职业前端工程 ...
随机推荐
- Round Numbers(组合数学)
Round Numbers Time Limit : 4000/2000ms (Java/Other) Memory Limit : 131072/65536K (Java/Other) Tota ...
- docker中管理数据
到目前我们介绍了一些Docker的基础概念, 知道了如何使用Docker的image, 也知道了如何在多个container间通过网络通讯. 在这章里我们将介绍如何在docker的container内 ...
- JavaScript Function arguments.callee caller length return
一.Function 函数是对象,函数名是指针. 函数名实际上是一个指向函数对象的指针. 使用不带圆括号的函数名是访问函数指针,并非调用函数. 函数的名字仅仅是一个包含指针的变量而已.即使在不同的环境 ...
- ElasticSearch 的一次非正常master脱离的调查 (转 和我碰到的情况一模一样)
转自 http://simonlei.iteye.com/blog/1669992 一共有4个节点的cluster,其中es4 是master,某个时间突然es1脱离了整个cluster,调查过程如下 ...
- Flask -- 入门
安装virtualenv 作用:可以为一个项目单独提供一份Python的安装,安全 pip install virtualenv 使用virtualenv为MyProject项目安装Python,并 ...
- 有关android安全性的问题--代码混淆
转自:http://www.cnblogs.com/dream-sky/archive/2012/11/15/2771648.html 在project.properties里加上 proguar ...
- MyBatis学习-SQL 符号篇
当我们需要通过 XML 格式处理 SQL 语句时,经常会用到 <,<=,>,>= 等符号,但是很容易引起 XML 格式的错误,这样会导致后台将 XML 字符串转换为 XML文档 ...
- Windows进程间通信(下)
六.动态数据交换(Dynamic Data Exchange) 动态数据交换(DDE)是使用共享内存在应用程序之间进行数据交换的一种进程间通信形式.应用程序可以使用DDE进行一次性数据传输,也可以当出 ...
- nefu 72 N!
Description Given an integer N(0 ≤ N ≤ 10000), your task is to calculate N! Input One N in one line, ...
- Androidndk开发打包时我们应该如何注意平台的兼容(x86,arm,arm-v7a)
很多朋友在开发Android JNI的的时候,会遇到findlibrary returned null的错误,因为某种原因,so没有打包到apk中.下面浅析下引起该错误的原因以及平台兼容性问题. 一. ...