Linux系统编程读书笔记
文件I/O模型
Linux的哲学思想,一切皆文件,这也是Linux文件操作的方便之处。系统调用不会分配缓冲区用以返回信息给调用者。所以必须提前分配大小合适的缓冲区并将缓冲区指针传递给系统调用。
1、open
open以前没有创建功能,后来通过参数可以设置创建文件。一个进程对能够打开的文件描述符的个数有限制的。
open的时候如果指定O_SYNC标志,则会使所有后续输出同步。即调用write会自动都将文件数据和元数据刷新到磁盘。现代的磁盘驱动器均内置大型高速缓存,而默认情况下使用O_SYNC只是将数据传递到该缓存中。如果禁用磁盘上的高速缓存,那么O_SYNC标志堆IO性能影响挺大的。尽量不用O_SYNC。
2、read
read对于普通文件,一般都是用一个循环,一次读请求的字节数,只有读到普通文件末尾返回0,读取的字节数可能小于请求的;但是对于管道,FIFO,socket和终端,在不同环境下也会出现read调用读取的字节数小于请求字节数。默认情况下,从终端读取字符,一遇到换行符,read调用就会结束。
另外,read调用没有在末尾给你添加上一个‘\0’,所以需要显示添加。
3、write
write调用成功,将返回实际写入的文件字节数。
4、close显示
显示关闭不再需要的文件描述符是一个好的编程习惯。
文件I/O缓冲
出于速度和效率的考虑,系统调用I/O和标准C语言库I/O函数在操作磁盘文件的时候会对数据进行缓冲。
缓存cache是为了加快读,缓冲buffer是为了缓冲写。
1、用户缓冲区大小对read和write系统调用I/O性能的影响
前文说的read和write系统调用,这里在说一下。write只是将用户空间缓冲区中的内容复制到内核高速缓存中,做完这些write调用就结束了。在后续某个时刻,内核会将其高速缓存的数据写入(刷新至)磁盘。因此,可以说系统调用和磁盘操作并不同步。如果还没有刷新到磁盘的时候,有进程需要读取这个文件的这几个字节,那么内核会自动从高速缓存提供这些数据,而不是从文件。与此同理,read系统调用只是将内核高速缓存的数据复制到用户空间的缓冲区,内核高速缓存数据被取完之后,内核会将文件的下一段内容读取到内核高速缓存中。采用这中设计,一是read和write系统调用的操作更为迅速,二是减少了内核必须执行的磁盘传输操作。
内存高速缓冲区在Linux中设计为页面大小,所以,当用户空间缓冲区的大小大于等于页面大小的时候效率比较高。Linux内核尽可能多的分配高速缓存页。当内存空间紧张的时候,会对一些修改过的缓存页进行刷新并释放空间。
2、stdio库的缓冲
C语言函数库的I/O函数(比如 fprintf()/fscanf() fputs()/fgets() fputc()/fgetc())缓冲大块数据减少系统调用。
我们可以调用setvbuf来设置stdio的缓冲模式。
(1)_IONBF 不对I/O进行缓冲 对每个库函数立即调用读写系统调用
(2)_IOLBF 采用行缓冲I/O 只要有一行或者满了执行读写系统调用
(3)_IOFBF 采用全缓冲I/O 缓冲区满了才执行读写系统调用
设置不同的模式,read和write的调用时机是不一样的。不缓冲——调用库函数往缓冲区里放入数据,放入后立马write到内核的高速缓存区。行缓冲——调用库函数往缓冲区中放入数据,只要数据中含有换行符或者缓冲区满了,就会write到内核的高速缓存区。全缓冲——调用库函数往缓冲区中放入数据,只有满了的时候才会调用write系统调用将数据写入内核高速缓存区。读的时候同理。
3、I/O缓冲小结
I/O系统调用其实就是将缓冲区的内容与内核高速缓存区进行复制,没有缓冲模式。但是stdio库函数会根据缓冲模式进行复制。

Linux系统编程读书笔记的更多相关文章
- tcpdump dns包(linux高性能编程读书笔记2)
tcpdump -i eth0 -nt -s 500 port domain host -t A www.baidu.com www.baidu.com is an alias for www.a ...
- 读书笔记之Linux系统编程与深入理解Linux内核
前言 本人再看深入理解Linux内核的时候发现比较难懂,看了Linux系统编程一说后,觉得Linux系统编程还是简单易懂些,并且两本书都是讲Linux比较底层的东西,只不过侧重点不同,本文就以Linu ...
- C++Windows核心编程读书笔记
转自:http://www.makaidong.com/%E5%8D%9A%E5%AE%A2%E5%9B%AD%E6%96%87/71405.shtml "C++Windows核心编程读书笔 ...
- Linux系统编程博客参考
通过看前人的博客更易于把握知识要点 http://www.cnblogs.com/mickole/category/496206.html <Linux系统编程> http://www.c ...
- CSAPP 并发编程读书笔记
CSAPP 并发编程笔记 并发和并行 并发:Concurrency,只要时间上重叠就算并发,可以是单处理器交替处理 并行:Parallel,属于并发的一种特殊情况(真子集),多核/多 CPU 同时处理 ...
- Linux系统编程温故知新系列 --- 01
1.大端法与小端法 大端法:按照从最高有效字节到最低有效字节的顺序存储,称为大端法 小端法:按照从最低有效字节到最高有效字节的顺序存储,称为小端法 网际协议使用大端字节序来传送TCP分节中的多字节整数 ...
- linux系统编程之错误处理
在linux系统编程中,当系统调用出现错误时,有一个整型变量会被设置,这个整型变量就是errno,这个变量的定义在/usr/include/errno.h文件中 #ifndef _ERRNO_H /* ...
- LINUX系统编程 由REDIS的持久化机制联想到的子进程退出的相关问题
19:22:01 2014-08-27 引言: 以前对wait waitpid 以及exit这几个函数只是大致上了解,但是看REDIS的AOF和RDB 2种持久化时 均要处理子进程运行完成退出和父进程 ...
- Node.js高级编程读书笔记Outline
Motivation 世俗一把,看看前端的JavaScript究竟能做什么. 顺便检验一下自己的学习能力. Audience 想看偏后台的Java程序员关于前端JavaScript的认识的职业前端工程 ...
随机推荐
- Scala Tuple类型
Tuple可以作为集合存储不同类型的数据,初始化实例如下: val tuple = (1,3,3.14,"aa") val third = tuple._3 Tuple 下标访问从 ...
- 9.创建一个三角形类,成员变量三边,方法求周长,创建类主类A来测试它。
package com.hanqi.test; public class Triangle { private double a,b,c; public Triangle(double d,doubl ...
- npm常用指令
安装: npm install <name> npm install <name> 安装依赖包,默认安装最新版本,也可在后面加上版本号,并且将安装信息加入项目的package. ...
- perl中的pack与unpack
这个pack, unpack在 "perl语言编程" 有介绍 看起来很复杂 #把一个字符串转为十六进制格式 my $source = 'abcd'; unpack('H*', $s ...
- android抓日志
1. adb logcat -c 清楚以前的日志 adb logcat -s 过滤 adb logcat -s *:E adb logcat -v 指定输出的格式 adb logcat -v brie ...
- java泛型小问题
几年前当Java5还未正式发布的时候,看到过一些人写的介绍Tiger中的新特性,当时对我第一感觉冲击最大的就是泛型(generics)和注释(annotation),因为它们直接影响了我们编码的语法习 ...
- hdu_1495_非常可乐(bfs模拟)
题目连接:http://acm.hdu.edu.cn/showproblem.php?pid=1495 题意:不解释 题解:BFS模拟,不过要细心,把所有情况都列举出来,开一个数组记录状态,代码有点长 ...
- Python之路:爬虫之urllib库的基本使用和高级使用
关于爬虫自己一直在看,所以时间太慢,这才第二更,有等不及的小伙伴可以慢慢的品尝了,在看下面的之前,建议先把上一章看一下.以下是关于python的Urllib的基础和高级用法. 1.如何扒下一个网站,用 ...
- http response
关键词:http response header 下载文件 案例1: 访问某个链接,然后下载文件,需要特定的http头: header("Content-Type:application/z ...
- 老鸟需要知道的一些php系统类函数
作为一个老手级别的php程序员,知道下面几个php系统级别的函数,不足为多吧!获取系统信息和调试程序的时候应该能用的上! PHP系统类函数 assert函数:检查assertion声明是否错误 ext ...