一个fork的面试题——fork + 缓存区

update : 20140512

题目：请问下面的程序一共输出多少个“-”？

 #include <stdio.h>

 #include <sys/types.h>

 #include <unistd.h>

 int main(void)

 {

    int i;

    for(i=; i<; i++){

       fork();

       printf("-");

    }

    return ;

 }

如果你对fork()的机制比较熟悉的话，这个题并不难，输出应该是6个“-”，但是，实际上这个程序会很tricky地输出8个“-”。

要讲清这个题，我们首先需要知道fork()系统调用的特性，

fork()系统调用是Unix下以自身进程创建子进程的系统调用，一次调用，两次返回，如果返回是0，则是子进程，如果返回值>0，则是父进程（返回值是子进程的pid），这是众为周知的。

还有一个很重要的东西是，在fork()的调用处，整个父进程空间会原模原样地复制到子进程中，包括指令，变量值，程序调用栈，环境变量，缓冲区，等等。

所以，上面的那个程序为什么会输入8个“-”，这是因为printf(“-”);语句，我们知道，Unix下的设备有“块设备”和“字符设备”的概念，所谓块设备，就是以一块一块的数据存取的设备，字符设备是一次存取一个字符的设备。磁盘、内存、显示器都是块设备，字符设备如键盘和串口。块设备一般都有缓存，而字符设备一般都没有缓存。

所以，对于上述程序，printf(“-”);把“-”放到了缓存中，并没有真正的输出（参看《C语言的迷题》中的第一题），在fork的时候，缓存被复制到了子进程空间，所以，就多了两个，就成了8个，而不是6个。

我们如果修改一下上面的printf的那条语句为：

　　 printf("-\n");

或者

　　 printf("-"); flush();

就没有问题了，因为程序遇到“\n”或是EOF，或是缓中区满，或是文件描述符关闭，或是主动flush，就会把数据刷出缓冲区。

我估计有些朋友可能对于fork()还不是很了解，那么我们把上面的程序改成下面这样：

 #include <stdio.h>

 #include <sys/types.h>

 #include <unistd.h>

 int main(void)

 {

    int i;

    for(i=; i<; i++){

       fork();

       //注意：下面的printf有“\n”

       printf("ppid=%d, pid=%d, i=%d \n", getppid(), getpid(), i);

    }

    sleep(); //让进程停留十秒，这样我们可以用pstree查看一下进程树

    return ;

 }

于是，上面这段程序会输出下面的结果，（注：编译出的可执行的程序名为fork）

 ppid=, pid=, i=

 ppid=, pid=, i=

 ppid=, pid=, i=

 ppid=, pid=, i=

 ppid=, pid=, i=

 ppid=, pid=, i=

 $ pstree -p | grep fork

 |-bash()-+-fork()-+-fork()---fork()

 |            |            `-fork()

面对这样的图你可能还是看不懂，没事，我好事做到底，画个图给你看看：

注意：上图中的我用了几个色彩，相同颜色的是同一个进程。于是，我们的pstree的图示就可以成为下面这个样子：（下图中的颜色与上图对应）

这样，对于printf(“-”);这个语句，我们就可以很清楚的知道，哪个子进程复制了父进程标准输出缓中区里的的内容，而导致了多次输出了。（如下图所示，就是我阴影并双边框了那两个子进程）

现在你明白了吧。

BY：苗立尧（maxwell）——进程结束时缓存区变化

一、exit()与_exit()的关于缓存区问题的区别：

　　从名字就能看出,exit()这个系统调用是用来终止一个进程的,无论进程执行在什么位置,只要遇到 exit(),进程就会停止剩下的剩余操作。而_exit()跟 exit()基本上是一样的,exit定义在 stdlib.h 中,而_exit()定义在 unistd.h 里。_exit()的作用最为简单,直接使进程停止运行,清除其使用的内存空间,并销毁其在内核中的各种数据结构,而 exit()是在其上作了一点包装。它们最大的区别是,exit()函数在调用 exit 系统调用之前要检查文件的打开情况,把文件缓冲区的内容写回文件,就是清理 I/O 缓冲。那如果我们的数据还放在缓冲区里,调用_exit()函数会使数据丢失,而使用 exit()函数是关闭 I/O 文件之前要刷新缓冲区的。在我们之前的例子里,用的是 return 0。main()函数体内,return 的效果和 exit()是一样的。

1、

 int main(int argc, *argv[])

 {

     printf("hello xupt！\n");

     printf("");

     exit();

 }

执行结果为：

2、

  int main(int argc, *argv[])

  {

      printf("hello xupt！\n");

      printf("");

      exit();

  }

执行结果：

二、关于带缓存的 I/O 和不带缓存的 I/O

　　linux 对 IO 文件的两种操作划分。不带缓存,其实是在用户层没有缓存,不是直接对磁盘文件进行读取操作如 read()和 write(),它们都是系统调用。对于内核来说,要进行 IO时,内核先将数据写入到内核中所设的缓冲存储器,缓冲存储器满才写到磁盘上。而带缓存的 IO 也叫标准 IO,是 ASCI C 标准的 IO 处理,不依赖与内核,移植性强,目的就是减少read()和 write()的调用次数。使用标准 IO 可以减少系统调用如 read()和 write()的调用次数。其实质是在用户层建立一个缓存区(用户缓冲区也叫流缓冲区)。它对每个 IO 流自动进行缓存管理(标准 IO 函数一般使用 malloc 来进行缓存分配),它提供了三种类型的缓存-全缓存(例如磁盘上的文件),行缓存(输入输出遇到新行符或者缓存满时,stdin 和 stdout 通常是行缓存),无缓存(相当于 read,write,例如 stderr)。　　

　　一般的,由 OS 选择缓存长度并自动分配,标准 I/O 库在关闭流时候自动释放缓存。　　

　　标准 I/O 库可能效率不高,原因是需要复制的数据要在用户缓存和内核缓存之间复制,然后又从内核缓存复制到 I/O 缓存。例如调用 fgetc 和 fputs 时,数据要从内核和标准I/O 缓存之间(调用 read 和 write)复制,第二次是在标准 I/O 缓存(通常系统分配和管理),和用户程序中的行缓存(fgetc 的参数就需要一个用户行缓存指针)之间。

　　无缓冲的 stderr 其实也不是完全没缓冲,只是缓冲区的大小不为 0,而为 1。

一个fork的面试题——fork + 缓存区的更多相关文章

【转】一个fork的面试题
转自:一个fork的面试题前两天有人问了个关于Unix的fork()系统调用的面试题,这个题正好是我大约十年前找工作时某公司问我的一个题,我觉得比较有趣,写篇文章与大家分享一下.这个题是这样的: 题 ...
[转帖]一个FORK的面试题
一个FORK的面试题 https://coolshell.cn 搞不懂 fork 的含义. Linux 里面的线程不是教科书上面的标准的线程好像用父子进程来进行模拟线程的处理父子线程应该共享 ...
带标准IO带缓存区和非标准IO 遇到fork是的情况分析
废话不多说直接代码 #include<stdio.h> #include<sys/types.h> #include<unistd.h> #include< ...
ACM/ICPC 之优先级队列+设置IO缓存区(TSH OJ-Schedule(任务调度))
一个裸的优先级队列(最大堆)题,但也有其他普通队列的做法.这道题我做了两天,结果发现是输入输出太过频繁,一直只能A掉55%的数据,其他都是TLE,如果将输入输出的数据放入缓存区,然后满区输出,可以将I ...
jquery面试题里缓存问题如何解决?
jquery面试题里缓存问题如何解决? 如果直接用jQuery里的$.ajax()方法的话,去除缓存很简单,只需要配置一下缓存属性cache为false,但如果想要简单写法getJSON(),去除缓 ...
【MINA】缓存区ByteBuffer和IOBuffer你要了解的常用知识
mina中IOBuffer是Nio中ByteBuffer的衍生类,主要是解决Bytebuffer的两个不足 1.没有提供足够灵活的get/putXXX方法 2.它容量固定,难以写入可变长度的数据特点 ...
csapp lab3 bufbomb 缓存区溢出攻击《深入理解计算机系统》
这个实验主要是熟悉栈,和了解数据缓存区溢出的问题. 数据缓存区溢出:程序每次调用函数时,会把当前的eip指针保存在栈里面,作为被调用函数返回时的程序指针.在被调用程序里面,栈是向下增长的.所有局部变量 ...
Java NIO------基础理论之缓存区
1.概述:NIO我的理解就是 New IO,是API1.4里提供的新的API,为所有的原始类型做缓存支持. NIO主要的核心组成部分: Buffer(缓存) Channels(通道) Selector ...
使用pg_buffercache查看缓存区缓存
PG提供了一个扩展pg_buffercache来查看缓存区的内容. create database test; CREATE DATABASE create extension pg_bufferca ...

随机推荐

一个简单的java回调函数的实现
回调函数回调函数涉及的3个函数登记回调函数回调函数响应回调函数简单的解释你到一个商店买东西,刚好你要的东西没有货,于是你在店员那里留下了你的电话.过了几天店里有货了,店员就打了你的电话,然 ...
Stack Exchange 的架构
近日,Stack Exchange系统管理员blog上发布了一篇关于Stack Exchange的架构一瞥,其包括了Stack Overflow, Server Fault 和 Super User的 ...
利用velocity.js将svg动起来
关于velocity.js Velocity.js是一款jquery动画引擎插件,它拥有与jquery中的$.animate()相同的API,还打包了颜色动画,转换,循环,easing效果,类动画.滚 ...
MySQL 创建数据库及数据表
1.创建数据库 (1) 命令行创建 [root@host]# mysqladmin -u root -p create RUNOOB Enter password:****** (2) php创建语 ...
LRU的C++实现引申出的迭代器问题
leetcode上刷题.碰到一题实现LRU算法的题目. LRU,Least recently used.是一种常见的cache和页面替换算法.算法和原理可以参阅相关wiki. leetcode上的这一 ...
jQuery 文档操作 - prependTo() ，appendTo()方法
其他jquery文档操作方法:http://www.w3school.com.cn/jquery/jquery_ref_manipulation.asp jQuery 参考手册 - 文档操作 appe ...
阿里云dataworks数据工场用户使用子账号
如果您是第一次使用子账号登录数加平台和使用DataWorks,您需要获知以下内容: 该子账号所属主账号的企业别名. 该子账号的用户名和密码. 该子账号的AccessKey ID和AccessKey S ...
Win7与虚拟机Linux互通ping的网络设置
转载请标明出处:http://www.linuxidc.com/Linux/2014-04/100450.htm 虽然从WinXP到Win7一直都可以使用VMWARE虚拟机安装Linux系统,记得每次 ...
递归函数, 匿名函数, yield from
递归函数函数执行流程 http://pythontutor.com/visualize.html#mode=edit 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1 ...
C语言学习笔记（四）流程控制
流程控制流程控制,说通俗一点就是程序代码执行的顺序.不管对于哪门语言来说,流程控制都是很重要的一部分内容: 流程控制的分类,可以分为三大类: 1.顺序这个很好理解,顺序执行就是代码从上往下一行行的 ...

一个fork的面试题——fork + 缓存区

一个fork的面试题——fork + 缓存区的更多相关文章

随机推荐

热门专题