今天一位朋友去一个不错的外企面试 Linux 开发职位,面试官出了一个如下的题目:

给出如下C程序,在 Linux 下使用 gcc 编译:

#include "stdio.h"
#include "sys/types.h"
#include "unistd.h" int main()
{
pid_t pid1;
pid_t pid2; pid1 = fork();
pid2 = fork(); printf("pid1:%d, pid2:%d\n", pid1, pid2);
}

要求如下:

已知从这个程序执行到这个程序的所有进程结束这个时间段内,没有其它新进程执行。

1、请说出执行这个程序后,将一共运行几个进程。

2、如果其中一个进程的输出结果是 “pid1:1001, pid2:1002”,写出其他进程的输出结果(不考虑进程执行顺序)。

明显这道题的目的是考察 Linux 下 fork 的执行机制。下面我们通过分析这个题目,谈谈 Linux 下fork 的运行机制。

预备知识

这里先列出一些必要的预备知识,对 Linux 下进程机制比较熟悉的朋友可以略过。

1、进程可以看做程序的一次执行过程。在 Linux 下,每个进程有唯一的 PID 标识进程。PID是一个从 \(1\) 到 \(32768\) 的正整数,其中1一般是特殊进程 init,其它进程从 \(2\) 开始依次编号。当用完 \(32768\) 后,从\(2\) 重新开始。

2、Linux 中有一个叫进程表的结构用来存储当前正在运行的进程。可以使用“ps aux”命令查看所有正在运行的进程。

3、进程在Linux 中呈树状结构,init 为根节点,其它进程均有父进程,某进程的父进程就是启动这个进程的进程,这个进程叫做父进程的子进程。

4、fork的作用是复制一个与当前进程一样的进程。新进程的所有数据(变量、环境变量、程序计数器等)数值都和原进程一致,但是是一个全新的进程,并作为原进程的子进程。

解题的关键

有了上面的预备知识,我们再来看看解题的关键。我认为,解题的关键就是要认识到 fork 将程序切成两段。看下图:

上图表示一个含有 fork 的程序,而fork语句可以看成将程序切为 A、B两个部分。然后整个程序会如下运行:

step1、设由 shell 直接执行程序,生成了进程 \(P\) 。\(P\) 执行完Part. A的所有代码。

step2、当执行到 pid = fork(); 时,P启动一个进程 \(Q\),\(Q\) 是 \(P\) 的子进程,和 \(P\) 是同一个程序的进程。\(Q\) 继承 \(P\) 的所有变量、环境变量、程序计数器的当前值。

step3、在 \(P\) 进程中,fork() 将 \(Q\) 的 PID 返回给变量 pid,并继续执行 Part. B 的代码。

step4、在进程 \(Q\) 中,将 \(0\) 赋给 pid,并继续执行Part. B的代码。

这里有三个点非常关键:

1、\(P\) 执行了所有程序,而 \(Q\) 只执行了 Part. B,即 fork() 后面的程序。(这是因为 \(Q\) 继承了 \(P\) 的PC-程序计数器)

2、\(Q\) 继承了 fork() 语句执行时当前的环境,而不是程序的初始环境。

3、\(P\) 中 fork() 语句启动子进程 \(Q\),并将 \(Q\) 的 PID 返回,而 \(Q\) 中的 fork() 语句不启动新进程,仅将 \(0\) 返回。


解题

下面利用上文阐述的知识进行解题。这里我把两个问题放在一起进行分析。

1、从 shell 中执行此程序,启动了一个进程,我们设这个进程为 \(P0\),设其 PID为 XXX(解题过程不需知道其PID)。

2、当执行到 pid1 = fork(); 时,\(P0\) 启动一个子进程 \(P1\) ,由题目知 \(P1\) 的 PID 为 \(1001\)。我们暂且不管 \(P1\)。

3、\(P0\) 中的 fork 返回 \(1001\)给pid1,继续执行到 pid2 = fork();,此时启动另一个新进程,设为\(P2\),由题目知 \(P2\) 的 PID 为 \(1002\) 。同样暂且不管 \(P2\)。

4、\(P0\) 中的第二个 fork 返回 \(1002\) 给 pid2,继续执行完后续程序,结束。所以,\(P0\)的结果为“pid1:1001, pid2:1002 ”。

5、再看 \(P2\),\(P2\) 生成时,\(P0\) 中 \(pid1=1001\),所以 \(P2\) 中 pid1 继承 \(P0\) 的 \(1001\),而作为子进程\(pid2=0\)。\(P2\) 从第二个 fork 后开始执行,结束后输出 “pid1:1001, pid2:0”。

6、接着看 \(P1\),\(P1\) 中第一条 fork 返回 \(0\) 给 pid1,然后接着执行后面的语句。而后面接着的语句是pid2 = fork(); 执行到这里,\(P1\) 又产生了一个新进程,设为 \(P3\) 。先不管 \(P3\) 。

7、\(P1\) 中第二条 fork 将 \(P3\) 的 PID 返回给 pid2,由预备知识知 \(P3\) 的 PID为 \(1003\),所以 \(P1\) 的\(pid2=1003\)。\(P1\)继续执行后续程序,结束,输出“pid1:0, pid2:1003”。

8、\(P3\) 作为 \(P1\) 的子进程,继承 \(P1\) 中 \(pid1=0\),并且第二条 fork 将 \(0\) 返回给 pid2,所以 \(P3\) 最后输出“ pid1:0, pid2:0 ”。

9、至此,整个执行过程完毕。

所得答案:

1、一共执行了四个进程。(P0, P1, P2, P3)

2、另外几个进程的输出分别为:

   pid1:1001, pid2:0

   pid1:0, pid2:1003

   pid1:0, pid2:0

进一步可以给出一个以 \(P0\) 为根的进程树:

验证

下面我们去linux下实际执行这个程序,来验证我们的答案。

程序如下图:

用 gcc 编译、执行后结果如下:

由于我们不太可能刚巧碰上 \(PID\) 分配到 \(1001\) 的情况,所以具体数值可能和答案有所差别。不过将这里的 \(2710\) 看做基数的话,结果和我们上面的解答是一致的。

总结

应该说这不是一道特别难或特别刁钻的题目,但是由于 \(fork\) 函数运行机制的复杂性,造就了当两个fork 并排时,问题就变得很复杂。解这个题的关键,一是要对 Linux 下进程的机制有一定认识,二是抓住上文提到的几个关于 fork 的关键点。朋友说,这个题给的时间是 \(5\) 分钟,应该说时间还算充裕,但是在面试的场合下,还是很考验一个人对进程、fork的掌握程度和现场推理能力。

希望本文能帮助朋友们对fork的执行机制有一个明晰的认识。

【转】OS | 从一道面试题谈 Linux 下 fork 的运行机制的更多相关文章

  1. 【Linux下进程机制】从一道面试题谈linux下fork的运行机制

    今天一位朋友去一个不错的外企面试linux开发职位,面试官出了一个如下的题目: 给出如下C程序,在linux下使用gcc编译: #include "stdio.h" #includ ...

  2. 从一道面试题谈linux下fork的运行机制

    http://www.cnblogs.com/leoo2sk/archive/2009/12/11/talk-about-fork-in-linux.html

  3. (转)linux下fork的运行机制

    转载http://www.cnblogs.com/leoo2sk/archive/2009/12/11/talk-about-fork-in-linux.html 给出如下C程序,在linux下使用g ...

  4. []转帖] 浅谈Linux下的五种I/O模型

    浅谈Linux下的五种I/O模型 https://www.cnblogs.com/chy2055/p/5220793.html  一.关于I/O模型的引出 我们都知道,为了OS的安全性等的考虑,进程是 ...

  5. 浅谈Linux下/etc/passwd文件

    浅谈Linux 下/etc/passwd文件 看过了很多渗透测试的文章,发现在很多文章中都会有/etc/passwd这个文件,那么,这个文件中到底有些什么内容呢?下面我们来详细的介绍一下. 在Linu ...

  6. 【转】Linux下Fork与Exec使用

    Linux下Fork与Exec使用 转自 Linux下Fork与Exec使用 一.引言 对于没有接触过Unix/Linux操作系统的人来说,fork是最难理解的概念之一:它执行一次却返回两个值.for ...

  7. Linux下Fork与Exec使用

    Linux下Fork与Exec使用   一.引言 对于没有接触过Unix/Linux操作系统的人来说,fork是最难理解的概念之一:它执行一次却返回两个值.fork函数是Unix系统最杰出的成就之一, ...

  8. Linux下fork()、vfork()、clone()和exec()的区别

    转自Linux下fork().vfork().clone()和exec()的区别 前三个和最后一个是两个类型.前三个主要是Linux用来创建新的进程(线程)而设计的,exec()系列函数则是用来用指定 ...

  9. [转帖]Linux下fork函数及pthread函数的总结

    Linux下fork函数及pthread函数的总结 https://blog.csdn.net/wangdd_199326/article/details/76180514 fork Linux多进程 ...

  10. linux下,一个运行中的程序,究竟占用了多少内存

    linux下,一个运行中的程序,究竟占用了多少内存 1. 在linux下,查看一个运行中的程序, 占用了多少内存, 一般的命令有 (1). ps aux: 其中  VSZ(或VSS)列 表示,程序占用 ...

随机推荐

  1. Acwing4244牛的比赛

    Acwing4244.牛的比赛 题目部分 N 头奶牛,编号 1∼N,一起参加比赛. 奶牛的战斗力两两不同. 这些奶牛之间已经进行了 M轮两两对决. 在对决中,战斗力高的奶牛一定会战胜战斗力低的奶牛. ...

  2. 多项目git账户用户名和邮箱设置以及局部github代理

    因为公司使用自建的gitlab服务器所以需要配置两个git账户分别用来访问公司仓库和自己的github仓库. 前言: 首先给大家梳理一下多用户名或者说多邮箱使用git的理解误区.我们需要知道的是我们的 ...

  3. 热烈祝贺:薪火数据(https://www.datainside.com.cn 数据中心低代码搭建平台)参加教育博览会取得圆满成功。

  4. JavaWeb开发-HTML基础学习

    1.HTML的基本语法 HTML是什么?:HTML是一种超文本标记语言,负责网页的结构,设计页面的元素内容等 超文本:超越文本限制,除了文本信息,还可以定义图片,音频,视频等 标记语言:由标签构成的语 ...

  5. [ABC261E] Many Operations

    Problem Statement We have a variable \(X\) and \(N\) kinds of operations that change the value of \( ...

  6. Mybatis-Flex核心功能之@Column

    1.是什么? MyBatis-Flex 提供了 @Column 用来对字段进行更多的配置 public @interface Column { /** * 字段名称 */ String value() ...

  7. 【UniApp】-uni-app-项目计算功能(苹果计算器)

    前言 本文主要介绍苹果计算器项目中计算功能的实现 在前面的文章中已经实现了输入,动态计算字体大小,以及计算器的布局 本文主要介绍计算功能的实现 正文 实现/清空/改变正负/除以100 inputTex ...

  8. 面试官:说说MVCC的执行原理?

    MVCC(Multi-Version Concurrency Control)是一种并发控制机制,用于解决数据库并发访问中,数据一致性问题.它通过在读写操作期间保存多个数据版本,以提供并发事务间的隔离 ...

  9. 使用dtd定义元素

  10. 性能测试常见面试题(Loadrunner)

    https://blog.csdn.net/xiangxiupp/article/details/53862056