您的位置：首页 > 职场人生

一个关于fork（）的面试题

2017-07-07 14:33 176 查看

前两天有人问了个关于Unix的fork()系统调用的面试题，这个题正好是我大约十年前找工作时某公司问我的一个题，我觉得比较有趣，写篇文章与大家分享一下。这个题是这样的：

题目：请问下面的程序一共输出多少个“-”？

#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>

intmain(void)
{
inti;
for(i=0; i<2; i++){
fork();
printf("-");
}

wait(NULL);
wait(NULL);

return0;
};

如果你对fork()的机制比较熟悉的话，这个题并不难，输出应该是6个“-”，但是，实际上这个程序会很tricky地输出

8个“-”。

要讲清这个题，我们首先需要知道fork()系统调用的特性，

fork()系统调用是Unix下以自身进程创建子进程的系统调用，一次调用，两次返回，如果返回是0，则是子进程，

如果返回值>0，则是父进程（返回值是子进程的pid），这是众为周知的。
还有一个很重要的东西是，在fork()的调用处，整个父进程空间会原模原样地复制到子进程中，包括指令，变量值，

程序调用栈，环境变量，缓冲区，等等。
所以，上面的那个程序为什么会输入8个“-”，这是因为printf("-");语句有buffer，所以，对于上述程序，

printf("-");把“-”放到了缓存中，并没有真正的输出（参看《<a title="C语言的谜题

"href="http://coolshell.cn/articles/945.html"target="_blank">C语言的迷题</a>》中的第一题），

<strong>在fork的时候，缓存被复制到了子进程空间</strong>，所以，就多了两个，就成了8个，而不是6个。

另外，多说一下，我们知道，Unix下的设备有

“<a href="http://en.wikipedia.org/wiki/Device_file#Block_devices"target="_blank">块设备</a>”

和“<a href="http://en.wikipedia.org/wiki/Device_file#Character_devices"target="_blank">字符设备</a>”

的概念，所谓块设备，就是以一块一块的数据存取的设备，字符设备是一次存取一个字符的设备。

磁盘、内存都是块设备，字符设备如键盘和串口。<strong>块设备一般都有缓存，而字符设备一般都没有缓存</strong>。

对于上面的问题，我们如果修改一下上面的printf的那条语句为：

printf("-\n");

或是

就没有问题了（就是6个“-”了），因为程序遇到“\n”，或是EOF，或是缓中区满，或是文件描述符关闭，或是主动flush，或是程序退出，就会把数据刷出缓冲区。需要注意的是，标准输出是行缓冲，所以遇到“\n”的时候会刷出缓冲区，但对于磁盘这个块设备来说，“\n”并不会引起缓冲区刷出的动作，那是全缓冲，你可以使用setvbuf来设置缓冲区大小，或是用fflush刷缓存。

我估计有些朋友可能对于fork()还不是很了解，那么我们把上面的程序改成下面这样：

#include

#include

#include

int main(void)

{

int i;

for(i=0; i<2; i++){ fork(); //注意：下面的printf有“\n” printf("ppid=%d, pid=%d, i=%d \n", getppid(), getpid(), i); } sleep(10); //让进程停留十秒，这样我们可以用pstree查看一下进程树 return 0; } [/c] 于是，上面这段程序会输出下面的结果，（注：编译出的可执行的程序名为fork） [shell]ppid=8858, pid=8518, i=0 ppid=8858, pid=8518,
i=1 ppid=8518, pid=8519, i=0 ppid=8518, pid=8519, i=1 ppid=8518, pid=8520, i=1 ppid=8519, pid=8521, i=1 $ pstree -p | grep fork |-bash(8858)-+-fork(8518)-+-fork(8519)---fork(8521) | | `-fork(8520)[/shell] 面对这样的图你可能还是看不懂，没事，我好事做到底，画个图给你看看：

注意：上图中的我用了几个色彩，相同颜色的是同一个进程。于是，我们的pstree的图示就可以成为下面这个样子：（下图中的颜色与上图对应）

这样，对于printf(“-“);这个语句，我们就可以很清楚的知道，哪个子进程复制了父进程标准输出缓中区里的的内容，而导致了多次输出了。（如下图所示，就是我阴影并双边框了那两个子进程）

现在你明白了吧。（另，对于图中的我本人拙劣的配色，请见谅!）

（全文完）

另一种解释：

1、
#include <sys/types.h>
#include <stdio.h>
#include <stdlib.h>
int main(){    for(int i=0;i<2;i++){

    fork();

    printf("-");
    }

    return 0;

}
输出结果为 8个“-”
2、
#include <sys/types.h>
#include <stdio.h>
#include <stdlib.h>
int main(){
    for(int i=0;i<2;i++){

    fork();

    printf("-\n");
   }

    return 0;

}
输出结果为 6个“-”

很纳闷，为什么一个\n换行符会对输出结果产生影响呢？究其原因就得考究fork函数是如何产生子进程。在执行fork以后，操作系统复制一份当前执行的进程的数据，包括进程的数据空间、堆和栈等，并且在进程表中相应为它建立一个新的表项。上下文也是原进程（父进程）的拷贝。但是父、子进程共享正文段，也就是CPU执行的机器指令部分，这个可共享的，在存储器中只需要一个副本，而且这个副本通常是只读的。所以子进程函数执行点是从父进程中调用fork函数开始往下执行的。关于这一点，理解父子进程关系的话，应该不难理解。而这个\n换行符对输出产生的影响则是和printf函数的缓冲机制有关。当调用printf函数的时候，函数中的输出数据是先被放入缓冲区中，而并没有直接输出到屏幕，直到往缓冲区中压入\n换行符或者是调用了flush之类的函数，才会把数据输出到屏幕。而这个缓冲区在每个子进程都拥有一份副本。所以现在就知道该如何分析了。
首先，先分析没有加\n换行符的函数，i=0时，父进程调用fork函数，此时父进程中的缓冲区中有0个“-”，其子进程2中的上下文与父进程相同，因此子进程将执行1次FOR循环，此时，该进程缓冲区拥有1个“-”，并再次调用fork产生新的子进程3，上下文内容与产生其的父进程相同，也就是缓冲区中拥有一个“-”，但是此时i=1，新产生的子进程将不再执行for循环。回到主进程，也就是一个父进程，父进程将执行两次for循环，第二次for循环将产生一个新的子进程4，其缓冲区中有一个“-”。最后别忘了每一个进程都是从fork调用点开始执行的，所以每个进程都会输出一个“-”，加起来就是8个了。
对于程序2，则在上述分析过程中，注意一下缓冲区中的数据何时被清理，就可以算出结果了。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航