关于fork 的一个小问题
2015-03-31 19:57
148 查看
首先看一个程序:
题目:请问下面的程序一共输出多少个“-”?
如果你对fork()的机制比较熟悉的话,这个题并不难,输出应该是6个“-”,但是,实际上这个程序会很tricky地输出8个“-”。
要讲清这个题,我们首先需要知道fork()系统调用的特性,
fork()系统调用是Unix下以自身进程创建子进程的系统调用,一次调用,两次返回,如果返回是0,则是子进程,如果返回值>0,则是父进程(返回值是子进程的pid),这是众为周知的。
还有一个很重要的东西是,在fork()的调用处,整个父进程空间会原模原样地复制到子进程中,包括指令,变量值,程序调用栈,环境变量,缓冲区,等等。
所以,上面的那个程序为什么会输入8个“-”,这是因为printf(“-“);语句有buffer,所以,对于上述程序,printf(“-“);把“-”放到了缓存中,并没有真正的输出,在fork的时候,缓存被复制到了子进程空间,所以,就多了两个,就成了8个,而不是6个。
另外,多说一下,我们知道,Unix下的设备有“块设备”和“字符设备”的概念,所谓块设备,就是以一块一块的数据存取的设备,字符设备是一次存取一个字符的设备。磁盘、内存都是块设备,字符设备如键盘和串口。块设备一般都有缓存,而字符设备一般都没有缓存。
对于上面的问题,我们如果修改一下上面的printf的那条语句为:
我估计有些朋友可能对于fork()还不是很了解,那么我们把上面的程序改成下面这样:
于是,上面这段程序会输出下面的结果,(注:编译出的可执行的程序名为fork)
面对这样的图你可能还是看不懂,没事,我好事做到底,画个图给你看看:
注意:上图中的我用了几个色彩,相同颜色的是同一个进程。于是,我们的pstree的图示就可以成为下面这个样子:(下图中的颜色与上图对应)
这样,对于printf(“-“);这个语句,我们就可以很清楚的知道,哪个子进程复制了父进程标准输出缓中区里的的内容,而导致了多次输出了。(如下图所示,就是我阴影并双边框了那两个子进程)
转自:http://coolshell.cn/articles/7965.html 。
后记:上文没有说明缓冲区的类型。下面说一下缓冲类型。
标准IO缓冲详解全缓冲 行缓冲 不缓冲
标准I/O库提供缓冲的目的是尽可能地减少使用read和write调用的次数。他也对每个I/O流自动地进行缓冲管理,从而避免了应用程序需要考虑这一点所带来的麻烦。不幸的是,标准I/O库最令人迷惑的也是他的缓冲。
标准I/O提供了三种类型的缓冲:
1、全缓冲。
这种情况下,在填满标准I/O缓冲区后才进行实际I/O操作。对于驻留在磁盘上的文件通常是由标准I/O库实施全缓冲。一个流上执行第一次I/O操作时,相关标准I/O函数通常调用malloc获得需使用的缓冲区。
术语冲洗说明I/O缓冲区的写操作。缓冲区可由标准I/O例程自动冲洗,或者可以调用函数fflush冲洗一个流。值得引起注意的是在UNIX环境中,flush有两种意思。在标准I/O库方面,flush以为这将缓冲区中的内容写到磁盘上。在终端驱动程序方面flush表示丢弃已存储在缓冲区中的数据。
2、行缓冲。
在这种情况下,当在输入和输出中遇到换行符时,标准I/O库执行I/O操作。这允许我们一次输出一个字符,但只有在写了一行之后才进行实际I/O操作。当流涉及一个终端时,通常使用行缓冲。
对于行缓冲有两个限制。
1. 因为标准I/O库用来收集每一行的缓冲区的长度是固定的,所以只要填满了缓冲区,那么即使没有写一个换行符,也进行I/O操作。
2. 任何时候只要通过标准I/O库要求从a一个不带缓冲的流,或者b一个行缓冲的流得到输入数据,那么就会造成冲洗所有行缓冲输出流。
3、不带缓冲。
标准I/O库不对字符进行缓冲存储。例如,如果用标准 I/O函数fputs写15个字符到不带缓冲的流中,则该函数很可能用write系统调用函数将这些字符立即写至相关联的打开文件中。
标准出错stderr通常是不带缓冲的,这就使得出错信息可以尽快显示出来,而不管它们是否含有一个换行符。
ISO C要求下列缓冲特征:
1. 当且仅当标准输入和标准输出并不涉及交互式设备使,他们才是全缓冲的。
2. 标准出错不会使用全缓冲的。
但是,这并没有告诉我们如果标准输入和标准输出涉及交互式设备时,他们是不带缓冲的还是行缓冲的;以及标准出错时不带缓冲的还是行缓冲的。很多系统默认使用下列类型的缓冲:
1. 标准出错是不带缓缓冲的。
2. 如若是涉及终端设备的其他流,则他们是行缓冲的;否则是全缓冲的。
对任何一个给定的流,如果我们并不喜欢这些系统默认的情况,则可调用下列函数中的更改缓冲类型:
void setbuf(FILE *restrict fp, char *restrict buf) //打开或关闭缓冲机制
int setvbuf(FILE *restrict fp, char *restrict buf,int mode,size_t size) //设置缓冲类型
看下面的程序:#include <iostream>
#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>
using namespace std;
int main()
{
char buf[1024];
setvbuf(stdout , buf , _IOFBF , 1024);//quan huan chong
// setvbuf(stdout , buf , _IOLBF , 1);//hang huan chong
// setvbuf(stdout , NULL , _IONBF , 0);//wu huan chong
for(int i = 0 ; i < 2 ; i++)
{
cout<<"-\n";
fork();
cout<<"-\n";
}
cout<<endl;
}
上面使用全缓冲,输出结果如下:
输出了16个-
如果使用行缓冲或者无缓冲,输出结果如下:
[root@chenchen 15]# ./a.out
-
-
-
-
-
-
-
-
-
[root@chenchen 15]#
如果不设置缓冲,CentOS系统,gcc编译器下默认缓冲方式是行缓冲(VS编译器下默认好像是无缓冲),输出结果是第二种形式。
程序如下:
输出结果如下:
题目:请问下面的程序一共输出多少个“-”?
#include <stdio.h> #include <sys/types.h> #include <unistd.h> int main(void) { int i; for(i=0; i<2; i++){ fork(); printf("-"); } wait(NULL); wait(NULL); return 0; }
如果你对fork()的机制比较熟悉的话,这个题并不难,输出应该是6个“-”,但是,实际上这个程序会很tricky地输出8个“-”。
要讲清这个题,我们首先需要知道fork()系统调用的特性,
fork()系统调用是Unix下以自身进程创建子进程的系统调用,一次调用,两次返回,如果返回是0,则是子进程,如果返回值>0,则是父进程(返回值是子进程的pid),这是众为周知的。
还有一个很重要的东西是,在fork()的调用处,整个父进程空间会原模原样地复制到子进程中,包括指令,变量值,程序调用栈,环境变量,缓冲区,等等。
所以,上面的那个程序为什么会输入8个“-”,这是因为printf(“-“);语句有buffer,所以,对于上述程序,printf(“-“);把“-”放到了缓存中,并没有真正的输出,在fork的时候,缓存被复制到了子进程空间,所以,就多了两个,就成了8个,而不是6个。
另外,多说一下,我们知道,Unix下的设备有“块设备”和“字符设备”的概念,所谓块设备,就是以一块一块的数据存取的设备,字符设备是一次存取一个字符的设备。磁盘、内存都是块设备,字符设备如键盘和串口。块设备一般都有缓存,而字符设备一般都没有缓存。
对于上面的问题,我们如果修改一下上面的printf的那条语句为:
printf("-\n");或是
printf("-"); fflush(stdout);就没有问题了(就是6个“-”了),因为程序遇到“\n”,或是EOF,或是缓中区满,或是文件描述符关闭,或是主动flush,或是程序退出,就会把数据刷出缓冲区。需要注意的是,标准输出是行缓冲,所以遇到“\n”的时候会刷出缓冲区,但对于磁盘这个块设备来说,“\n”并不会引起缓冲区刷出的动作,那是全缓冲,你可以使用setvbuf来设置缓冲区大小,或是用fflush刷缓存。
我估计有些朋友可能对于fork()还不是很了解,那么我们把上面的程序改成下面这样:
#include <stdio.h> #include <sys/types.h> #include <unistd.h> int main(void) { int i; for(i=0; i<2; i++){ fork(); //注意:下面的printf有“\n” printf("ppid=%d, pid=%d, i=%d \n", getppid(), getpid(), i); } sleep(10); //让进程停留十秒,这样我们可以用pstree查看一下进程树 return 0; }
于是,上面这段程序会输出下面的结果,(注:编译出的可执行的程序名为fork)
ppid=8858, pid=8518, i=0 ppid=8858, pid=8518, i=1 ppid=8518, pid=8519, i=0 ppid=8518, pid=8519, i=1 ppid=8518, pid=8520, i=1 ppid=8519, pid=8521, i=1 $ pstree -p | grep fork |-bash(8858)-+-fork(8518)-+-fork(8519)---fork(8521) | | `-fork(8520)
面对这样的图你可能还是看不懂,没事,我好事做到底,画个图给你看看:
注意:上图中的我用了几个色彩,相同颜色的是同一个进程。于是,我们的pstree的图示就可以成为下面这个样子:(下图中的颜色与上图对应)
这样,对于printf(“-“);这个语句,我们就可以很清楚的知道,哪个子进程复制了父进程标准输出缓中区里的的内容,而导致了多次输出了。(如下图所示,就是我阴影并双边框了那两个子进程)
转自:http://coolshell.cn/articles/7965.html 。
后记:上文没有说明缓冲区的类型。下面说一下缓冲类型。
标准IO缓冲详解全缓冲 行缓冲 不缓冲
标准I/O库提供缓冲的目的是尽可能地减少使用read和write调用的次数。他也对每个I/O流自动地进行缓冲管理,从而避免了应用程序需要考虑这一点所带来的麻烦。不幸的是,标准I/O库最令人迷惑的也是他的缓冲。
标准I/O提供了三种类型的缓冲:
1、全缓冲。
这种情况下,在填满标准I/O缓冲区后才进行实际I/O操作。对于驻留在磁盘上的文件通常是由标准I/O库实施全缓冲。一个流上执行第一次I/O操作时,相关标准I/O函数通常调用malloc获得需使用的缓冲区。
术语冲洗说明I/O缓冲区的写操作。缓冲区可由标准I/O例程自动冲洗,或者可以调用函数fflush冲洗一个流。值得引起注意的是在UNIX环境中,flush有两种意思。在标准I/O库方面,flush以为这将缓冲区中的内容写到磁盘上。在终端驱动程序方面flush表示丢弃已存储在缓冲区中的数据。
2、行缓冲。
在这种情况下,当在输入和输出中遇到换行符时,标准I/O库执行I/O操作。这允许我们一次输出一个字符,但只有在写了一行之后才进行实际I/O操作。当流涉及一个终端时,通常使用行缓冲。
对于行缓冲有两个限制。
1. 因为标准I/O库用来收集每一行的缓冲区的长度是固定的,所以只要填满了缓冲区,那么即使没有写一个换行符,也进行I/O操作。
2. 任何时候只要通过标准I/O库要求从a一个不带缓冲的流,或者b一个行缓冲的流得到输入数据,那么就会造成冲洗所有行缓冲输出流。
3、不带缓冲。
标准I/O库不对字符进行缓冲存储。例如,如果用标准 I/O函数fputs写15个字符到不带缓冲的流中,则该函数很可能用write系统调用函数将这些字符立即写至相关联的打开文件中。
标准出错stderr通常是不带缓冲的,这就使得出错信息可以尽快显示出来,而不管它们是否含有一个换行符。
ISO C要求下列缓冲特征:
1. 当且仅当标准输入和标准输出并不涉及交互式设备使,他们才是全缓冲的。
2. 标准出错不会使用全缓冲的。
但是,这并没有告诉我们如果标准输入和标准输出涉及交互式设备时,他们是不带缓冲的还是行缓冲的;以及标准出错时不带缓冲的还是行缓冲的。很多系统默认使用下列类型的缓冲:
1. 标准出错是不带缓缓冲的。
2. 如若是涉及终端设备的其他流,则他们是行缓冲的;否则是全缓冲的。
对任何一个给定的流,如果我们并不喜欢这些系统默认的情况,则可调用下列函数中的更改缓冲类型:
void setbuf(FILE *restrict fp, char *restrict buf) //打开或关闭缓冲机制
int setvbuf(FILE *restrict fp, char *restrict buf,int mode,size_t size) //设置缓冲类型
看下面的程序:#include <iostream>
#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>
using namespace std;
int main()
{
char buf[1024];
setvbuf(stdout , buf , _IOFBF , 1024);//quan huan chong
// setvbuf(stdout , buf , _IOLBF , 1);//hang huan chong
// setvbuf(stdout , NULL , _IONBF , 0);//wu huan chong
for(int i = 0 ; i < 2 ; i++)
{
cout<<"-\n";
fork();
cout<<"-\n";
}
cout<<endl;
}
上面使用全缓冲,输出结果如下:
[root@chenchen 15]# ./a.out - - - - - - - - - - - - - - - - [root@chenchen 15]#
输出了16个-
如果使用行缓冲或者无缓冲,输出结果如下:
[root@chenchen 15]# ./a.out
-
-
-
-
-
-
-
-
-
[root@chenchen 15]#
如果不设置缓冲,CentOS系统,gcc编译器下默认缓冲方式是行缓冲(VS编译器下默认好像是无缓冲),输出结果是第二种形式。
程序如下:
#include <iostream> #include <stdio.h> #include <unistd.h> #include <sys/types.h> using namespace std; int main() { char buf[1024]; // setvbuf(stdout , buf , _IOFBF , 1024);//quan huan chong // setvbuf(stdout , buf , _IOLBF , 1);//hang huan chong // setvbuf(stdout , NULL , _IONBF , 0);//wu huan chong for(int i = 0 ; i < 2 ; i++) { cout<<"-\n"; fork(); cout<<"-\n"; } cout<<endl; }
输出结果如下:
[root@chenchen 15]# ./a.out - - - - - - - - - [root@chenchen 15]#
相关文章推荐
- 一个关于在VB.NET中应用超级解霸的问题
- 一个关于#include的问题
- 关于SQL的存储过程一个悬而未决的老问题
- 关于数据库备份的一个问题??
- 关于CreateService的一个大问题:权限问题
- 一个关于xslt的模板匹配规则的问题
- 一个关于Schema的问题,请求帮助
- 一个关于bin目录下DLL动态编译的问题
- java 中关于package的一个问题
- 关于统计的一个sql问题,使用动态sql语句实现。
- 关于FREETEXTBOX组件的一个小问题
- DataGuard - 一个关于Physical Standby中recover问题的解决方法
- DataGuard - 一个关于Physical Standby中recover问题的解决方法
- 发现一个奇怪的问题,关于文件名
- 一个关于重定向的问题研究,应该具有实用性
- 一个我很长时间才解决的关于xp与2000共享的网络问题
- 一个关于windows installer的问题,很郁闷!
- 今天看StarterKit.Communities中的关于获取路径部分,发现一个问题?难道老外也会不仔细看MSDN,还是?
- 请教一个关于WEBFORM 调用外部EXE程序的问题
- [unix c]关于FOLK和PRINTF()的一个小问题