您的位置:首页 > 运维架构 > Linux

Linux间的进程通信;以及子进程的创建

2016-09-01 21:52 351 查看
"-----第六天-----------------------------------------------------------------------------"

1.版本控制:svn/git;

2.进程的概念:
1)程序和进程;
每个进程操作系统会为它分配 0-4G 的虚拟内存空间(32位操作系统); 其中0-3G为用户内存空间,进程可以对它进行读写操作; 3G - 4G 为系统内核空间,进程没有读写权限。
进程只能读写用户空间,没有权限读写内核空间(kernel);
2)内存页面的概念
操作系统是按页来管理内存的;每个页有4096个字节。
还可以设置页面属性:如char *str = "hello",字符串在只读数据段,此时只能读,不能写。

3)进程的4种形态:0-3级; 0 级(内核态),最高; 3级(用户态);最低。

2)并发:
3)单道程序设计/多道程序设计
4)CPU/MMU
5)PCB:结构体;其中有一个指针指向文件描述符表;文件描述符表中存储1024个指针;已经打开的文件结构体。
每个进程有属于自己的PCB(进程的状态描述符);但是多个进程只有一个内核区。
3.环境变量控制
1)echo $名称;    查看该名称的环境变量。
2)查看系统的环境变量: env;
3)获取环境变量的值:char *getenv(const char* name);    获取键name环境变量的值。
4)设置环境变量:int    setenv(const char *name, const char *value, int rewrite);    将环境变量name的值设置为 value。
如果环境变量 name 已存在;则 rewrite 非0,覆盖原来的环境变量;rewrite为0,则不覆盖原来的环境变量。
5)删除环境变量: void unsetenv(const char *name) 删除 name    的定义;

6)进程里可以设置自己的环境变量,避免设置在终端,影响他人。
4.环境控制原语:
1)fork:
2)wait/waitpid
3)

5. printenv.c

6.进程的状态:4 种或 5 种,都对。 就绪, 运行, 睡眠, 停止。

7.CPU的组成状态: 运算器,寄存器,控制器,译码器。

操作系统完成进程调度。(cpu进行时钟周期运算)
cpu的分时复用功能,使进程看起来像多进程。
在单核 cpu 上,同一时间只能有一个进程处于运行状态。那么多核 cpu,就可以有多个进程处于运行状态。

8.进程原语:
1)创建子进程。pid_t fork();    调用1次,返回两次;在父进程返回子进程的 PID, 在子进程返回0.
2) fork()的工作进程:先调用 creat(),创建一个进程, 在调用 clone(),给子进程复制父进程的内容;
3)pid = fork();    //此时父子进程就都出来了。
4)pid_t getpid();  返回调用进程的PID号;
pid_t getppid();    返回调用进程的父进程的PID号
当在子进程中 getpid(),得到的值与 fork()父进程的返回值相等,都是这个子进程的id号
5)父子进程:读时共享,写时复制。
6)最大创建进程 个数;
9.    uid_t getuid(void);        //返回实际用户id;
uid_t geteuid(void);     //返回有效用户id;
"注意: 文件实际用户与有效用户在创建该文件的家目录下时,如果没有修改,此时是相通的。
当文件被拷贝到root目录时,   "
设置用户id; chmod 04755;  4 是设置用户ID。  完后效果为 -rwsr-xr-x;  s表示设置了用户ID。
作用:当执行此文件时,执行者有效用户ID变为此文件的所有者。
设置用户组ID: chmod 06777; 6 是设置用户ID和组ID; 效果为: -rwsrwsrwx;

10. exec族函数的使用:
1)功能: 去磁盘中加载另一个可执行程序,用它的代码段、数据段替换掉当前可执行程序的代码段、数据段;然后从后加载的这个程序退出,被替换的程序后续代码就不执行了。(换核不换壳,)
2)一般情况下:与 fork() 函数联合使用;。  同时exec族函数不会创建新进程, 所以该程序的 ID 不会改变。

3)函数的返回值: 成功没有返回值,运行完毕,自己退出。
失败返回 -1;
4)exec族函数的规律: l(list):命令行参数列表。  p(path): 搜索file时使用path变量。
v(vector):使用命令行参数数组。  e(environment):使用环境变量的数组,不使用进程原有的环境变量,设置新加载程序的环境变量;

5)int execl(const char *path, const char *argc, ...);
例如:execl("./bin/ls", "ls", "-l", "-a", NULL);    这几个参数的作用:其中第一个参数:"./bin/ls",命令的环境变量(即所在文件),不可以改变,必须完整正确;
"ls":占位参数,可以随便写,一般写成该命令。(不能缺失,如果缺失了,就会把后面的命令参数变为占位参数,输出结果会出错。) "-l","-a"该命令的参数。   NULL:卫兵,执行到这里时命令结束。

11. toupper():将小写字母变为大写。

12.僵尸进程,孤儿进程:
1)S:睡眠状态;  Z:僵尸状态;
2)僵尸进程的产生原因:用户空间释放,内核空间的PCB没有释放,等着父进程回收。(它消耗的是内核当中的内存资源)
即:子进程退出,父进程没有回收子进程资源(PCB),则子进程变为僵尸进程。
3)子进程的PCB(在内核空间)没有释放,是留给父进程回收用的。只有父进程回收后,僵尸进程才会消失。
4)杀死僵尸进程的办法是杀掉它的父进程。

孤儿进程:父进程先于子进程结束,则子进程变为孤儿进程,子进程的变为1号进程init进程,由1号进程领养。

"僵尸进程比孤儿进程更危险, 因为它不会自动关;,而孤儿进程会由 1 号进程领养,当它执行完毕后,会被 1 号进程回收"。
做开发时主要避免的是僵尸进程的产生。用 wait(); waitpid(); 来避免僵尸进程的产生。

13. pid_t wait(int* status);  (阻塞函数,等待回收子进程资源;如果没有子进程,返回-1);
1)返回值:回收的子进程的ID号,    wait(NULL);不关心子进程如何死亡,直接回收。
wait(&st); 用st来保存子进程死亡时的状态。

2)    父进程的ID与它的进程组ID相同;子进程的组ID与父进程的ID相同。
kill -9 -父进程的ID(即组进程的ID),这个进程组的所有进程都被杀死。"(注意 - 不能少)"

14.pid_t waitpid(pid_t pid, int *status, int options);    (设置非阻塞。)
第一个参数 pid的值类型:    1) < -1; 回收指定进程组内的任意子进程。(因为父进程与子进程属于统一进程组,父进程与孙子进程属于不同的进程组,但是他们有血缘关系。)
-1;回收任意子进程(只要有血缘关系就行。)
0; 回收 当前调用 waitpid 一个进程组的所有子进程。
> 0; 回收指定ID的子进程。
第二个参数:保存子进程的推出状态。

第三个参数:WNOHANG:如果没有子进程退出,立即返回。(实现了非阻塞的 wait).

15. 阻塞函数:非阻塞函数:在文件open(O_NONBLOCK)的时设置宏;读常规文件不会出现阻塞,当读伪文件时会出现。
例如:阻塞读终端; 管道; 网络;

设置非阻塞后:应设置轮询。

"=========进程间的通信(IPC)==========================================================================================================="
一。IPC方法:Linux环境下,多个进程间的通信,需要通过内核,在内核中开辟一块缓冲区(赋予他用户权限);进程1把数据从用户空间拷贝到内核缓冲区,
进程2 把数据从内核缓冲区拷读走,内核提供的这种机制称为进程间的通信(IPC)。

进程间的通信;四种方法:1.pipe管道 2.fifo有名管道,3.内存共享映射 4.Unix Domain Socket;
管道(使用最简单);信号(开销最小);共享映射区(速度最快,效率最高); 本地套接字(最稳定);

二。pipe管道:
1.管道的特性:数据只能一个读,一个写,必须是一个方向。
半双工:数据同一时刻只能有一个流向。即只能父进程写,子进程读; 或子进程写, 父进程读。
全双工:数据同一时刻可以两个方向。
单工:数据只能同一个方向流动。
dup2(int oldfd, int newfd);        将第一个参数拷贝给第二个参数。
1.其本质是一个伪文件(实为内核缓冲区)
2.有两个文件描述符引用,一个读端,一个写端。
3.规定数据从管道的写端流入,从读端流出。

管道的原理:管道实为内核使用环形队列机制,借助内核缓冲区(4K)实现的。

管道的局限性:1.数据不能自己写,自己读;
2.管道中的数据不能反复读取,一旦读走,管道中不再存在。
3.采用半双工通信方式,数据只能在单方向上流动。
4.只能在有血缘关系之间的进程使用管道。
5.只能进行单向通信,双向通信需要建立两个管道。

2. pipe()创建管道,用于有血缘关系之间的通信。(采用环形队列实现的)
管道使用半双工通信; 创建完管道完后,确定通信方向:父写子读,或子写父读。
如果想创建多条管道,一定要先pipe(),再fork(),使子进程得以继承管道。

使用管道时的四种注意情况:
1) 写段关闭,读端读完管道里的内容时;再次读,返回0,相当于读到文件末尾EOF;
2)写端未关闭,写端无数据, 读端读完管道里的数据时,再次读,阻塞。
3)读端关闭, 写段写管道,产生SIGPIPE信号,写进程默认情况下会终止进程。
4)读端未读管道数据,当写段写满管道后,在此写,阻塞。
5)使用管道,无须open,但需手动close。

管道的缓冲区大小:1.函数的方法:fpathconf(int fd, int name);  第一个参数为管道描述符;第二个参数为情况标识符。
2.命令: ulimit -a;

3.    总结:
1.读管道:
1.管道中有数据,read返回实际读到的字节数;
2.管道中无数据,写端都被关闭,read返回 0,相当于读到文件末尾;
写端未关闭,read函数阻塞等待,(期待不久的将来会有数据到来,但此时会让出CPU资源)
2.写管道:
1.管道读端全部关闭;进程异常中止(返回一个终止信号);
2.管道读端未关闭:
1)管道已写满,write阻塞等待

2)管道未写满,write将数据写入,返回实际写入的字节数;

"==========================================================================="
4.设置非阻塞管道的两种办法:
1)fcntl函数设置非阻塞管道;
int flg = fcntl(fd, F_GETFD);
flg |= O_NONBLOCK;
fcntl(fd, F_SETFL, flg);
2)打开文件时直接设置非阻塞;
int fd = open("/dev/tty", O_RDWR | O_NONBLOCK);
当读取一个非阻塞文件,但是此时没有内容,会出错,错误码为EAGAIN;
5. read() 函数的返回值四种情况;由于非阻塞设置的存在.
1.返回值 > 0; 读到的字节数
2.返回值 < 0; 读到文件末尾
3.返回值 == -1;但是errno != EAGAIN  或 EWOULDBLOCK
if( ret == -1) {
if(errno ==  EAGAIN)
{
说明文件被设置为非阻塞方式读取,此时数据没有到达。
}
else
{
失败;
}
}
4.返回值 == -1, 但是errno == EAGAIN  或 EWOULDBLOCK;
说明此时文件被设置为非阻塞方式读取,数据还没有到达。
"========================================================================"
三. fifo有名管道:解决无血缘关系的进程通信;
1.介绍:
FIFO文件在磁盘上没有数据块,仅仅用来标识内核中的一条管道。各进程可以打开这个文件进行read/write,实际上是在写内核通道,这样就实现了进程间的通信。
1.创建fifo的方法:
1)在终端创建一个有名管道;(不常用)用命令;"mkfifo 管道名";
2)在代码运行时创建一个有名管道;(常用)用函数;int mkfifo(const char*pathname, mode_t mode);成功返回 0,失败-1;

2.利用fifo实现非血缘关系进程间通信
1.进程使用 “同一个fifo” 完成进程间通信。
2.一个进程以只读方式打开read端,一个程序以只写打开写段。
3.一根管道可以打开多个读端,多个写段。(一个写段多个读端; 或 一个读端多个写段);

3.多种特殊情况:
当一个写端多个读端时: 每个读端读取到的数据都不相同,因为从管道中读数据,读走之后,管道中的这个数据就不存在了;此时每个读端读到的所有内容合在一起为
管道写端写入的数据
当多个写端一个读端时, 每个写端写入的数据都会被这个读端读取出来;此时管道读到的数据为所有写端写入的数据。

四。mmap 内存映射:

从磁盘映射到kernel区,同时kernel区这段内存(映射占用的)开放了用户区的权限;所以进程可以进行访问

1.文件是应用于进程间通信
1)父子进程之间
可以用文件进行通信;
2)非血缘关系进程间通信
可以用文件进行通信;

2.建立映射区,完成进程间通信
1)mmap函数;六个参数的不同意义

2)注意事项
1.open的时候可以创建一个新文件,但是用此文件创建映射区时,大小不能为0;(可以进行文件拓展后再用来创建映射)
mmap使用的时候经常出现总线错误,通常是由于共享文件存储空间大小引起的。

2.创建映射区的时候, 隐含着一次对文件的读操作;所以文件打开的方式只能为"读写;或读"。
当 MAP_SHARED(对内存的修改将反应到磁盘空间)    时,要求 映射区的权限 <= 文件打开的权限。
当 MAP_PRIVATE(对内存修改不会反应到磁盘空间)  时,此时则没有要求。(mmap中的权限是对内存的限制);

3.映射区创建完后关闭文件按描述符,对映射区没有影响。
4."最后一个参数,偏移量必须是4K的整数倍。"
5.munmap函数传入的地址一定要是mmap的返回地址。坚决杜绝对mmap函数的返回值进行++操作
6.mmap创建映射区出错的概率非常高,必须进行出错判断。

3)父子进程间的mmap(用户空间独立,内核去各进程共享。)
1.先mmap创建映射区
2.再fork()共享映射区内存首地址
3.指定MAP_SHARED;(必须是 SHARED);

4)非血缘关系进程间通信
1.使用“同一个文件”创建映射区
2.两个进程,一个以read映射区,一个以write方式打开映射区;
3.指定 MAP_SHARED;
4)MAP_ANONYMOUS(匿名映射); 不可以用来通信
5)/dev/zero(系统的伪文件); 不可以用来通信
5)匿名映射
linux 创建匿名映射:第四个参数添加 MAP_ANON或MAP__ANONYMOUS;(注意这个匿名宏,只有Linux操作系统可以使用)。

UNIX(没有上述的匿名宏)。使用系统中的特殊文件(/dev/zero;(无限读,可以用来创建匿名映射))

3.数据可以重复读取;(即多个读端读取一个写端,读取的内容相同,与fifo不同,取决于读取的数据)。

"====================进程间的通信(IPC)================================================================================================"
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: