您的位置:首页 > 运维架构 > Linux

Linux嵌入式 -- 内核 - 进程控制 和 调度

2013-08-10 22:33 351 查看
1. 进程四要素

1. 有一段程序供其执行。这段程序不一定是某个进程所专有,可以与其他进程共用。

2. 有进程专用的内核空间堆栈

3. 在内核中有一个task_struct数据结构,即通常所说的“进程控制块PCB”。有了这个数据结构,进程才能成为内核调度的一个基本单位接受内核的调度。

4. 有独立的用户空间



2. struct task_struct 进程描述

在Linux中,线程、进程都使用struct task_struct来表示,它包含了大量描述进程/线程的信息,其中比较重要的有(task_struct 结构成员):

pid_t pid; 进程号,最大值10亿,
用户进程 用户线程 内核线程 都有
!!

volatile long state /* 进程状态 */ (三态: 就绪,执行,阻塞)

1. TASK_RUNNING 进程正在被CPU执行,或者已经准备就绪,随时可以执行。当一个进程刚被创建时,就处于TASK_RUNNING状态。 (执行,就绪)

2. TASK_INTERRUPTIBLE 处于等待中的进程,待等待条件为真时被唤醒,也可以被信号或者中断唤醒。 (阻塞,可唤醒)

3. TASK_UNINTERRUPTIBLE 处于等待中的进程,待资源有效时唤醒,但不可以由其它进程通过信号(signal)或中断唤醒。(阻塞,不可唤醒)

4. TASK_STOPPED 进程中止执行。当接收到SIGSTOP和SIGTSTP等信号时,进程进入该状态,接收到SIGCONT信号后,进程重新回到TASK_RUNNING。(阻塞)

5. TASK_KILLABLE Linux2.6.25新引入的进程睡眠状态,原理类似于TASK_UNINTERRUPTIBLE,但是可以被致命信号(SIGKILL)唤醒

6. TASK_TRACED 正处于被调试状态的进程。(例如GDB调试)

7. TASK_DEAD 进程退出时(调用do_exit),state字段被设置为该状态。

int exit_state /*进程退出时的状态*/

EXIT_ZOMBIE(僵死进程) 表示进程的执行被终止,但是父进程还没有发布waitpid()系统调用来收集有关死亡的进程的信息。

EXIT_DEAD(僵死撤销状态) 表示进程的最终状态。父进程已经使用wait4()或waitpid()系统调用来收集了信息,因此进程将由系统删除。

struct mm_struct *mm 进程用户空间描述指针,内核线程该指针为空。

unsignedint policy该进程的调度策略。

int prio 优先级,相当于 2.4 中 goodness() 的计算结果,在0--(MAX_PRIO-1) 之间取值(MAX_PRIO 定义为 140),其中0—(MAX_RT_PRIO-1) (MAX_RT_PRIO 定义为100)属于实时进程范围,MAX_RT_PRIO-MX_PRIO-1 属于非实时进程。数值越大,表示进程优先级越小

int static_prio 静态优先级,与 2.4 的 nice 值意义相同。nice 值仍沿用 Linux 的传统,在 -20 到 19 之间变动,数值越大,进程的优先级越小。nice 是用户可维护的,但仅影响非实时进程的优先级。进程初始时间片的大小仅决定于进程的静态优先级,这一点不论是实时进程还是非实时进程都一样,不过实时进程的static_prio
不参与优先级计算。nice 与static_prio 的关系如下:static_prio = MAX_RT_PRIO+ nice+ 20内核定义了两个宏用来完成这一转换:PRIO_TO_NICE()、NICE_TO_PRIO

structsched_rt_entity rtrt->time_slice时间片,进程的缺省时间片与进程的静态优先级(在 2.4 中是 nice 值)相关,使用如下公式得出:MIN_TIMESLICE + ((MAX_TIMESLICE - MIN_TIMESLICE) * (MAX_PRIO-1 - (p)->static_prio)/
(MAX_USER_PRIO-1))内核将 100-139 的优先级映射到200ms-10ms 的时间片上去,优先级数值越大,则分配的时间片越小



在Linux中用current指针指向当前正在运行的进程的task_struct。

3. 进程创建与销毁





4. 进程调度

什么是调度?从就绪的进程中选出最适合的一个来执行。 1、调度策略2、调度时机3、调度步骤

调度策略 和一个进程对应起来

SCHED_NORMAL(SCHED_OTHER): 普通的分时进程

SCHED_BATCH:批处理进程

SCHED_IDLE: 只在系统空闲时才能够被调度执行的进程

SCHED_FIFO :先入先出的实时进程

SCHED_RR:时间片轮转的实时进程

调度类 (所有的实时调度类 都比 CFS 的优先级高)

调度类的引入增强了内核调度程序的可扩展性,这些类(调度程序模块)封装了调度策略,并将调度策略模块化。

CFS 调度类(在 kernel/sched_fair.c 中实现)用于以下调度策略:SCHED_NORMAL、SCHED_BATCH 和 SCHED_IDLE。

实时调度类(在 kernel/sched_rt.c 中实现)用于SCHED_RR 和 SCHED_FIFO 策略。

调度时机
调度什么时候发生?即:schedule()函数什么时候被调用?

调度的发生有两种方式:

1、主动式

在内核中直接调用schedule()。当进程需要等待资源等而暂时停止运行时,会把状态置于挂起(睡眠),并主动请求调度,让出CPU。

主动放弃cpu例: 1. current->state = TASK_INTERRUPTIBLE;
2. schedule();

2、被动式(抢占用户抢占(Linux2.4、Linux2.6)
内核抢占(Linux2.6
)

用户抢占发生在:从系统调用返回用户空间 或 从中断处理程序返回用户空间。内核即将返回用户空间的时候,如果need_resched标志被设置,会导致schedule()被调用,此时就会发生用户抢占。

内核抢占

在不支持内核抢占的系统中,进程/线程一旦运行于内核空间,就可以一直执行,直到它主动放弃或时间片耗尽为止。这样一些非常紧急的进程或线程将长时间得不到运行。

在支持内核抢占的系统中,更高优先级的进程/线程可以抢占正在内核空间运行的低优先级进程/线程。

在支持内核抢占的系统中,某些特例下是不允许内核抢占的:

内核正进行中断处理。进程调度函数schedule()会对此作出判断,如果是在中断中调用,会打印出错信息。

内核正在进行中断上下文的Bottom Half(中断的底半部)处理。硬件中断返回前会执行软中断,此时仍然处于中断上下文中

进程正持有spinlock自旋锁、writelock/readlock读写锁等,当持有这些锁时,不应该被抢占,否则由于抢占将导致其他CPU长期不能获得锁而死等。

内核正在执行调度程序Scheduler。抢占的原因就是为了进行新的调度,没有理由将调度程序抢占掉再运行调度程序。

为保证Linux内核在以上情况下不会被抢占,抢占式内核使用了一个变量preempt_count,称为内核抢占计数。这一变量被设置在进程的thread_info结构中。每当内核要进入以上几种状态时,变量preempt_count就加1,指示内核不允许抢占。每当内核从以上几种状态退出时,变量preempt_count就减1,同时进行可抢占的判断与调度。

内核抢占可能发生在:

中断处理程序完成,返回内核空间之前。

当内核代码再一次具有可抢占性的时候,如解锁及使能软中断等。

调度标志 TIF_NEED_RESCHED

作用:内核提供了一个need_resched标志来表明是否需要重新执行一次调度

设置:当某个进程耗尽它的时间片时,会设置这个标志;当一个优先级更高的进程进入可执行状态的时候,也会设置这个标志。

调度步骤

Schedule函数工作流程如下:

1). 清理当前运行中的进程;

2). 选择下一个要运行的进程;(pick_next_task 分析)

3). 设置新进程的运行环境;

4). 进程上下文切换 。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: