您的位置:首页 > 运维架构 > Linux

Linux0.11内核--进程的调度schedule和switch_to解析

2014-07-30 14:47 393 查看
Linux0.11内核--进程的调度

Linux任务切换代码(switch_to)详解

linux0.11中switch_to理解

前言

在我学习进程调度的时候,是通过这三篇文章把这个问题搞明白的。所以这里贴

在一起,方便查看。第一篇主要是将进程的调度,可认为是个总体讲述,里面共

涉及两个函数schedule()和switch_to()这篇把schedule()注释的比较清楚,但

switch_to()我没太明白;第二篇和第三篇都是详解switch_to()的,其实第三篇是

讲的最清楚,我是看到这篇明白的,但是第二篇里面的几个图可以帮助理解几个

重要的概念,所以也贴了下来。

第一篇 进程的调度

进程的调度

linux系统中,一个进程有5种可能状态,在sched.c第19行处定义了状态的标识:

#define TASK_RUNNING 0
// 正在运行或可被运行状态

#define TASK_INTERRUPTIBLE 1
// 可被中断睡眠状态

#define TASK_UNINTERRUPTIBLE 2
// 不可中断睡眠状态

#define TASK_ZOMBIE 3
// 僵死状态

#define TASK_STOPPED 4
// 停止状态

各种状态的转换图如下:



就绪态和运行态之间的转换

当前占用CPU的进程调只有用了schedule()函数后,才可能会从运行态进入就绪态。Schedule()函数按照一定的选择策略选中处于TASK_RUNNING态(包括用户运行态,内核运行态和就绪态)的某个进程,然后切换到该进程去执行。这时被选中的进程进入运行态,开始使用CPU资源。被选中的进程可能是刚刚调用schedule()函数的进程,也可能是其他进程。

schedule()函数在3种情况下会被调用

用户态时发生了时钟中断;

系统调用时相应的sys_XXXX函数返回后;

睡眠函数内;

第一种情况发生在用户态。当时钟中断产生时,如果进程运行在用户态时并且时间片用完,中断处理函数do_timer()会调用schedule()函数,这相当于用户态的运行被抢断了。如果进程处在内核态时发生时钟中断,do_timer()不会调用schedule()函数,也就是内核态是不能被抢断的。当一个进程运行在内核态,除非它自愿调用schedule()函数而放弃CPU的使用权,它将永远占用CPU。由于schedule()不是系统调用,用户程序不能调用,所以在时钟中断中调用schedule()是必要的,这样保证用户态的程序不会独占CPU。

第二种情况就是为了对付运行在内核态的进程。应用程序一般通过系统调用进入内核态,因此linux 0.11在系统调用处理函数(sys_XXXX())结束后,int 0x80处理函数会检查当前进程的时间片和状态,如果时间片用完或状态不是TASK_RUNNING,会调用schedule()函数。这时相当于内核态进程主动放弃对对CPU的占用。由此可见,如果某个系统调用处理函数或者中断异常处理函数永远不退出,比如进入死循环或者等待其他资源,整个系统死锁,任何进程都无法运行。

比较前两种情况,我们看到linux有保证用户态的程序不独占CPU的机制,却不能保证内核态程序不独占CPU。这也反映了系统级别开发和用户级别开发的不同之处。系统程序员需要考虑更多的问题。

第三种情况在下面一节运行态(包括就绪态)和睡眠态之间的转换中讨论。当进程等待的资源还不可用时,它进入睡眠态,并且调用schedule()让出CPU。

switch_to() sched.h 173行)

[b][cpp] view
plaincopy[/b]

/****************************************************************************/

/* 功能:切换到任务号(即task[]数组下标)为n的任务 */

/* 参数:n 任务号 */

/* 返回:(无) */

/****************************************************************************/

// 整个宏定义利用ljmp指令跳转到TSS段选择符来实现任务切换

#define switch_to(n) {/

// __tmp用来构造ljmp的操作数。该操作数由4字节偏移和2字节选择符组成。当选择符

// 是TSS选择符时,指令忽略4字节偏移。

// __tmp.a存放的是偏移,__tmp.b的低2字节存放TSS选择符。高两字节为0。

// ljmp跳转到TSS段选择符会造成任务切换到TSS选择符对应的进程。

// ljmp指令格式是 ljmp 16位段选择符:32位偏移,但如果操作数在内存中,顺序正好相反。

// %0 内存地址 __tmp.a的地址,用来放偏移

// %1 内存地址 __tmp.b的地址,用来放TSS选择符

// %2 edx 任务号为n的TSS选择符

// %3 ecx task


struct {long a,b;} __tmp; /

__asm__("cmpl %%ecx,current/n/t" / // 如果要切换的任务是当前任务

"je 1f/n/t" / // 直接退出

"movw %%dx,%1/n/t" / // 把TSS选择符放入__tmp.b中

"xchgl %%ecx,current/n/t" / // 让current指向新进程的task_struct

"ljmp *%0/n/t" / // 任务切换在这里发生,CPU会搞定一切

"cmpl %%ecx,last_task_used_math/n/t" / // 除进程第一次被调度外,以后进程从就绪

// 态返回运行态后,都从这里开始运行。因

// 而返回到的是内核运行态。

"jne 1f/n/t" /

"clts/n" /

"1:" /

::"m" (*&__tmp.a),"m" (*&__tmp.b), /

"d" (_TSS(n)),"c" ((long) task
)); /


}

[b]schedule()(sched.c 第104行)[/b]



[b][cpp] view
plaincopy[/b]

[b]/****************************************************************************/ [/b]

[b]/* 功能:进程调度。 */ [/b]

[b]/* 先对alarm和信号进行处理,如果某个进程处于可中断睡眠状态,并且收 */ [/b]

[b]/* 到信号,则把进程状态改成可运行。之后在处可运行状态的进程中挑选一个 */ [/b]

[b]/* 并用switch_to()切换到那个进程 */ [/b]

[b]/* 参数:(无) */ [/b]

[b]/* 返回:(无) */ [/b]

[b]/****************************************************************************/ [/b]

[b]void schedule(void) [/b]

[b]{ [/b]

[b] int i,next,c; [/b]

[b] struct task_struct ** p; [/b]

[b]/* check alarm, wake up any interruptible tasks that have got a signal */ [/b]

[b]// 首先处理alarm信号,唤醒所有收到信号的可中断睡眠进程 [/b]

[b] for(p = &LAST_TASK ; p > &FIRST_TASK ; --p) [/b]

[b] if (*p) { [/b]

[b] // 如果进程设置了alarm,并且alarm已经到时间了 [/b]

[b] if ((*p)->alarm && (*p)->alarm < jiffies) { [/b]

[b] // 向该进程发送SIGALRM信号 [/b]

[b] (*p)->signal |= (1<<(SIGALRM-1)); [/b]

[b] (*p)->alarm = 0; // 清除alarm [/b]

[b] } [/b]

[b]//可屏蔽信号位图BLOCKABLE定义在sched.c第24行,(~(_S(SIGKILL) | _S(SIGSTOP))) [/b]

[b]// 说明SIGKILL和SIGSTOP是不能被屏蔽的。 [/b]

[b]// 可屏蔽信号位图 & 当前进程屏蔽的信号位图 = 当前进程实际屏蔽的信号位图 [/b]

[b]// 当前进程收到的信号位图 & ~当前进程实际屏蔽的信号位图 [/b]

[b]// = 当前进程收到的允许相应的信号位图 [/b]

[b]// 如果当前进程收到允许相应的信号,并且当前进程处于可中断睡眠态 [/b]

[b]// 则把状态改成运行态,参与下面的选择过程 [/b]

[b] if (((*p)->signal & ~(_BLOCKABLE & (*p)->blocked)) && [/b]

[b] (*p)->state==TASK_INTERRUPTIBLE) [/b]

[b] (*p)->state=TASK_RUNNING; [/b]

[b] } [/b]

[b]/* this is the scheduler proper: */ [/b]

[b]// 下面是进程调度的主要部分 [/b]

[b] while (1) { [/b]

[b] c = -1; [/b]

[b] next = 0; [/b]

[b] i = NR_TASKS; [/b]

[b] p = &task[NR_TASKS]; [/b]

[b] while (--i) { // 遍历整个task[]数组 [/b]

[b] if (!*--p) // 跳过task[]中的空项 [/b]

[b] continue; [/b]

[b] // 寻找剩余时间片最长的可运行进程, [/b]

[b]// c记录目前找到的最长时间片 [/b]

[b]// next记录目前最长时间片进程的任务号 [/b]

[b] if ((*p)->state == TASK_RUNNING && (*p)->counter > c) [/b]

[b] c = (*p)->counter, next = i; [/b]

[b] } [/b]

[b] // 如果有进程时间片没有用完c一定大于0。这时退出循环,执行 switch_to任务切换 [/b]

[b] if (c) break; [/b]

[b] // 到这里说明所有可运行进程的时间片都用完了,则利用任务优先级重新分配时间片。 [/b]

[b] // 这里需要重新设置所有任务的时间片,而不光是可运行任务的时间片。 [/b]

[b] // 利用公式:counter = counter/2 + priority [/b]

[b] for(p = &LAST_TASK ; p > &FIRST_TASK ; --p) [/b]

[b] if (*p) [/b]

[b] (*p)->counter = ((*p)->counter >> 1) + [/b]

[b] (*p)->priority; [/b]

[b] // 整个设置时间片过程结束后,重新进入进程选择过程 [/b]

[b] } [/b]

[b] // 当的上面的循环退出时,说明找到了可以切换的任务 [/b]

[b] switch_to(next); [/b]

[b]} [/b]

当前进程只有调用了schedule()后才能发生进程切换,因此当进程再次被选中执行后,都是从switch_to()中ljmp后一条语句开始执行,即从"cmpl %%ecx,last_task_used_math/n/t"语句继续,这时进程位于内核态。因此进程从就绪态进入的都是内核运行态。但有一个例外,进程产生后第一次被调度执行。

fork()产生的子进程会把父进程原cs、原eip当作初始的cs、eip,所以子进程刚刚创建时处于用户态。第一次进程被调度时,从就绪态进入的是用户运行态。以后进入的都是内核运行态。

第二篇 Switch_to解析

最近看linux0.11源码时,看到任务切换函数switch_to,感觉很晦涩,于是在网上查了一些资料,现在终于有些眉目,特记录于此,以方便大家参考,有什么错误或不足之处,还请大家指出~


switch_to源码

/*

* switch_to(n) should switch tasks to task nr n, first

* checking that n isn't the current task, in which case it does nothing.

* This also clears the TS-flag if the task we switched to has used

* tha math co-processor latest.

*/

#define switch_to(n) {\

struct {long a,b;} __tmp; \

__asm__("cmpl %%ecx,_current\n\t" \

"je 1f\n\t" \

"movw %%dx,%1\n\t" \

"xchgl %%ecx,_current\n\t" \

"ljmp %0\n\t" \

"cmpl %%ecx,_last_task_used_math\n\t" \

"jne 1f\n\t" \

"clts\n" \

"1:" \

::"m" (*&__tmp.a),"m" (*&__tmp.b), \

"d" (_TSS(n)),"c" ((long) task
)); \

}

大部分代码都很容易看懂,主要是:判断当前任务是否是要切换的任务,是则跳到标号1,即不做任何事;交换;调整等。。。

这里重点强调_TSS(n) 和ljmp %0;

(2)_TSS(n),作用是生成TSS的段选择符

#define FIRST_TSS_ENTRY 4

#define _TSS(n) ((((unsigned long) n)<<4)+(FIRST_TSS_ENTRY<<3))

当通过以上两个代码是不足以明白_TSS(n)的机制,需要结合以下知识;



上图描述linux内核中GDT的布局;0-nul, 1-cs, 2-ds, 3-syscall, 4-TSS0, 5-LDT0, 6-TSS1 等。。。



上图是段选择符,TI=0表示在GDT(全局描述符表)中,1表示在LDT(局部描述符表)中,RPL表示优先级;描述符索引就是在GDT中的索引;

通过上面两张图,下面分析代码,从图1可以看出第一个TSS位于索引为4的位置,于是#define FIRST_TSS_ENTRY 4;而FIRST_TSS_ENTRY<<3表示左移3位,因为TI和RPL总共占3为;((unsigned long) n)<<4为什么要左移4位呢?从图1可以看出TSS索引都是偶数,于是TI(1位)+RPL(2位)+偶数位(1)=4;通过上述组合就可以得到TSS选择子;

()ljmp %0或(ljmp *%0)

首先是为什么要加*?这是gas语法,表示绝对跳转(与C中的*是不同的),若程序没有加*,则编译器会自己加上*,可以在linux中测试;

ljmp用法说明:(很重要)

按AS手册,ljmp指令存在两种形式,即:

一、直接操作数跳转,此时操作数即为目标逻辑地址(选择子,偏移),即形如:ljmp $seg_selector, $offset的方式;

二、使用内存操作数,这时候,AS手册规定,内存操作数必须用“*”作前缀,即形如:ljmp *mem48,其中内存位置mem48处存放目标逻辑地址: 高16bit存放的是seg_selector,低32bit存放的是offset。注意:这条指令里的“*”只是表示间接跳转的意思,与C语言里的“*”作用完全不同。

回到源码上,ljmp %0用的ljmp的第二种用法,“ljmp *%0”这条语句展开后相当于“ljmp *__tmp.a”,也就是跳转到地址&__tmp.a中包含的48bit逻辑地址处。而按struct _tmp的定义,这也就意味着__tmp.a即为该逻辑地址的offset部分,__tmp.b的低16bit为seg_selector(高16bit无用)部分。由于在"ljmp %0"之前,"movw %%dx,%1"这条语句已经把状态段选择子"__TSS(n)"的值赋给了__tmp.b的低16bit。至于为什么要用*&__tmp.a,目前还不清楚,其实*&__tmp.a和__tmp.a是一样的,通过汇编也可以看出;这里就先不用关心它了;

通过以上说明,可以知道了ljmp将跳转到选择子指定的地方,大致过程是,ljmp判断选择子为TSS类型,于是就告诉硬件要切换任务,硬件首先它要将当前的PC,esp,eax等现场信息保存在当前自己的TSS段描述符中,然后再将目标TSS段描述符中的pc,esp,eax的值拷贝至对应的寄存器中.当这些过程全部做完以后内核就实现了内核的切换;可以参考下图:



总结:

通过以上内容,可以大致了解到任务切换的流程,switch_to中关键是ljmp %0;

第三篇 switch _to详解

Copyright 2009 (c) benzus

以下代码来自Linux-1.0内核 include/linux/sched.h 文件。

(注意到Linux 0.11版的内核基本上也同样是这段代码,所以本文也同样适用于0.11内核)

01 #define switch_to(n) { /

02 struct (long a,b;} __tmp; /

03 __asm__("cmpl %%ecx,current /n/t" /

04 "je 1f/n/t" /

05 "xchgl %%ecx, current/n/t" /

06 "movw %%dx, %1/n/t" /

07 "ljmp *%0/n/t" /

08 "cmpl %%ecx, %2/n/t" /

09 "jne 1f/n/t" /

10 "clts/n" /

11 "1:" /

12 ::"m" (*&__tmp.a), "m" (*&__tmp.b), /

13 "m" (last_task_used_math),"d" _TSS(n), "c" ((long) task
)); /

14 }

注释:这是一个嵌入式汇编宏,作用是从当前任务切换到任务n,在进程调度程序中被调用。下面我来逐行注释它。

第2行定义了一个结构,包含2个long类型整数。

第3行将task
与current比较,其中task
是要切换到的任务,current是当前任务;

第4行说明,如果要切换到的任务是当前任务,则跳到标号1,即结束,什么也不做,否则继续执行下面的代码。

第5行交换两个操作数的值,相当于C代码的:current = task
,ecx = 被切换出去的任务(原任务);

第6行将新任务的TSS选择符赋值给 __tmp.b;

第7行是理解任务切换机制的关键。长跳转至 *&tmp,造成任务的切换。AT&T语法的ljmp相当于Intel语法的 jmp far SECTION : OFFSET,在这里就是将(IP)<-__tmp.a,(CS)<-__tmp.b,它的绝对地址之前加星号("*")。当段间指令jmp所含指针的选择符指示一个可用任务状态段的TSS描述符时,将造成任务切换。那么CPU怎么识别描述符是TSS描述符而不是其他描述符呢?这是因为所有描述符(一个描述符是64位)中都有4位用来指示该描述符的类型,如描述符类型值是9或11都表示该描述符是TSS描述符。好了,CPU得到TSS描述符后,就会将其加载到任务寄存器TR中,然后根据TSS描述符的信息(主要是基址)找到任务的tss内容(包括所有的寄存器信息,如eip),根据其内容就可以开始新任务的运行。我们暂且把这个恢复所有寄存器状态的过程称为恢复寄存器现场。

第8~10行是判断原任务上次是否使用过协处理器,若是,则清除寄存器CR0的TS标志。
第2个难点是:在第7行执行后,完成任务切换(即切换到新的任务里执行);当任务切换回来后才会继续执行第8行!下面详解其原因。
既然任务切换时CPU会恢复寄存器现场,那么它当然也会保存寄存器现场了。这些寄存器现场都会被写入原任务的tss结构里,值得注意的是,EIP会指向引起任务切换指令(第7行)的下一条指令(第8行),所以,很明显,当原任务有朝一日再次被调度运行时,它将从EIP所指的地方(第8行)开始运行。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: