您的位置:首页 > 其它

C异常处理机制:setjmp和longjmp

2015-01-16 16:18 281 查看
setjmp()和longjum()是通过操纵过程活动记录实现的。它是C语言所独有的。它们部分你不了C语言有限的转移能力。这个两个函数协同工作,如下所示:

*setjmp(jmp_buf j)必须首先被调用。它表示“使用变量j记录现在的位置。函数返回零。”

*longjmp(jmp_buf j,int i)可以接着被调用。它表示“回到j所记录的位置,让它看上去像是从原来的setjmp()函数返回一样。但是函数返回i,使代码知道它实际上是通过longjmp()返回的。“坳口不?

*当使用longjmp()时,j的内容被销毁。

setjmp保存了一份程序的计数器和当前的栈顶指针。如果喜欢也可以保存一些初始值。longjmp恢复这些值,有效的转移控制并把状态重置回保存状态 的时候。这被称做“展开堆栈(unwinding stack)",因为你从堆栈中展开过程活动记录,直到取得保存在其中的值。尽管longjmp会导致转移,但它和goto又有不同,区别如下:

*goto语句不能跳出C语言当前的函数(这也是“longjmp”取名的由来,它可以跳的很远,甚至可以跳到其他文件的函数中)。

*用longjmp只能跳回到曾经到过的地方。在setjmp的地方仍留有一个过程活动记录。从这个角度讲,longjmp更像是“从何处阿里(come from)“而不是”往哪里去(go to)”。longjmp接受一个额外的整型参数并返回它的值,这可以知道是由longjmp转移到这里的还是从上条语句执行后自然而然来的这里的。

下面的代码显示了setjmp()和longjmp()一例。

输出结果如下:

first time throught

in banana()

back in main

需要注意的地方是:保证局部变量在longjmp过程中一直保持它的值的唯一可靠方法是把它声明为volatile(这使用于那些值在setjmp执行和longjmp返回之间会改变的变量)

setjmp/longjmp最大的用途是错误恢复。只要还没有从函数中返回,一旦发现一个不可恢复的错误,可以把控制转移到主输入循环,并从那里重新开 始。有些人使用setjmp/longjmp从一串无数的函数调用中立即返回。还有些人用它们防范潜在的危险代码。

setjmp/longjmp在C++中演变为更普通的异常处理机制"catch"和"throw"。

/article/6020818.html

哇塞,C语言有try catch吗?当然没有。倒。。可能有人说了,那你野鬼说没有的东西做什么。

这里需要重申一下,所谓正向设计下问题检测的开发方法。正向设计时,在错误检测和问题修复的方法是指:

根据源码分析,在源码中加插检测代码的方式,验证对代码的理解和预判是否正确。

而反向跟踪是根据机器执行动作,反向理解逻辑的运行状态,例如GDB。两者很多方面都很像,但存在一个最主要的区别在于,你是在先验的让程序运行判断是否符合先验,还是在程序的运行中理解代码的逻辑。
例如正向设计的问题判断,如果通过try catch来处理,则表示你已经估计到这里是个潜在可能的错误,而通过运行来验证你的判断是否成立。错误的理解和判断是在对源码的分析上,反之,通过GDB或者其他IDE加断点的跟踪,属于反向检测运行状态来判断逻辑可能哪里出错。

可惜try catch在C标准里面并没有。这里,就通过指针访问的段错误,来设计一个类似try catch的小玩意。希望新手能通过这个写出其他的try catch。

首先我们要动点C标准里,signal和setjmp的东西,以及GNU C的 glibc函数sigsetjmp,siglongjmp。记得要注意哪些是标准里的,哪些不是,这对以后的平台移植很用作用,哪怕你不移植,但万一别人要移植,因为你没有区分好,导致别人到处找和平台相关的代码,最后这个代码别人用不了,你的代码又有何价值。

先说一下signal这个函数。这函数的作用就是类似对中断向量表的重载,其实是个重定位工作。中断向量表是什么意思,很简单,就是有一个表,表里面有一堆函数地址,如果对应的中断发生了,就跳转到该中断对应的中断向量表的对应存储区域的函数里(希望看这句话你别跟着念,眼睛也别花,哈)。如果不重定位这些函数,则会启用默认的函数。例如给打印个消息,然后让进程停止。如果通过signal
对这个中断向量表进行”重载“,则可以进入你指定的函数。而不会进入默认的方式。

简单举例吧,正常的程序,你在bash上执行 ctrl+C,会让程序停止。实际是怎么发生的呢?

1、键盘发现你按键了,则会发出一个信号,除了按键值本身。该信号是告诉CPU,我有事了,CPU的硬件如果不对这个信号视而不见的话,就会告诉OS,哦,有个硬中断发生。

2、此时,OS就对应的发出个软中断,linux下就是 SIGINT。

3、如果对应你当前进程的自己的”中断向量表“是默认情况,则会OS启动一个函数,这个函数会发出一个kill的工作,要求将你这个进程结束。

4、OS此时发现这个动作。就把你的进程给卡擦了。

而你如果用signal“重载”这个中断,则此时原先默认函数不会执行,你会发现,你的程序该做什么还是做什么,除非你的新函数仍然要求kill掉你这个进程。

那么对于段错误,也存在一个中断,是由谁产生的? MMU,硬件产生的。OS获取这个错误之后,就会到对应进程的“中断向量表”找你是否重载过这个对应的中断响应函数,当然这中间还有些其他工作比如中断屏蔽方面的检查工作等,我就不展开了。由此,如果你写了一个新的函数,则可以不用退出,可以处理些自己的想做的事情。

但是很讨厌的一个问题,如果是你的进程出错,而且出错的理由是对一个不正确的内存空间进行读写操作,无论你执行多少次,这个错误仍然存在。因为你的代码产生个由MMU发出的段错误的中断,此时你的代码被强行挂起来,就是说现在轮不到你玩了,然后OS处理对应的中断响应,就是你写的代码,而写的那个函数执行完毕后,如果不kill或者其他动作,你的代码还会被再次执行。那么你的进程会怎么执行呢?在你上次错的地方继续执行。。。。这就郁闷大发了。因为再次产生个错误,此时又会进入你的中断响应函数。

于是乎,你会发现,你的屏幕在不停的打印东西,如果你的那个函数内有条printf想提醒你,进入了这个函数了。

此时,我们就需要动点手段了。这里要谈一下setjmp ,和longjmp,最终会用到sigsetjmp,siglongjmp,注意,这两玩意不是C标准的,glibc支持,其他的一些C环境也支持,我不一一列出来了。可以查资料。

先说setjmp, longjmp。上下文这个词在OS里,特别进程管理部分经常提到,什么意思呢?简单说就是现场环境,不过只是CPU里面的,包括指令的位置(其实也是在寄存器里),常规寄存器里的内容(也包括堆栈指针寄存器),和外部存储器就是内存没有关系。

继续举例吧。

假设,剧场正在上演一个话剧,还没结束呢。结果通知,立刻清场,为什么,领导要来开会,你别问为什么,领导就是领导,优先级高,此时你怎么办,那就和观众商量一下,我们把现场记录下来,台词说哪也记录下来,等领导开完会咱们接着看,此时剧场的情况清点记录完毕,并清理干净,等领导开会,会开完了,再根据被打断时的场景进行恢复,则此时观众可以连贯的继续看下去。

另一个例子就是香港的赌王片,赌到高潮的时候,无论是正方的叛徒还是反方的卧底,无论是用刀还是用枪,反正把男一号给搞伤了,怎么办?封牌局,拿个罩子,把桌子罩起来,谁也别想改动这些牌的内容。等男二号上时在继续赌,牌是什么情况,肯定没有变过,无论中间穿插了多少其他镜头。假设刚好这个时候有跑龙套的要用桌子吃午饭,剧组同意了,把桌子给他用,但是桌子上面的东西则原封不动的挪到别的地方。等男二号来,再把跑龙套的赶走,恢复成前面的牌局。

这里剧场场景的记录并切换成领导的会议桌,以及桌子上的牌局挪动,让给跑龙套的吃午饭,都是叫做上下文切换。setjmp的作用就是保存当前进入setjmp函数时的环境。同时setjmp返回个值为0。以区别longjmp跳转到当前位置。类似函数调用函数,父函数需要保存的现场工作,否则子函数退出时,父函数也没办法正常继续工作啊。是不是。当然
setjmp所保存的东西必函数调用时保存的要多一些。其实setjmp没什么特色。我自己都写过对应汇编以实现特定硬件上的需求。就是一堆mov,把寄存器的值存到指定的位置再返回0。

而longjmp的意思是,可以在你的代码任意的位置,只要setjmp执行过以后的地方,直接跳,跳哪呢?就是跳到setjmp调用时的位置,这个跳哪的信息从哪得来的,就是setjmp的参数指向的一个BUF,你在这个BUF里面保存了当前地址。因此,如果多次setjmp同一个buf,则在跳到最后一次,如果每次setjmp了不同的BUF,那么哪个BUF作为longjmp的参数,就是跳到对应setjmp的位置。此时等同于setjmp被返回,只不过返回值不为0,由此判断是longjmp过来的。继续举例子。

导演说,第N个镜头。。。然后就开始演,演了一半,穿帮了,导演说,停!此时就是longjmp,longjmp去哪?和你演的这段都没关系。直接到当前这个镜头的开始位置,为什么当前镜头可以拍N多次,就是因为你在镜头开始位置做了一个setjmp。

现在说下sigsetjmp siglongjmp。

sigsetjmp ,siglongjmp比setjmp ,longjmp的组合多了个中断屏蔽信息的存储。此时siglongjmp可以恢复到sigsetjmp出现时的中断屏蔽情况。在后面给出的代码的test10函数中,特地做了一个setjmp ,longjmp的方式,你会发现,第二次出错,并不会进入normal_longjmp函数。因此此时的中断配置等信息并没有对应记录下来,属于出错后的情况。

OK。现在说说setjmp longjmp有什么好处。

前面说了。signal对SIGSEGV这个中断的响应函数修改后,函数退出,会再次执行MMU发生错误的代码位置,因此我们要确保函数跳过当前出错的位置,执行到我们希望跳过的代码。类似C++的try catch那样,我们希望有try catch。如下

char *p = "1234";

TRY

p[2] = '1';//这显然是错的嘛

CATCH ;//

则我们可以

?
OK了,为什么这样就可以了呢?因为如果不是longjmp过来的,setjmp始终返回0,则此时必然会执行p[2],如果p[2]不会产生SIGSEGV的错误,就不会执行longjmp,由此一切照旧,该做什么做什么。如果p[2] = '1'错误,则会发出中断信号 SIGSEGV,而假设我们把 下面SIGNAL_SEGV_DONE这个函数先前用
signal重载过,则此时发生的错误,会导致进入 SIGNAL_SEGV_DONE。如下

?
注意这里第2个参数是返回的值,就是跳转到setjmp的位置,等同于setjmp返回的值,此时等于上面if的条件不成立,则等于跳出了{}。

而如果新手还是想不同,这个1怎么就被返回到setjmp的地方,而且像函数返回一样呢?我就说两个事情。

1、函数的返回值是放在指定寄存器里的,比如ARM是放在r0里的,子函数把要return的值放在r0 里,返回父函数,则父函数对子函数的返回值直接可以从r0里取得(或者不取,如果不存在返回,或者暂时不需要利用这个函数的返回值)

2、一个函数调用另一个函数,没什么深奥的技巧。就是在返回时把寄存器,包括指令寄存器等等恢复成调用前的情况。唯一是指令寄存器还要再加一下,跳过函数调用的那条指令,然后一个跳转,就回到父函数了。

下面给出代码,我是基于malloc_free上面进行的添加,你可以对比第九部分的代码差异。需要非常明确注意的以下几点

1、这里使用的方式,并不完全等同C++的TRY CATCH.但是机理是一样的。和GDB里面的断点中断也是一样的,只不过后者使用了SEGTRAP 这个中断信号

2、signal在注册函数时只需要一次,你别傻傻的如我的DEMO一样,放在检测的函数里。

3、我这里是为了尽可能只用头文件,所以用了static jmp_buf SIGSEGV_buf;做成全局变量也没有关系。

4、如下,对SIGSEGV_BEGIN 和 SIGSEGV_END的使用一定要加宏判断。我暂时没有想到比较好的解决方案,能把两个宏之间的代码描述能自动预编译剔除掉。

?
以上代码,等同于

?
test8是一个不进行中断函数注册的例子,你会发现什么事情都没有发生,和以前一样,因为没注册嘛。

test9是个标准的处理方案。

test10,说过了,让你区分longjmp,setjmp 和siglongjmp sigsetjmp的区别。

你可以通过执行

bin/test_malloc_free_main 10

的方式调用test10,其他雷同,如下是代码清单。

malloc_free.h

?
malloc_free.c没有任何变化

一下是test_malloc_free_main.c的清单

?
希望新手不要怀疑,为什么我刚学习C,就得碰longjmp和信号方面的知识。没办法啊,本来想先说IPC的,进程之间的通信,采用socket。但是如果你尝试write一个内容,而对应管道实际已经被关闭,会导致你的write 对应的进程自动退出。上面这些方法不用,我们很难继续下去。

新手你就准备开始多读读计算机组成原理,和操作系统的知识吧。谁让你没事找事要学C呢?活该!!!我没别的话可说了。
http://www.oschina.net/question/249672_50022
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: