您的位置：首页 > 其它

C异常处理机制：setjmp和longjmp

2015-01-16 16:18 281 查看

setjmp()和longjum()是通过操纵过程活动记录实现的。它是C语言所独有的。它们部分你不了C语言有限的转移能力。这个两个函数协同工作，如下所示：

*setjmp(jmp_buf j)必须首先被调用。它表示“使用变量j记录现在的位置。函数返回零。”

*longjmp(jmp_buf j,int i)可以接着被调用。它表示“回到j所记录的位置，让它看上去像是从原来的setjmp()函数返回一样。但是函数返回i，使代码知道它实际上是通过longjmp()返回的。“坳口不？

*当使用longjmp()时，j的内容被销毁。

setjmp保存了一份程序的计数器和当前的栈顶指针。如果喜欢也可以保存一些初始值。longjmp恢复这些值，有效的转移控制并把状态重置回保存状态的时候。这被称做“展开堆栈(unwinding stack)"，因为你从堆栈中展开过程活动记录，直到取得保存在其中的值。尽管longjmp会导致转移，但它和goto又有不同，区别如下：

*goto语句不能跳出C语言当前的函数（这也是“longjmp”取名的由来，它可以跳的很远，甚至可以跳到其他文件的函数中）。

*用longjmp只能跳回到曾经到过的地方。在setjmp的地方仍留有一个过程活动记录。从这个角度讲，longjmp更像是“从何处阿里（come from)“而不是”往哪里去（go to)”。longjmp接受一个额外的整型参数并返回它的值，这可以知道是由longjmp转移到这里的还是从上条语句执行后自然而然来的这里的。

下面的代码显示了setjmp()和longjmp()一例。

输出结果如下：

first time throught

in banana()

back in main

需要注意的地方是：保证局部变量在longjmp过程中一直保持它的值的唯一可靠方法是把它声明为volatile(这使用于那些值在setjmp执行和longjmp返回之间会改变的变量)

setjmp/longjmp最大的用途是错误恢复。只要还没有从函数中返回，一旦发现一个不可恢复的错误，可以把控制转移到主输入循环，并从那里重新开始。有些人使用setjmp/longjmp从一串无数的函数调用中立即返回。还有些人用它们防范潜在的危险代码。

setjmp/longjmp在C++中演变为更普通的异常处理机制"catch"和"throw"。

/article/6020818.html

哇塞，C语言有try catch吗？当然没有。倒。。可能有人说了，那你野鬼说没有的东西做什么。

这里需要重申一下，所谓正向设计下问题检测的开发方法。正向设计时，在错误检测和问题修复的方法是指：

根据源码分析，在源码中加插检测代码的方式，验证对代码的理解和预判是否正确。

而反向跟踪是根据机器执行动作，反向理解逻辑的运行状态，例如GDB。两者很多方面都很像，但存在一个最主要的区别在于，你是在先验的让程序运行判断是否符合先验，还是在程序的运行中理解代码的逻辑。
例如正向设计的问题判断，如果通过try catch来处理，则表示你已经估计到这里是个潜在可能的错误，而通过运行来验证你的判断是否成立。错误的理解和判断是在对源码的分析上，反之，通过GDB或者其他IDE加断点的跟踪，属于反向检测运行状态来判断逻辑可能哪里出错。

可惜try catch在C标准里面并没有。这里，就通过指针访问的段错误，来设计一个类似try catch的小玩意。希望新手能通过这个写出其他的try catch。

首先我们要动点C标准里，signal和setjmp的东西，以及GNU C的 glibc函数sigsetjmp,siglongjmp。记得要注意哪些是标准里的，哪些不是，这对以后的平台移植很用作用，哪怕你不移植，但万一别人要移植，因为你没有区分好，导致别人到处找和平台相关的代码，最后这个代码别人用不了，你的代码又有何价值。

先说一下signal这个函数。这函数的作用就是类似对中断向量表的重载，其实是个重定位工作。中断向量表是什么意思，很简单，就是有一个表，表里面有一堆函数地址，如果对应的中断发生了，就跳转到该中断对应的中断向量表的对应存储区域的函数里（希望看这句话你别跟着念，眼睛也别花，哈）。如果不重定位这些函数，则会启用默认的函数。例如给打印个消息，然后让进程停止。如果通过signal
对这个中断向量表进行”重载“，则可以进入你指定的函数。而不会进入默认的方式。

简单举例吧，正常的程序，你在bash上执行 ctrl+C,会让程序停止。实际是怎么发生的呢？

1、键盘发现你按键了，则会发出一个信号，除了按键值本身。该信号是告诉CPU，我有事了，CPU的硬件如果不对这个信号视而不见的话，就会告诉OS，哦，有个硬中断发生。

2、此时，OS就对应的发出个软中断,linux下就是 SIGINT。

3、如果对应你当前进程的自己的”中断向量表“是默认情况，则会OS启动一个函数，这个函数会发出一个kill的工作，要求将你这个进程结束。

4、OS此时发现这个动作。就把你的进程给卡擦了。

而你如果用signal“重载”这个中断，则此时原先默认函数不会执行，你会发现，你的程序该做什么还是做什么，除非你的新函数仍然要求kill掉你这个进程。

那么对于段错误，也存在一个中断，是由谁产生的？ MMU，硬件产生的。OS获取这个错误之后，就会到对应进程的“中断向量表”找你是否重载过这个对应的中断响应函数，当然这中间还有些其他工作比如中断屏蔽方面的检查工作等，我就不展开了。由此，如果你写了一个新的函数，则可以不用退出，可以处理些自己的想做的事情。

但是很讨厌的一个问题，如果是你的进程出错，而且出错的理由是对一个不正确的内存空间进行读写操作，无论你执行多少次，这个错误仍然存在。因为你的代码产生个由MMU发出的段错误的中断，此时你的代码被强行挂起来，就是说现在轮不到你玩了，然后OS处理对应的中断响应，就是你写的代码，而写的那个函数执行完毕后，如果不kill或者其他动作，你的代码还会被再次执行。那么你的进程会怎么执行呢？在你上次错的地方继续执行。。。。这就郁闷大发了。因为再次产生个错误，此时又会进入你的中断响应函数。

于是乎，你会发现，你的屏幕在不停的打印东西，如果你的那个函数内有条printf想提醒你，进入了这个函数了。

此时，我们就需要动点手段了。这里要谈一下setjmp ,和longjmp,最终会用到sigsetjmp,siglongjmp,注意，这两玩意不是C标准的，glibc支持，其他的一些C环境也支持，我不一一列出来了。可以查资料。

先说setjmp, longjmp。上下文这个词在OS里，特别进程管理部分经常提到，什么意思呢？简单说就是现场环境，不过只是CPU里面的，包括指令的位置（其实也是在寄存器里），常规寄存器里的内容（也包括堆栈指针寄存器），和外部存储器就是内存没有关系。

继续举例吧。

假设，剧场正在上演一个话剧，还没结束呢。结果通知，立刻清场，为什么，领导要来开会，你别问为什么，领导就是领导，优先级高，此时你怎么办，那就和观众商量一下，我们把现场记录下来，台词说哪也记录下来，等领导开完会咱们接着看，此时剧场的情况清点记录完毕，并清理干净，等领导开会，会开完了，再根据被打断时的场景进行恢复，则此时观众可以连贯的继续看下去。

另一个例子就是香港的赌王片，赌到高潮的时候，无论是正方的叛徒还是反方的卧底，无论是用刀还是用枪，反正把男一号给搞伤了，怎么办？封牌局，拿个罩子，把桌子罩起来，谁也别想改动这些牌的内容。等男二号上时在继续赌，牌是什么情况，肯定没有变过，无论中间穿插了多少其他镜头。假设刚好这个时候有跑龙套的要用桌子吃午饭，剧组同意了，把桌子给他用，但是桌子上面的东西则原封不动的挪到别的地方。等男二号来，再把跑龙套的赶走，恢复成前面的牌局。

这里剧场场景的记录并切换成领导的会议桌，以及桌子上的牌局挪动，让给跑龙套的吃午饭，都是叫做上下文切换。setjmp的作用就是保存当前进入setjmp函数时的环境。同时setjmp返回个值为0。以区别longjmp跳转到当前位置。类似函数调用函数，父函数需要保存的现场工作，否则子函数退出时，父函数也没办法正常继续工作啊。是不是。当然
setjmp所保存的东西必函数调用时保存的要多一些。其实setjmp没什么特色。我自己都写过对应汇编以实现特定硬件上的需求。就是一堆mov，把寄存器的值存到指定的位置再返回0。

而longjmp的意思是，可以在你的代码任意的位置，只要setjmp执行过以后的地方，直接跳，跳哪呢？就是跳到setjmp调用时的位置，这个跳哪的信息从哪得来的，就是setjmp的参数指向的一个BUF，你在这个BUF里面保存了当前地址。因此，如果多次setjmp同一个buf，则在跳到最后一次，如果每次setjmp了不同的BUF，那么哪个BUF作为longjmp的参数，就是跳到对应setjmp的位置。此时等同于setjmp被返回，只不过返回值不为0，由此判断是longjmp过来的。继续举例子。

导演说，第N个镜头。。。然后就开始演，演了一半，穿帮了，导演说，停！此时就是longjmp，longjmp去哪？和你演的这段都没关系。直接到当前这个镜头的开始位置，为什么当前镜头可以拍N多次，就是因为你在镜头开始位置做了一个setjmp。

现在说下sigsetjmp siglongjmp。

sigsetjmp ，siglongjmp比setjmp ,longjmp的组合多了个中断屏蔽信息的存储。此时siglongjmp可以恢复到sigsetjmp出现时的中断屏蔽情况。在后面给出的代码的test10函数中，特地做了一个setjmp ,longjmp的方式，你会发现，第二次出错，并不会进入normal_longjmp函数。因此此时的中断配置等信息并没有对应记录下来，属于出错后的情况。

OK。现在说说setjmp longjmp有什么好处。

前面说了。signal对SIGSEGV这个中断的响应函数修改后，函数退出，会再次执行MMU发生错误的代码位置，因此我们要确保函数跳过当前出错的位置，执行到我们希望跳过的代码。类似C++的try catch那样，我们希望有try catch。如下

char *p = "1234";

TRY

p[2] = '1';//这显然是错的嘛

CATCH ;//

则我们可以

?

OK了,为什么这样就可以了呢？因为如果不是longjmp过来的，setjmp始终返回0，则此时必然会执行p[2]，如果p[2]不会产生SIGSEGV的错误，就不会执行longjmp，由此一切照旧，该做什么做什么。如果p[2] = '1'错误，则会发出中断信号 SIGSEGV，而假设我们把下面SIGNAL_SEGV_DONE这个函数先前用
signal重载过，则此时发生的错误，会导致进入 SIGNAL_SEGV_DONE。如下

?

注意这里第2个参数是返回的值，就是跳转到setjmp的位置，等同于setjmp返回的值，此时等于上面if的条件不成立，则等于跳出了{}。

而如果新手还是想不同，这个1怎么就被返回到setjmp的地方，而且像函数返回一样呢？我就说两个事情。

1、函数的返回值是放在指定寄存器里的，比如ARM是放在r0里的，子函数把要return的值放在r0 里，返回父函数，则父函数对子函数的返回值直接可以从r0里取得（或者不取，如果不存在返回，或者暂时不需要利用这个函数的返回值）

2、一个函数调用另一个函数，没什么深奥的技巧。就是在返回时把寄存器，包括指令寄存器等等恢复成调用前的情况。唯一是指令寄存器还要再加一下，跳过函数调用的那条指令，然后一个跳转，就回到父函数了。

下面给出代码，我是基于malloc_free上面进行的添加，你可以对比第九部分的代码差异。需要非常明确注意的以下几点

1、这里使用的方式，并不完全等同C++的TRY CATCH.但是机理是一样的。和GDB里面的断点中断也是一样的，只不过后者使用了SEGTRAP 这个中断信号

2、signal在注册函数时只需要一次，你别傻傻的如我的DEMO一样，放在检测的函数里。

3、我这里是为了尽可能只用头文件，所以用了static jmp_buf SIGSEGV_buf;做成全局变量也没有关系。

4、如下，对SIGSEGV_BEGIN 和 SIGSEGV_END的使用一定要加宏判断。我暂时没有想到比较好的解决方案，能把两个宏之间的代码描述能自动预编译剔除掉。

?

以上代码，等同于

?

test8是一个不进行中断函数注册的例子，你会发现什么事情都没有发生，和以前一样，因为没注册嘛。

test9是个标准的处理方案。

test10,说过了，让你区分longjmp,setjmp 和siglongjmp sigsetjmp的区别。

你可以通过执行

bin/test_malloc_free_main 10

的方式调用test10，其他雷同，如下是代码清单。

malloc_free.h

?

malloc_free.c没有任何变化

一下是test_malloc_free_main.c的清单

?

希望新手不要怀疑，为什么我刚学习C，就得碰longjmp和信号方面的知识。没办法啊，本来想先说IPC的，进程之间的通信，采用socket。但是如果你尝试write一个内容，而对应管道实际已经被关闭，会导致你的write 对应的进程自动退出。上面这些方法不用，我们很难继续下去。

新手你就准备开始多读读计算机组成原理，和操作系统的知识吧。谁让你没事找事要学C呢？活该！！！我没别的话可说了。
http://www.oschina.net/question/249672_50022

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航