您的位置:首页 > 大数据 > 人工智能

多线程下慎用sigwait

2016-08-16 14:47 323 查看
本文的copyleft归gfree.wind@gmail.com所有,使用GPL发布,可以自由拷贝,转载。但转载请保持文档的完整性,注明原作者及原链接,严禁用于任何商业用途。

作者:gfree.wind@gmail.com

博客:linuxfocus.blog.chinaunix.net      

今天帮助同事调试一个问题,最终确定是在多线程下使用sigwait引发的。

该线程大致流程如下:

void thread(void *data)

{

    int wait_sig = *(int*)data;

    sigset_t sigset;

    sigemptyset(&sigset);

    sigaddset(&sigset, wait_ig);

    

    while (1) {

        int signal;

        if (0 != sigwait(&sigset, &signal)) {

            break;

        }

    }

}

出现的问题是这个断言失败,也就是说sigwait失败了。后来打印出sigwait的返回值,发现sigwait的失败的原因时EINTR,也就说 sigwait被一个信号中断了,但是不知道信号来自何处。说到此处,先说明一下,sigwait这个函数很奇怪,跟一般的linux API不同。sigwait出错的时候,并不设置errno,而直接把errno错误值返回。

通过增加一个新的判断 

int ret = sigwait(&sigset, &signal));

if (EINTR == ret) {

    continue;

}

else if (ret) {

    break;

}

毕竟sigwait作为一个阻塞操作,因为收到信号而失败,是可以接受的行为,所以要对EINTR进行特殊处理。

加上这一句后,发现原来在另外一个线程有一个非法内存错误,所以产生了一个SIGSEGV信号。到此,虽然这个问题是由于这个内存问题引起的,但是实际上从这个问题的现象上看,在多线程下使用sigwait容易引起一些问题。

1.在POSIX标准中,当进程收到信号时,如果是多线程的情况,我们是无法确定是哪一个线程处理这个信号。而sigwait是从进程中pending的信号中,取走指定的信号。这样的话,如果要确保sigwait这个线程收到该信号,那么所有线程含主线程以及这个sigwait线程则必须block住这个信号。否则如果在两次sigwait之间,收到了指定信号,该信号很有可能被任意一个线程处理掉。

2.sigwait的名字以及在man中的介绍容易引起人的误解。

1)sigwait,从名字上看只等待指定信号集。这样很容易让人感觉除指定信号外,其他信号不会促使sigwait的返回;

2)来看看man中的说明The sigwait() function suspends execution of the calling thread until the delivery of one of the signals specified in the signal set set.这里也说了,sigwait会一直suspend直到指定信号发生。另外,man中的errors说明也容易引起误解。man中只有一个错误,就是EINVAL,给人感觉sigwait不会被信号中断。

ERRORS

       EINVAL set contains an invalid signal number.

(我的系统是FC12)

但是按照我一直以来的经验,基本上所有的阻塞操作都会被信号中断,除非设置了RESTART标志。所有我建议同事加了以上的代码。

后来看到man中还有这么一句,

NOTES

       sigwait() is implemented using sigtimedwait(2).

于是又查看了sigtimedwait。发现sigtimedwait的手册还是比较完整的。

ERRORS

       EAGAIN No signal in set was delivered within the timeout period specified to sigtimedwait().

       EINTR  The wait was interrupted by a signal handler; see signal(7).  (This handler was for a signal other than one of those in set.)

       EINVAL timeout was invalid.

其实这次的代码是一个开源工具的代码,它使用信号机制作为多线程的通讯工具。个人感觉这种实现并不合适。因为在它的代码中,并没有在所有的线程中屏蔽掉需要sigwait的信号,另外该工具会产生多个线程,每个线程需要sigwait的信号是不同的。按照上面的代码,实际上它只是通过sigwait等到相应的信号来唤醒该线程,那么还不如使用pthread_cond_wait来代替sigwait呢。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: