gpt4 book ai didi

linux - 当将信号量减为零的进程崩溃时,如何恢复信号量?

转载 作者:IT老高 更新时间:2023-10-28 12:35:51 39 4
gpt4 key购买 nike

我有多个使用 g++ 编译的应用程序,在 Ubuntu 中运行。我正在使用命名信号量来协调不同进程。

在以下情况下一切正常除了:如果其中一个进程调用 sem_wait()sem_timedwait() 来减少信号量然后在它有机会调用 sem_post() 之前崩溃或被杀死 -9,然后从那一刻起,命名的信号量“不可用”。

我所说的“不可用”是指信号量计数现在为零,并且应该将其增加到 1 的进程已经死亡或被杀死。

我找不到一个 sem_*() API,它可能会告诉我上次递减它的进程已经崩溃。

我是否在某处缺少 API?

这是我打开命名信号量的方法:

sem_t *sem = sem_open( "/testing",
O_CREAT | // create the semaphore if it does not already exist
O_CLOEXEC , // close on execute
S_IRWXU | // permissions: user
S_IRWXG | // permissions: group
S_IRWXO , // permissions: other
1 ); // initial value of the semaphore

这是我如何减少它:

struct timespec timeout = { 0, 0 };
clock_gettime( CLOCK_REALTIME, &timeout );
timeout.tv_sec += 5;

if ( sem_timedwait( sem, &timeout ) )
{
throw "timeout while waiting for semaphore";
}

最佳答案

事实证明,没有办法可靠地恢复信号量。当然,任何人都可以 post_sem() 到指定的信号量以使计数再次增加到零以上,但是如何判断何时需要进行此类恢复呢?提供的 API 过于有限,无法以任何方式表明何时发生这种情况。

注意也可用的 ipc 工具——常用工具 ipcmkipcrmipcs 仅适用于过时的 SysV 信号量。它们特别不适用于新的 POSIX 信号量。

但看起来还有其他东西可以用来锁定东西,当应用程序以无法在信号处理程序中捕获的方式死机时,操作系统会自动释放这些东西。两个示例:绑定(bind)到特定端口的监听套接字,或锁定特定文件。

我认为锁定文件是我需要的解决方案。因此,我使用的不是 sem_wait()sem_post() 调用:

lockf( fd, F_LOCK, 0 )

lockf( fd, F_ULOCK, 0 )

当应用程序以任何方式退出时,文件会自动关闭,这也会释放文件锁定。然后等待“信号量”的其他客户端应用程序可以按预期自由运行。

谢谢你们的帮助,伙计们。


更新:

12 年后,我认为我应该指出 posix 互斥体确实具有“稳健”属性。这样,如果互斥锁的所有者被杀死或退出,下一个锁定互斥锁的用户将获得 EOWNERDEAD 的非错误返回值,从而可以恢复互斥锁。这将使它类似于文件和套接字锁定解决方案。查看 pthread_mutexattr_setrobust()pthread_mutex_consistent() 了解详情。感谢 Reinier Torenbeek 的提示。

关于linux - 当将信号量减为零的进程崩溃时,如何恢复信号量?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2053679/

39 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com