gpt4 book ai didi

c - 如何在 Linux 应用程序中触发虚假唤醒?

转载 作者:IT王子 更新时间:2023-10-29 00:01:29 25 4
gpt4 key购买 nike

一些背景:

我有一个依赖第三方硬件和闭源驱动程序的应用程序。该驱动程序目前存在一个错误,该错误会导致设备在一段随机时间后停止响应。这是由驱动程序中明显的死锁引起的,并中断了我的应用程序的正常运行,该应用程序处于 24/7 全天候高度可见的环境中。

我发现,将 GDB 附加到进程,并立即从进程中分离 GDB 会导致设备恢复功能。这是我第一次表明驱动程序本身存在线程锁定问题。有某种竞争条件会导致死锁。附加 GDB 显然会导致一些线程重新洗牌,并可能将它们推出等待状态,导致它们重新评估它们的条件,从而打破僵局。

问题:

我的问题很简单:是否有一个干净的等待应用程序触发程序内的所有线程中断它们的等待状态?绝对有效的一件事(至少在我的实现中)是发送一个 SIGSTOP,然后立即发送来自另一个进程(即来自 bash)的 SIGCONT:

kill -19 `cat /var/run/mypidfile` ; kill -18 `cat /var/run/mypidfile`

这会触发流程中的虚假唤醒,一切都会恢复生机。

我希望有一种智能方法可以触发进程中所有线程的虚假唤醒。考虑 pthread_cond_broadcast(...) 但无法访问正在等待的实际条件变量。

这是可能的,还是依赖像 kill 这样的程序是我唯一的方法?

最佳答案

您现在的做法可能是最正确、最简单的。内核中没有“唤醒给定进程中所有等待的 futexes”操作,这是您更直接地实现此目的所需要的。

请注意,如果唤醒失败“死锁”在 pthread_cond_wait 中,但用信号中断它会打破死锁,则该错误不可能在应用程序中;它实际上必须在 pthread 条件变量的实现中。 glibc 在其条件变量实现中有已知的未修复错误;见http://sourceware.org/bugzilla/show_bug.cgi?id=13165以及相关的错误报告。然而,你可能已经找到了一个新的,因为我不认为现有的已知的可以通过用信号打破 futex 等待来修复。如果您可以将此错误报告给 glibc 错误跟踪器,那将非常有帮助。

关于c - 如何在 Linux 应用程序中触发虚假唤醒?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14047227/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com