gpt4 book ai didi

c++ - 我如何从 strace 输出中确定我的程序的哪一部分未能获得互斥锁

转载 作者:塔克拉玛干 更新时间:2023-11-03 01:27:21 40 4
gpt4 key购买 nike

我正在使用嵌入式 Linux 系统(3.12.something),我们的应用程序在经过一段随机时间后开始占用 CPU。我在我们的应用程序上运行了 strace,当问题发生时,我在 strace 输出中看到了很多与此类似的行:

[48530666] futex(0x485f78b8, FUTEX_WAIT_PRIVATE, 2, NULL) = -1 EAGAIN (Resource temporarily unavailable) <0.009002>

我很确定这就是我正在寻找的确凿证据,并且有某种形式的比赛。但是,我现在需要弄清楚如何识别代码中试图获取此互斥锁的位置。我怎样才能做到这一点?我们的代码是用 GCC 编译的,里面有调试符号。

我目前的想法(我还没有尝试过)是在尝试获取我们系统中的任何互斥量之前打印出一个字符串到标准输出并刷新,期望该字符串将在 strace 提示获取锁 ... 但是代码中有很多地方必须像这样进行检测。

编辑:我刚刚意识到的另一件奇怪的事情是,我们的程序不会开始占用 CPU,直到它运行后经过了某个随机时间(5 分钟到 5 小时以及介于两者之间的任何时间)。在那段时间里,发生了 futex 系统调用。他们为什么突然开始?从我读过的内容来看,我认为也许它们在用户空间中被正确使用,直到出现故障并回退到进行 futex() 系统调用...

有什么建议吗?

最佳答案

如果您永久且经常从不同的线程短时间锁定互斥锁,例如一个保护全局记录器,你可能会导致所谓的线程护航。直到两个线程竞争锁时,问题才会发生。第一个获得锁并持有它一小段时间,然后,当它第二次需要锁时,它被抢占,因为第二个已经在等待。第二个做同样的事情。每个线程可用的时间片突然减少到两次锁定尝试之间的时间,导致许多上下文切换和相应的减速。此外,除一个线程外,所有线程始终阻塞在互斥量上,从而有效地禁用任何并行执行。

为了解决这个问题,让你的线程合作而不是竞争资源。对于上面的记录器示例,请考虑例如条目的无锁队列或使用线程本地存储的每个线程的单独队列。

关于 futex() 调用,其想法是轮询一个原子标志,并在一些轮换后使用实际的操作系统互斥体。原子标志无需在用户空间和内核空间之间进行昂贵的切换即可使用。对于较长的中断,使用内核抢占(使用 futex())避免通过轮询阻塞 CPU。这解释了为什么程序在正常运行时不需要任何 futex() 调用。

关于c++ - 我如何从 strace 输出中确定我的程序的哪一部分未能获得互斥锁,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32747152/

40 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com