gpt4 book ai didi

c++ - pthread_mutex 锁是否提供比用户在代码中施加的内存屏障更高的性能

转载 作者:塔克拉玛干 更新时间:2023-11-03 06:55:33 31 4
gpt4 key购买 nike

问题背景

有问题的代码与 C++ 实现有关。我们有代码库,其中对于某些关键实现,我们使用 asm volatile ("mfence":"memory")

我对内存障碍的理解是——

问题


附言:

  • 在我们的代码中,asm volatile ("mfence":"memory") 的使用是在 10-15 行 c++ 代码(成员函数)之后使用的。所以我怀疑 - 可能是内存同步的互斥实现提供了比用户实现代码中的 MB 更好的性能(w.r.t MB 范围)。

  • 我们使用的是 SUSE Linux 10、2.6.16.46、smp#1、x64_86 和四核处理器。

最佳答案

pthread 互斥量保证比内存栅栏指令慢(我不能说慢多少,这完全取决于平台)。原因很简单,因为为了兼容 posix 互斥锁,它们必须包含内存保证。 posix 互斥锁具有强大的内存保证,因此我看不出如果没有这样的栅栏*它们将如何实现。

如果您正在寻找实用的建议,我会在很多地方使用栅栏而不是互斥锁,并且经常对它们进行计时。与原始内存栅栏相比,pthread_mutex 在 Linux 上非常慢(当然,它们做的更多,所以要小心你实际比较的内容)。

但是请注意,某些原子操作,尤其是 C++11 中的原子操作,可以而且肯定会比全面使用栅栏更快。在这种情况下,编译器/库了解架构,不需要使用完整的栅栏来提供内存保证。

另请注意,我说的是锁本身的非常低级的性能。您需要分析到纳秒级别。

*可以想象一个互斥系统忽略某些类型的内存并选择更宽松的锁定实现(例如依赖正常内存的顺序保证和忽略特殊标记的内存)。然而,我认为这样的实现是无效的。

关于c++ - pthread_mutex 锁是否提供比用户在代码中施加的内存屏障更高的性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10383055/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com