lock-free - 自旋锁总是需要内存屏障吗？在内存屏障上旋转是否昂贵？-6ren

lock-free - 自旋锁总是需要内存屏障吗？在内存屏障上旋转是否昂贵？

转载作者：行者123 更新时间：2023-12-04 04:19:06

54

4

我写了一些无锁代码，可以在本地正常工作
读取，在大多数情况下。

本地旋转内存读取是否一定意味着我
必须始终在旋转之前插入内存屏障
读？

(为了验证这一点，我设法制作了一个阅读器/作者
导致读者永远看不到的组合
书面值(value)，在某些非常具体的情况下
条件——专用 CPU，附加到 CPU 的进程，
优化器一直向上，没有其他工作完成
循环——所以箭头确实指向那个方向，但我不是
完全确定通过内存旋转的成本
屏障。)

如果旋转通过内存屏障的成本是多少
缓存的存储缓冲区中没有要刷新的内容？
即，所有过程正在做(在C中)是

while ( 1 ) {
    __sync_synchronize();
    v = value;
    if ( v != 0 ) {
        ... something ...
    }
}

我是否正确假设它是免费的并且不会妨碍
有任何流量的内存总线？

另一种说法是问:内存屏障是否有用
除了:刷新存储缓冲区，应用
对其无效，并阻止编译器
重新排序其位置的读/写？

反汇编， __sync_synchronize() 似乎转化为:

lock orl

来自英特尔手册(对于新手来说同样模糊):

Volume 3A: System Programming Guide, Part 1 --   8.1.2

Bus Locking

Intel 64 and IA-32 processors provide a LOCK# signal that
is asserted automatically during certain critical memory
operations to lock the system bus or equivalent link.
While this output signal is asserted, requests from other
processors or bus agents for control of the bus are
blocked.

[...]

For the P6 and more recent processor families, if the
memory area being accessed is cached internally in the
processor, the LOCK# signal is generally not asserted;
instead, locking is only applied to the processor’s caches
(see Section 8.1.4, “Effects of a LOCK Operation on
Internal Processor Caches”).

我的翻译:“当你说 LOCK 时，这会很贵，但我们是
只在必要时才这样做。”

@BlankXavier:

我确实测试过，如果写入器没有明确地从存储缓冲区中推出写入并且它是该 CPU 上运行的唯一进程，那么读者可能永远看不到写入器的效果(我可以使用测试程序重现它，但是正如我上面提到的，它只发生在特定的测试中，具有特定的编译选项和专用的核心分配——我的算法工作正常，只有当我对它的工作原理感到好奇并编写了我意识到它可能具有的显式测试时一个问题在路上)。

我认为默认情况下简单的写入是 WB 写入(回写)，这意味着它们不会立即被刷新，但读取将采用它们的最新值(我认为他们称之为“存储转发”)。所以我为作者使用了 CAS 指令。我在 Intel 手册中发现了所有这些不同类型的写入实现(UC、WC、WT、WB、WP)，Intel vol 3A 第 11-10 章，仍在学习它们。

我的不确定性在于读者方面:我从 McKenney 的论文中了解到，还有一个失效队列，一个从总线到缓存的传入失效队列。我不确定这部分是如何工作的。特别是，您似乎暗示循环通过正常读取(即，非锁定，没有障碍，并且仅使用 volatile 以确保优化器在编译后离开读取)每次都会检查“无效队列” (如果存在这样的事情)。如果简单的读取还不够好(即可以读取仍然有效的旧缓存行等待排队的失效(这听起来对我来说也有点不连贯，但是失效队列如何工作呢？))，那么原子读取将是必要的，我的问题是:在这种情况下，这会对公共(public)汽车有什么影响吗？ (我认为可能不会。)

我仍在阅读英特尔手册，虽然我看到了关于存储转发的精彩讨论，但我还没有找到关于失效队列的很好讨论。我决定将我的 C 代码转换为 ASM 并进行实验，我认为这是真正了解其工作原理的最佳方式。

最佳答案

“xchg reg,[mem]”指令将通过内核的 LOCK 引脚指示其锁定意图。该信号穿过其他内核并缓存到总线主控总线(PCI变体等)，总线主控总线将完成它们正在做的事情，最终LOCKA(确认)引脚将向CPU发出xchg可能完成的信号。然后 LOCK 信号关闭。此序列可能需要很长时间(数百个 CPU 周期或更多)才能完成。之后，其他内核的相应缓存行将失效，您将拥有一个已知状态，即已在内核之间同步的状态。

xchg 指令是实现原子锁所必需的。如果锁本身是成功的，您就可以访问您已定义锁以控制访问的资源。这样的资源可以是内存区域、文件、设备、功能或您拥有的任何东西。尽管如此，程序员始终可以编写代码在该资源被锁定时使用它，而在它没有被锁定时不使用它。通常，成功锁定后的代码序列应尽可能短，以便尽可能少地阻碍其他代码获取对资源的访问。

请记住，如果锁定不成功，您需要通过发出新的 xchg 重试。

“无锁”是一个吸引人的概念，但它需要消除共享资源。如果您的应用程序有两个或多个内核同时读取和写入公共(public)内存地址，则“无锁”不是一种选择。

关于lock-free - 自旋锁总是需要内存屏障吗？在内存屏障上旋转是否昂贵？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/6810733/

54

4

0

文章推荐： wpf - 任务栏上的新实例中键单击/shift+单击

文章推荐： pygame - 如何将多首歌曲/轨道加载到 pygame 中？

文章推荐： c# - 尝试将 .net 核心项目从 2.2 迁移到 3.1

C Free Memory 使用 free
这个问题在这里已经有了答案: How do free and malloc work in C? (8 个答案) 关闭 8 年前。如果你使用malloc()为4个整数分配内存，它不应该返回第一个整
c - 除了调用 free() 之外，有没有办法确定指针是否可以传递给 free()？
首先，介绍一下背景知识，这样您就不会认为我在尝试做一些疯狂的事情: 我正在尝试调试由其他人编写的 C 库中的崩溃。崩溃看起来像这样: TheProgram(44365,0x7fff75996310)
c++ - 在仍然使用 cstdlib free 的同时在类中定义自定义 free()
我正在 cstdlib malloc() 和 free() 函数之上创建自定义内存分配器(出于性能原因)。分配器位于一个简单的类中，该类存储一些内存缓冲区和其他参数。我想将释放内存的方法命名为 fre
computer-science - Context Free 语言的一个子集是 Context Free？
我一直在解决这个练习，我不知道从哪里开始: 语言 B 是上下文无关的；语言 C 是 B 的子集:C 是否是上下文无关的？证明或反驳。我试过使用闭包属性: C = B - ( (A* - C) ∩ B
c++ - 如何检查 free() 中的 diabolical wild free ？
关闭。此题需要details or clarity 。目前不接受答案。想要改进这个问题吗？通过 editing this post 添加详细信息并澄清问题. 已关闭 8 年前。 Improve th
python - 属性错误: free when taking ownership or freeing cdata
如果我想获得在 C 中进行 malloc 的指针的所有权，则 docs for the Python cffi package和 this answer假设使用 ffi.gc 和 lib.free 作
c - 这个错误是什么意思 : "free(): double free detected in tcache 2"
#include #include struct node { int value; struct node* next; }; typedef struct node node_
java - 如何确定我的 JDK11 版本是 "free"还是 "non-free"？
众所周知，Oracle 在 Java 11 中更改了 Java 许可证，要求 JDK 的商业用途需要付费许可证。然而，使用 OpenJDK 仍然是免费的。我的 PC 上有一个 JDK 11 文件夹，
linux - 我的服务器的总内存与 USED + FREE 内存不匹配。我正在使用 linux free 命令
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。这个问题似乎不是关于 a specific programming problem, a softwar
c - 从 : malloc/free/malloc/free 的设计模式中获取与 malloc 相关的错误
我是 C 的新手，在 Linux 中使用带有开关 gcc -g -std=c89 -Wall ... 的 gcc4.4.6 进行编程，我在许多函数深处遇到了这个错误我的程序名为 compute: **
multithreading - 用于非阻塞多线程同步的 Lock-Free、Wait-Free 和 Wait-freedom 算法
在多线程编程中，我们可以找到两个或多个线程/任务之间的数据传输同步的不同术语。什么时候我们可以说某个算法是: 1)Lock-Free 2)Wait-Free 3)Wait-Freedom 我明白无锁
c - 执行 free() 时出错，显示 "glibc detected double free or corruption"
我正在尝试使用我通过 malloc() 手动分配的数组来运行程序。我在程序末尾释放()这个数组，但我不断收到错误消息 *** glibc detector *** ./test: double fre
C++，libxslt : Freeing the stylesheet document after freeing the style sheet results in crash
我将 libxml2 与 libxslt 一起用于 C++ 程序的 XML 处理。为了使用 XSL 转换 XML 文档，我使用了以下函数(删除了错误处理): xmlDocPtr transformXm
c++ - new/delete/free store 和 malloc/free/heap 组合
new/delete 关键字使用免费商店 malloc/free 关键字是使用堆我看到某处写着new 使用malloc。怎么会这样？它们不在内存段中使用？其次，我看到某处写道我们不能在new 之后
c++ - 错误在 `main' : free(): invalid pointer (though no free or delete used)
我有这个简单的代码，我想在 tutorialspoint.com 上运行 #include using namespace std; class Vehicle { string vehic
C - 链表 : free() function is deleting my head node; how do I use free() correctly?
我需要创建一个函数来删除 c 中链表的前 n 个节点，并返回删除的节点数。如果列表小于 n，它应该变为空。另外，我不能使用递归。使用现在的代码，它可以工作，但我没有释放“已删除”节点的内存。如果我
c - 帮助 malloc 和 free : Glibc detected: free(): invalid pointer
我需要调试这段代码的帮助。我知道问题出在 malloc 和 free 中，但找不到确切的位置、原因和解决方法。请不要回答:“使用 gdb”，仅此而已。我会使用 gdb 来调试它，但我仍然不太了解它并且
c++ - C++ : why does free not accept a const void*, 中的 malloc/free 有更好的方法吗？
这个问题在这里已经有了答案: Unable to free const pointers in C (12 个答案) 关闭 8 年前。将 C++11 代码连接到某些 C 回调，我必须传递 cons
c - free 不会删除分配给指针(int 数组)的内存，使用 free 两次有效，为什么？
这是出于好奇，我试图找到我对之前问题的疑问的答案，但他们似乎没有答案。所以在这里问，我只是写了一个代码，我试图将内存分配给一个 int 指针(以填充一个数组)并将 int 值扫描到它。完成数组后，我想
haskell - 在 Haskell 中，我如何将一个 Free monad 嵌入到另一个 Free monad 中？
我有两个免费的单子(monad)，用于不同上下文中的不同操作。但是，如果特定操作位于上下文中，则一个(主要)DSL 需要包含另一个(action)DSL: import Control.Monad.F

首页

博学

6Ren·AI

商城

lock-free - 自旋锁总是需要内存屏障吗？在内存屏障上旋转是否昂贵？