c++ - GCC 使用 `memory_order_seq_cst` 跨负载重新排序。这是允许的吗？-6ren

c++ - GCC 使用 `memory_order_seq_cst` 跨负载重新排序。这是允许的吗？

转载作者：可可西里更新时间：2023-11-01 16:14:27

25

4

使用基本的简化版本 seqlock , gcc 将非原子负载重新排序到原子 load(memory_order_seq_cst)使用 -O3 编译代码时.当使用其他优化级别编译或使用 clang 编译时(即使在 O3 上)也不会观察到这种重新排序。这种重新排序似乎违反了应该建立的同步关系，我很想知道为什么 gcc 重新排序这个特定的负载，以及标准是否允许这样做。

考虑以下 load功能:

auto load()
{
    std::size_t copy;
    std::size_t seq0 = 0, seq1 = 0;
    do
    {
        seq0 = seq_.load();
        copy = value;
        seq1 = seq_.load();
    } while( seq0 & 1 || seq0 != seq1);

    std::cout << "Observed: " << seq0 << '\n';
    return copy;
}

在 seqlock 过程之后，这个读取器旋转直到它能够加载 seq_ 的两个实例。 , 定义为 std::atomic<std::size_t> ，它们是偶数(表示作者当前未写入)和相等(表示作者尚未在 value 的两次加载之间写入 seq_)。此外，因为这些负载被标记为 memory_order_seq_cst (作为默认参数)，我会想象指令 copy = value;将在每次迭代中执行，因为它不能在初始加载期间重新排序，也不能在后者之下重新排序。

然而，generated assembly从 value 发出负载在第一次从 seq_ 加载之前甚至在循环之外执行。这可能导致不正确的同步或撕裂读取 value seqlock 算法无法解决的问题。此外，我注意到这仅在 sizeof(value) 时发生。小于 123 字节。修改 value某种类型 >= 123 字节会产生正确的程序集，并在 seq_ 的两次加载之间的每次循环迭代中加载.这个看似任意的阈值决定生成哪个程序集有什么原因吗？

This test harness暴露了我的 Xeon E3-1505M 上的行为，其中“Observed: 2”将从阅读器打印出来，并返回值 65535。 seq_ 的观测值组合和来自 value 的返回负载似乎违反了作者线程发布应建立的同步关系 seq.store(2)与 memory_order_release和读者线程阅读seq_与 memory_order_seq_cst .

gcc 重新排序负载是否有效，如果是，为什么它只在 sizeof(value) 时才这样做？ < 123？ clang，无论优化级别还是 sizeof(value)不会重新排序负载。我相信 Clang 的代码生成是合适且正确的方法。

最佳答案

恭喜，我认为您在 gcc 中遇到了错误!

现在我认为你可以做出合理的论证，因为 other answer是的，您显示的原始代码可能可能已经被 gcc 以这种方式正确优化了通过依赖一个关于无条件访问 value 的相当模糊的论点: 本质上你不能一直依赖负载之间的同步关系 seq0 = seq_.load();以及随后读取的 value ，所以在“其他地方”阅读它不应该改变无竞争程序的语义。我实际上不确定这个论点，但这是我从减少代码中得到的一个“更简单”的案例:

#include <atomic>
#include <iostream>

std::atomic<std::size_t> seq_;
std::size_t value;

auto load()
{
    std::size_t copy;
    std::size_t seq0;
    do
    {
        seq0 = seq_.load();
        if (!seq0) continue;
        copy = value;
        seq0 = seq_.load();
    } while (!seq0);

    return copy;
}

这不是 seqlock或任何东西 - 它只是等待 seq0从零变为非零，然后读取 value . seq_的二读和while一样是多余的条件，但如果没有它们，错误就会消失。

现在这是众所周知的习语的读取端，它确实有效并且没有竞争:一个线程写入 value , 然后设置 seq0发布商店非零。线程调用 load查看非零存储，并与之同步，这样就可以安全地读取 value .当然，你不能一直写信给value ，这是“一次性”初始化，但这是一种常见模式。

通过上面的代码，gcc是still hoisting the read of value :

load():
        mov     rax, QWORD PTR value[rip]
.L2:
        mov     rdx, QWORD PTR seq_[rip]
        test    rdx, rdx
        je      .L2
        mov     rdx, QWORD PTR seq_[rip]
        test    rdx, rdx
        je      .L2
        rep ret

糟糕!

此行为出现在 gcc 7.3 之前，但不会出现在 8.1 中。您的代码也可以在 8.1 中按照您的意愿进行编译:

    mov     rbx, QWORD PTR seq_[rip]
    mov     rbp, QWORD PTR value[rip]
    mov     rax, QWORD PTR seq_[rip]

关于c++ - GCC 使用 `memory_order_seq_cst` 跨负载重新排序。这是允许的吗？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/36958372/

25

4

0

文章推荐： c++ - 别名模板、偏特化和无效参数类型 void

文章推荐： hadoop - 使用正则表达式的配置单元查询

文章推荐： hadoop - 将参数从 coordinator.xml 传递到 workflow.xml oozie

文章推荐： c++ - 调用 std::set::find 时避免 const_cast

gcc - Conda gcc 不会取代系统 gcc
我正在尝试在 Conda 环境中编译一些代码，在那里我之前安装的编译包gcc_linux-64 . 然而，即使在停用和重新激活环境之后，gcc还在/usr/bin/gcc . 我该怎么做才能让 Co
python - GCC 插件、GCC Melt 或 gcc Python 插件来编写 gcc 扩展
关闭。这个问题是opinion-based .它目前不接受答案。想要改进这个问题？更新问题，以便 editing this post 可以用事实和引用来回答它. 关闭 7 年前。 Improve
gcc - 动态链接 gcc
这其实是两个问题: 1 - 在我的 debian amd64 系统上，我似乎无法构建与 gmp/mpfr/mpc 动态链接的交叉 GCC。即使我删除 --disable-shared，它也总是静态链接
gcc - gcc 链接器如何获取函数的大小？
研究ELF格式的结果，可以看到目标文件中有一个符号对应每个函数，对应的符号表项的值为st_size，表示大小的功能。问题是，即使我更改了目标文件中特定函数的 st_size 并链接了它，但可执行文件
gcc - GCC 风格行指令的格式
海湾合作委员会的 documentation for #line directives说他们是这样的: #line "myfile.cpp" 123 但是当我用 g++ 5.1 检查输出时，它们实际上
gcc - as + gcc vs gcc 仅用于 ARM 汇编
我正在使用 as 和 gcc 来汇编和创建 ARM 汇编程序的可执行文件，正如 this 所推荐的那样教程，如下: 给定一个汇编源文件，program.s，我运行: as -o program.o p
gcc - 转换为长长 (GCC)
long long x; double n; x=long long(n); 这不起作用。什么是正确的方法？最佳答案显而易见的: x = (long long) n; 关于gcc - 转换为长长
gcc - gcc 原子内置函数的头文件
我想知道用于 gcc 的原子内置函数的头文件是什么？我想使用这 2 个函数为我当前创建的线程库实现互斥锁。 bool __sync_bool_compare_and_swap (type *ptr,
gcc - GCC 的通行证和调用的程序是什么？
它出现在 another question :gcc调用的程序和部件是什么？ (特别是在编译 C 或 C++ 时)以便有人可以设计一些拦截和更改流程的方案以用于各种自定义编码目的？最佳答案编译器二
gcc - 如何像汇编程序一样使用 gcc？
可能吗？我想使用 gcc喜欢 assembler并在将其编译为 ubuntu 上的可执行文件后。我尝试过这个: gcc a.asm -o out.o 来自 out.o文件编译成.out可执行文件。
gcc - gcc 程序集输出标签是什么意思？
我写了一个简单的 C 程序 test.c : #include #include int add(int a, int b); int main() { int i=5,j=10;
gcc - gcc 中是否有针对八进制文字的警告？
即。所以如果你使用任何八进制文字，它会给你一个警告。微软编译器的同样问题。如果没有，是否有任何其他工具可以检测八进制文字。 (vim 似乎有一个很酷的技巧，它突出了第一个领先的将不同的颜色归零，但
gcc - gcc 中的函数级链接
我在旧线程中搜索。但没有找到任何线程回答我的问题。 gcc 是否像 vc++ 一样支持函数级链接？如果是，我应该提供什么选项来链接目标文件和库？最佳答案看起来 gcc 不直接支持函数级链接。您可
gcc - GCC 如何运行它的其他程序？
也许标题并没有把问题说得那么准确:我知道当我运行 gcc foo.c 时，GCC 会调用其他为它完成所有工作的子程序，从而生成主 gcc 程序只是一个界面。但这究竟是如何完成的呢？它是否使用syst
gcc - gcc 使用什么算法将通过函数指针的调用转换为直接调用？
我听说最近版本的 gcc 非常擅长将通过函数指针的调用转换为直接调用。但是，我在网上或快速浏览 gcc 的源代码上找不到任何关于它的信息。有谁知道这是否真的是真的，如果是这样，它使用什么算法来做到这一
gcc - gcc 链接器映射文件的用途是什么？
gcc/g++ 链接器选项“-Map”生成的“.map”文件用于什么？以及如何阅读它们？最佳答案我建议为您投入生产的任何软件生成一个映射文件并保留一份副本。它可用于破译崩溃报告。根据系统的不同
gcc - gcc -march选项的默认设置是什么？
gcc信息文件在有关x86-64特定标志的部分中说其他事情： There is no `-march=generic' option because `-march' ind
gcc - gcc 链接器选项可以更改已编译二进制文件中的汇编器指令吗？
我想知道 gcc 链接器选项(例如:-Wl,options)是否可以更改编译后的可执行文件中的汇编指令，因为如果您使用某些 gcc 优化选项会发生这种情况？当您比较编译后的二进制文件(例如比较签名)
gcc - GCC#pragma停止编译
是否有GCC编译指示会停止，暂停或中止编译过程？我正在使用gcc 4.1，但也希望在gcc 3.x版本上也可以使用该编译指示。最佳答案您可能需要#error: edd@ron:/tmp$ g++
gcc - gcc -ggdb 和 gcc -g 有什么区别
当我使用gcc编译C程序时我通常使用 -g 将一些调试信息放入 elf 文件中这样 gdb 就可以在需要时帮助我。但是，我注意到有些程序使用 -ggdb，因为它应该使调试信息对 gdb 更加友好。

首页

博学

6Ren·AI

商城

c++ - GCC 使用 `memory_order_seq_cst` 跨负载重新排序。这是允许的吗？