gpt4 book ai didi

c++ - 加载或存储可以在有条件之前重新排序吗?

转载 作者:塔克拉玛干 更新时间:2023-11-03 01:58:43 25 4
gpt4 key购买 nike

std::atomic_uint64_t writing_ {0};
std::atomic_uint64_t reading_ {0};
std::array<type, size> storage_ {};

bool try_enqueue(type t) noexcept
{
const std::uint64_t writing {
writing_.load(std::memory_order::memory_order_relaxed)};
const auto last_read {reading_.load(std::memory_order::memory_order_relaxed)};
if (writing - last_read < size) {
storage_.at(writing & (size - 1)) = t;
writing_.store(writing + 1, std::memory_order::memory_order_release);

return true;
}
else
return false;
}

在上面的代码中,据我了解,如果条件评估为假,则任何线程都不可能观察到对共享存储的写入。一个操作不能被认为是在它排序之后的条件之前发生的,这是否正确?还是我完全误读了这一点,这样的事情实际上可能会发生(可能通过推测执行?)?

更具体一点,处理器是否可以推测性地执行写入(当条件最终评估为 false 时),另一个线程观察到写入已经发生,然后然后第一个线程丢弃推测性的写?

(注意:这是单生产者单消费者)

最佳答案

Is it correct that an operation cannot be perceived as having occurred before a conditional it is sequenced after?

C++ 编译器绝对不允许发明写入atomic(或volatile)对象。

编译器甚至不允许发明对非原子对象的写入(例如,将条件写入转换为读取 + cmov + 写入),因为 C++11 引入了一种内存模型,该模型明确定义了两个线程运行同时编写这样的代码,只要其中最多一个 实际上 写入(然后读取顺序)。但是两个非原子 RMW 可能会相互踩踏,所以不要“好像”C++ 抽象机正在运行源代码一样工作,因此编译器发出执行此操作的 asm 不是一个选项。

但如果编译器知道一个对象总是被写入,它几乎可以做任何它想做的事,因为合法的程序无法观察到差异:这将涉及数据争用 UB。


A little more specifically, could the processor speculatively execute the write (when the condition will eventually evaluate to false), another thread observe the write as having occurred, and then the first thread discarding the speculative write?

不,推测无法逃脱进行推测的核心。否则,当检测到错误推测时,所有核心都必须回滚其状态!

这是存在存储缓冲区的主要原因之一:将存储的 OoO 推测执行提交解耦到 L1d 缓存(这是存储变得全局可见时到其他核心)。并将执行与缓存未命中存储分离,这甚至在有序的非推测 CPU 上也很有用。

直到存储指令从无序核心退出(即已知是非推测性的)之后,存储才提交给 L1d。尚未提交的退役存储有时被称为“已毕业”,以将它们与其他存储缓冲区条目区分开来,如果核心需要回滚到退役状态,这些条目可能会被丢弃。

这允许硬件推测执行而无需发明写入。

(另请参阅 Can a speculatively executed CPU branch contain opcodes that access RAM? 以获取更多详细信息。有趣的事实:一些 CPU,特别是 PowerPC,可以在同一物理内核上的 SMT 线程之间执行分级存储的存储转发,使存储在某些内核成为 globally 可见。但仅限于分级商店,否则可能的错误猜测可能会泄露。)


在 C++ 中,std::mo_release 存储强制编译器使用足够的屏障或发布存储指令(例如,x86 上的普通 mov 是发布存储,或 AArch64 上的 STLr 是顺序发布存储)。或者任何其他机制来确保 asm 保证运行时排序至少与 C++ 抽象机保证一样强。

C++ 根据前序/后序而非障碍来定义其标准,但在任何给定的平台实现上/ABI 对从 std::atomic 操作到 asm 序列的某些映射进行了标准化。 (例如 https://www.cl.cam.ac.uk/~pes20/cpp/cpp0xmappings.html)

关于c++ - 加载或存储可以在有条件之前重新排序吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57937532/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com