rust - 有没有办法绕过原子操作的成本？-6ren

rust - 有没有办法绕过原子操作的成本？

转载作者：行者123 更新时间：2023-12-03 11:36:12

26

4

我有一个计数器，目前是一个原子 u32，在我的代码的热门部分使用，它通常只增加 1。偶尔，它会从代码的一个非常不同的部分读取，但如果确实发生了，该值必须准确(至少在同一线程上)。但是，我怀疑原子性可能会对性能产生不良影响。我必须解决的一个想法是让主计数器是非原子的，但以原子方式写入第二个计数器。

原子写入比读取便宜吗？比如它不需要清除(那么多)缓存吗？

最佳答案

长话短说

如果您只有一个写入线程和一个读取线程，您所需要的只是使用带有 relaxed memory ordering or acquire/release 的原子。 .

详情

在 x86 上，它将被转换为普通的 add/mov 指令，因此不会对性能产生影响。

这是一个正常的计数器增量:

example::normal_inc:
        add     dword ptr [rip + example::normal_u32], 1
        ret

这是一个松散排序的原子计数器增量:

example::atomic_inc:
        add     dword ptr [rip + example::atomic_u32], 1
        ret

在 x86 上没有区别，因此没有性能影响。但是代码正确吗？

Relaxed loads/stores 不保证跨线程的顺序，但保证同一线程上的顺序和原子性。什么意思？

对于一个作者和一个读者的情况，这意味着如果线程 W 更新计数器，线程 R 最终将看到更改，并且该值将有效，因为保证了原子性。例如，如果计数器为 0，线程 W 将其增加到 1 和 2，则保证线程 R 最终会看到 2，而它永远不会看到 42 或一些其他的随机数。

不能保证的是这个数字将与其他原子或非原子变量对齐。假设，如果线程 W 将元素添加到列表，然后增加计数器，线程 R 可能会以相反的顺序看到这些事件，即首先增加计数器，然后一个新元素出现在列表中。

从线程 W 的角度来看，仍然可以保证的是事件的顺序。使用列表的相同示例，可以保证对于线程 W，列表元素将在计数器增加之前出现，因为所有这些更改都发生在同一线程内，而不是跨不同的线程。

由于 x86 具有非常强大的内存排序，即使是 aquire/release ordering on the atomics 仍然使用正常的 add/mov 操作。参见 memory ordering on Wikipedia .

获取/释放语义不仅保证了原子性，还保证了顺序。以列表为例，线程W 添加一个列表元素，然后释放 一个计数器。当线程 R acquires 计数器时，可以保证列表元素在那里。在 x86 上，此保证不会产生额外费用。

另请参阅上面关于 Godbolt 的示例:https://godbolt.org/z/4EsY4j

关于rust - 有没有办法绕过原子操作的成本？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/66201972/

26

4

0

文章推荐： rust - 如何在Abs中实现Abs函数以自定义类型？

文章推荐： rust - 如何使用带有异步的指示器显示总计数器栏？

c - 原子 if(A && B)?
有没有办法用连词创建原子 if ？也就是说，我可以以某种方式在 C 中自动测试 if(A && B) 吗？如果它在第一个连接处短路，那么没问题，但如果没有短路，则在检查 B 时，A 可能已更改。有什么
C - 原子 killpg
我有很多 fork 的过程。子进程做很多事情和另一个系统调用。当任何子进程从系统调用中获取错误时，它会将错误描述打印到 stderr 并将 SIGUSR1 发送到组长(主要父进程)。 SIGUSR1
具有非平凡类型的 C++ 原子？
阅读 boost::atomic 上的文档和 std::atomic 让我感到困惑的是 atomic 是否接口(interface)应该支持非平凡类型？也就是说，给定一个只能通过将读/写包含在一个完
FFMPEG - 精心设计后未找到 moov 原子
我有一个命令，可以将叠加图像放在视频上。之后，我调整输出大小以适合某些尺寸。通常一切正常，但有时且仅在某台台式计算机上，当第二次精化开始时，命令返回错误:moov atom not found 让
java - 为什么没有为某些语言环境设置 WM_NAME 原子
我最近发现当 LANG 设置为 C.utf8 时，X11 原子 WM_NAME 未在 Swing JFrame 中设置。但为 LANG 的其他值设置。这发生在带有 OpenJDK 11.0.9 的 L
ffmpeg - 生成 moov 原子
我目前正在使用blackmagic的prorecorder录制视频。我使用 ffmpeg 将视频即时转码为 mp4 视频容器。持续时间未知，因为我正在对 prorecorder 输出到命名管道的 .t
git - 由于提交消息为空而中止提交(编辑器 = 原子)
这里真的有人使用 atom 来处理 git 提交消息吗？我想但我遇到了这个问题并且一直坚持使用 git commit -m '....' 。当我尝试使用 atom 时，它会打开 atom，我几乎立即从
c++ - 原子 vector 的初始化
考虑: void foo() { std::vector> foo(10); ... } foo 的内容现在有效吗？或者我是否需要显式循环并初始化它们？我检查过 Godbolt，看起来不错，但
multithreading - get_multi/set_multi 原子？
在official FAQ我阅读的 Memcached: “发送到 memcached 的所有单独命令都是绝对原子的。” 然而，当涉及到 get_multi 和 set_multi 时，我仍然不清楚。
performance - 原子 memcpy 建议
在测试程序的可扩展性时，我遇到了必须将 memcpy 操作设置为原子操作的情况。我必须将 64 字节的数据从一个位置复制到另一个位置。我遇到了一种解决方案，即使用旋转变量: struct recor
c++ - 如何使用 C++ 原子
我对 C++ 原子变量感到困惑。如果我有一个原子 x，我想在一个线程中递增并在另一个线程中读取，我可以执行++x 还是必须执行 x.atomic_fetch_add(1)。在读者线程中，我可以做类似
c++ - 原子 bool 变量的一条语句中的多重赋值
跟进自 Multiple assignment in one line ，我很想知道这对原子数据类型是如何工作的，特别是 bool 类型的例子。给定: class foo { std::at
Mysql 原子 id 增量
我想创建一个版本控制系统，并且对版本号为 1 的新条目的查询如下所示: ID 和修订号组合起来就是主键。 insert into contentfile (id, name, revision, ac
iOS 上的 C++ 原子
我在 iOS 项目中有下一个独立的测试片段: /// ... std::atomic_bool ab; ab.store(true); bool expected = false; while (!a
c++ - 需要对条件变量寻求的互斥保护(原子)赋值吗？
我了解如何使用条件变量(此构造的名称很糟糕，IMO，因为 cv 对象既不是变量也不表示条件)。所以我有一对线程，canonically使用 Boost.Thread 设置为: bool awake =
JavaScript 原子 : Array Problems
因此，对于最终项目，我尝试制作一款包含三种不同 meteor 的游戏；铜牌、银牌和金牌。虽然青铜阵列在Setup()中工作正常，但银色和金色 meteor 由于某种未知原因而高速移动。 functio
c++ - 原子 CAS 中的后缀评估
第一个问题，为什么不在 atomic_compare_exchange_weak 操作的参数中应用后缀求值 (++)？运算前后a的值相同。然而，当在 printf() 中使用时，正如预期的那样，该值会
c++ - OpenMP 原子 _mm_add_pd
我正在尝试使用 OpenMP 对已经矢量化的代码进行内部函数并行化，但问题是我使用一个 XMM 寄存器作为外部“变量”，我会在每个循环中递增。现在我正在使用 shared 子句 __m128d xmm
java - 竞争条件和 clojure 原子
clojure“atom”的文档指出 - "Changes to atoms are always free of race conditions." 但是，竞争条件不仅根据更改定义，而且在不同线程中
c++ - 原子 decref 实现之间的区别
我一直在研究原子引用计数的实现。库之间的大多数操作都非常一致，但我在“减少引用计数”操作中发现了惊人的多样性。 (请注意，通常情况下，shared 和 weak decref 之间的唯一区别是调用了

首页

博学

6Ren·AI

商城

rust - 有没有办法绕过原子操作的成本？

长话短说

详情