- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我想尝试使用类似这样的方法自动重置 256 位:
#include <x86intrin.h>
#include <iostream>
#include <array>
#include <atomic>
int main(){
std::array<std::atomic<__m256i>, 10> updateArray;
__m256i allZeros = _mm256_setzero_si256();
updateArray[0].fetch_and(allZeros);
}
但是我得到关于没有fetch_and()
元素的编译器错误。这是不可能的,因为 256 位类型太大而无法保证原子性吗?
还有其他方法可以实现吗?我正在使用海湾合作委员会。
如果不是,我可以自动重置的最大类型是什么 - 64 位?
编辑:任何 AVX 指令都可以原子地执行取指与操作吗?
最佳答案
所以有一些不同的事情需要解决:
对于#1 和#2:
在 x86 中,有执行 8、16、32、64、128、256 和 512 位操作的指令。一个处理器将[至少如果数据与其自身的大小对齐]自动执行该操作。然而,要使操作成为“真正的原子”,它还需要防止数据更新中的竞争条件[换句话说,防止其他处理器读取、修改和写回同一位置]。除了少量的“隐含锁定”指令外,这是通过向特定指令添加“锁定前缀”来完成的——这将对系统中的其他处理器执行正确类型的高速缓存对话 [技术术语],以确保只有这个处理器可以更新这个数据。
我们不能使用带有 LOCK 前缀的 VEX 指令(来自 Intel 的手册)
Any VEX-encoded instruction with a LOCK prefix preceding VEX will #UD
您需要一个 VEX 前缀才能使用 AVX 指令,#UD 表示“未定义指令”——换句话说,如果我们尝试执行该代码,它将导致处理器异常。
因此,可以 100% 确定处理器不能一次对 256 位进行原子操作。这个答案讨论了 SSE 指令的原子性: SSE instructions: which CPUs can do atomic 16B memory operations?
如果指令无效,#3 就毫无意义。
#4 - 嗯,标准支持 std::atomic<uintmax_t>
, 如果 uintmax_t
恰好是 128 或 256 位,那么您当然可以这样做。我不知道有任何处理器支持 uintmax_t
的 128 位或更高位,但语言并没有阻止它。
如果对“原子”的要求不如“需要确保 100% 肯定没有其他处理器同时更新它”那么强烈,那么使用常规的 SSE、AVX 或 AVX512 指令就足够了——但会有如果您有两个处理器(核心)同时在同一内存位上执行读取/修改/写入操作,则为竞争条件。
x86 上最大的原子操作是 CMPXCHG16B,如果另外两个寄存器中的值与内存中的值匹配,它将交换两个 64 位整数寄存器与内存中的内容。所以你可以想出一些东西来读取一个 128 位的值,然后取出一些位,然后如果没有其他东西首先进入那里,则以原子方式将新值存储回来 - 如果发生这种情况,你必须重复该操作,当然,它也不是单个原子与操作。
当然,在 Intel 和 AMD 以外的其他平台上,行为可能会有所不同。
关于c++ - 可以原子地获取和运算的最大数据类型?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30948832/
有没有办法用连词创建原子 if ?也就是说,我可以以某种方式在 C 中自动测试 if(A && B) 吗?如果它在第一个连接处短路,那么没问题,但如果没有短路,则在检查 B 时,A 可能已更改。有什么
我有很多 fork 的过程。子进程做很多事情和另一个系统调用。 当任何子进程从系统调用中获取错误时,它会将错误描述打印到 stderr 并将 SIGUSR1 发送到组长(主要父进程)。 SIGUSR1
阅读 boost::atomic 上的文档和 std::atomic 让我感到困惑的是 atomic 是否接口(interface)应该支持非平凡类型? 也就是说,给定一个只能通过将读/写包含在一个完
我有一个命令,可以将叠加图像放在视频上。 之后,我调整输出大小以适合某些尺寸。 通常一切正常,但有时且仅在某台台式计算机上,当第二次精化开始时,命令返回错误:moov atom not found 让
我最近发现当 LANG 设置为 C.utf8 时,X11 原子 WM_NAME 未在 Swing JFrame 中设置。但为 LANG 的其他值设置。这发生在带有 OpenJDK 11.0.9 的 L
我目前正在使用blackmagic的prorecorder录制视频。我使用 ffmpeg 将视频即时转码为 mp4 视频容器。持续时间未知,因为我正在对 prorecorder 输出到命名管道的 .t
这里真的有人使用 atom 来处理 git 提交消息吗?我想但我遇到了这个问题并且一直坚持使用 git commit -m '....' 。当我尝试使用 atom 时,它会打开 atom,我几乎立即从
考虑: void foo() { std::vector> foo(10); ... } foo 的内容现在有效吗?或者我是否需要显式循环并初始化它们?我检查过 Godbolt,看起来不错,但
在official FAQ我阅读的 Memcached: “发送到 memcached 的所有单独命令都是绝对原子的。” 然而,当涉及到 get_multi 和 set_multi 时,我仍然不清楚。
在测试程序的可扩展性时,我遇到了必须将 memcpy 操作设置为原子操作的情况。我必须将 64 字节的数据从一个位置复制到另一个位置。 我遇到了一种解决方案,即使用旋转变量: struct recor
我对 C++ 原子变量感到困惑。如果我有一个原子 x,我想在一个线程中递增并在另一个线程中读取,我可以执行++x 还是必须执行 x.atomic_fetch_add(1)。在读者线程中,我可以做类似
跟进自 Multiple assignment in one line ,我很想知道这对原子数据类型是如何工作的,特别是 bool 类型的例子。 给定: class foo { std::at
我想创建一个版本控制系统,并且对版本号为 1 的新条目的查询如下所示: ID 和修订号组合起来就是主键。 insert into contentfile (id, name, revision, ac
我在 iOS 项目中有下一个独立的测试片段: /// ... std::atomic_bool ab; ab.store(true); bool expected = false; while (!a
我了解如何使用条件变量(此构造的名称很糟糕,IMO,因为 cv 对象既不是变量也不表示条件)。所以我有一对线程,canonically使用 Boost.Thread 设置为: bool awake =
因此,对于最终项目,我尝试制作一款包含三种不同 meteor 的游戏;铜牌、银牌和金牌。虽然青铜阵列在Setup()中工作正常,但银色和金色 meteor 由于某种未知原因而高速移动。 functio
第一个问题,为什么不在 atomic_compare_exchange_weak 操作的参数中应用后缀求值 (++)?运算前后a的值相同。然而,当在 printf() 中使用时,正如预期的那样,该值会
我正在尝试使用 OpenMP 对已经矢量化的代码进行内部函数并行化,但问题是我使用一个 XMM 寄存器作为外部“变量”,我会在每个循环中递增。现在我正在使用 shared 子句 __m128d xmm
clojure“atom”的文档指出 - "Changes to atoms are always free of race conditions." 但是,竞争条件不仅根据更改定义,而且在不同线程中
我一直在研究原子引用计数的实现。 库之间的大多数操作都非常一致,但我在“减少引用计数”操作中发现了惊人的多样性。 (请注意,通常情况下,shared 和 weak decref 之间的唯一区别是调用了
我是一名优秀的程序员,十分优秀!