- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
使用基本的简化版本 seqlock , gcc 将非原子负载重新排序到原子 load(memory_order_seq_cst)
使用 -O3
编译代码时.当使用其他优化级别编译或使用 clang 编译时(即使在 O3
上)也不会观察到这种重新排序。这种重新排序似乎违反了应该建立的同步关系,我很想知道为什么 gcc 重新排序这个特定的负载,以及标准是否允许这样做。
考虑以下 load
功能:
auto load()
{
std::size_t copy;
std::size_t seq0 = 0, seq1 = 0;
do
{
seq0 = seq_.load();
copy = value;
seq1 = seq_.load();
} while( seq0 & 1 || seq0 != seq1);
std::cout << "Observed: " << seq0 << '\n';
return copy;
}
在 seqlock 过程之后,这个读取器旋转直到它能够加载 seq_
的两个实例。 , 定义为 std::atomic<std::size_t>
,它们是偶数(表示作者当前未写入)和相等(表示作者尚未在 value
的两次加载之间写入 seq_
)。此外,因为这些负载被标记为 memory_order_seq_cst
(作为默认参数),我会想象指令 copy = value;
将在每次迭代中执行,因为它不能在初始加载期间重新排序,也不能在后者之下重新排序。
然而,generated assembly从 value
发出负载在第一次从 seq_
加载之前甚至在循环之外执行。这可能导致不正确的同步或撕裂读取 value
seqlock 算法无法解决的问题。此外,我注意到这仅在 sizeof(value)
时发生。小于 123 字节。修改 value
某种类型 >= 123 字节会产生正确的程序集,并在 seq_
的两次加载之间的每次循环迭代中加载.这个看似任意的阈值决定生成哪个程序集有什么原因吗?
This test harness暴露了我的 Xeon E3-1505M 上的行为,其中“Observed: 2”将从阅读器打印出来,并返回值 65535。 seq_
的观测值组合和来自 value
的返回负载似乎违反了作者线程发布应建立的同步关系 seq.store(2)
与 memory_order_release
和读者线程阅读seq_
与 memory_order_seq_cst
.
gcc 重新排序负载是否有效,如果是,为什么它只在 sizeof(value)
时才这样做? < 123? clang,无论优化级别还是 sizeof(value)
不会重新排序负载。我相信 Clang 的代码生成是合适且正确的方法。
最佳答案
恭喜,我认为您在 gcc
中遇到了错误!
现在我认为你可以做出合理的论证,因为 other answer是的,您显示的原始代码可能可能已经被 gcc
以这种方式正确优化了通过依赖一个关于无条件访问 value
的相当模糊的论点: 本质上你不能一直依赖负载之间的同步关系 seq0 = seq_.load();
以及随后读取的 value
,所以在“其他地方”阅读它不应该改变无竞争程序的语义。我实际上不确定这个论点,但这是我从减少代码中得到的一个“更简单”的案例:
#include <atomic>
#include <iostream>
std::atomic<std::size_t> seq_;
std::size_t value;
auto load()
{
std::size_t copy;
std::size_t seq0;
do
{
seq0 = seq_.load();
if (!seq0) continue;
copy = value;
seq0 = seq_.load();
} while (!seq0);
return copy;
}
这不是 seqlock
或任何东西 - 它只是等待 seq0
从零变为非零,然后读取 value
. seq_
的二读和while
一样是多余的条件,但如果没有它们,错误就会消失。
现在这是众所周知的习语的读取端,它确实有效并且没有竞争:一个线程写入 value
, 然后设置 seq0
发布商店非零。线程调用 load
查看非零存储,并与之同步,这样就可以安全地读取 value
.当然,你不能一直写信给value
,这是“一次性”初始化,但这是一种常见模式。
通过上面的代码,gcc是still hoisting the read of value
:
load():
mov rax, QWORD PTR value[rip]
.L2:
mov rdx, QWORD PTR seq_[rip]
test rdx, rdx
je .L2
mov rdx, QWORD PTR seq_[rip]
test rdx, rdx
je .L2
rep ret
糟糕!
此行为出现在 gcc 7.3 之前,但不会出现在 8.1 中。您的代码也可以在 8.1 中按照您的意愿进行编译:
mov rbx, QWORD PTR seq_[rip]
mov rbp, QWORD PTR value[rip]
mov rax, QWORD PTR seq_[rip]
关于c++ - GCC 使用 `memory_order_seq_cst` 跨负载重新排序。这是允许的吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36958372/
我有一个 ASP.NET 网站,我希望只允许 AD 组中的用户访问该网站。我正在使用如下的 web.config 片段,但这似乎不起作用:
仅当选中所有框时才应禁用“允许”按钮。我该怎么做?我已经完成了 HTML 部分,如下所示。如何执行其中的逻辑部分?即使未选中一个复选框,也应禁用“允许”按钮
当前有一个Navigator.push(context,route),但是上下文部分返回了错误,在尝试调试后,我发现问题是因为我在调用一个函数而不是直接将home设置为widget树。但是现在我不确定
这是我的邮政编码正则表达式 ^[a-zA-Z0-9]{1,9}$ 但不允许 A-12345。如何更改 - 也将被允许的正则表达式? 最佳答案 在字符集的开头或结尾添加-([...]): ^[-a-zA
我目前正在建立我的网站,但遇到了一个问题 JavaScript 中的混合内容阻止 当我尝试加载和显示来自 的图像和页面时,Chrome、Mozilla 和 Explorer 会发生这种情况http 我
我见过使用: [mysqld] bind-address = 255.112.324.12 允许远程访问单个 IP。我如何允许从 mysql 远程访问所有 IP? 最佳答案 如果你想允许它用于所
我想知道是否可以使用模板实现某些功能。我想要做的是允许特定的“复制构造函数和赋值运算符”从一个模板到另一个模板并禁用其他模板。 我想我只完成了一件我想要的事情,所以我提供了下面的类(class)。对于
这个问题在这里已经有了答案: How to validate an email address in PHP (15 个答案) 关闭 2 年前。 正则表达式让我大吃一惊。我如何更改此设置以验证带有加
解析可以采用以下格式之一的日期的最佳方法是什么 "dd-MM-yyyy HH:mm" "dd/MM/yyyy HH:mm" "dd.MM.yyyy HH:mm" 无需创建 3 个 SimpleD
我们知道,下面的代码格式不正确,因为成员 x 在依赖的基类中。但是,将指定行上的 x 更改为 this->x 将修复错误。 template struct B { int x; }; tem
如果能帮助我理解“Java 并发实践”中的以下内容,我将不胜感激: Calling an overrideable instance method(one that is neither privat
此时如果上传一个不在预定义的安全扩展名列表,如.lrc,会报错: File type does not meet security guidelines. Try another. 解决此问题有
我有一个运行韵律,可以为我的几个域和一个 friend 域处理 XMPP。我 friend 域中的一位用户(他的妻子)想更改她的密码(实际上她忘记了她,所以我会用 prosodyctl 设置一个,然后
使用 nginx,您可以允许和拒绝范围和 ips (https://www.nginx.com/resources/admin-guide/restricting-access/)。使用realip模
什么是一些好的克里金法/插值想法/选项,可以让重度权重的点在绘制的 R map 上的轻权重点上流血? 康涅狄格州有八个县。我找到了质心并想绘制这八个县中每个县的贫困率。其中三个县人口稠密(约 100
我正在使用 virtualbox + ubuntu + vagrant . 但是我不能ping或 wget任何网址。请指导我如何允许虚拟机访问我的主机的互联网? 最佳答案 这对我有用。 使用此配置 V
标题可能有点令人困惑,所以让我向您解释一下。 在 Swift 中,我们可以拥有带有默认参数值的函数,例如: func foo(value: Int = 32) { } 我们也可以有 In-Out 参数
有TextView1 和TextView2。 TextView2 应该 float 在 TextView1 的右侧。只要两个 TextView 的总宽度不使 TextView2 与右侧的框重叠,Tex
使用 Magento 收集方法 addFieldToFilter 时是否可以允许按 NULL 值进行过滤?我想选择集合中具有自定义属性的所有产品,即使没有为该属性分配任何值。 最佳答案 您不需要使用
我正试图从 .htaccess 文件中的规则中“排除”一个目录(及其所有文件夹)... 不确定这是否可能? .htaccess 文件是这样的: Order Allow,Deny Deny from a
我是一名优秀的程序员,十分优秀!