- mongodb - 在 MongoDB mapreduce 中,如何展平值对象?
- javascript - 对象传播与 Object.assign
- html - 输入类型 ="submit"Vs 按钮标签它们可以互换吗?
- sql - 使用 MongoDB 而不是 MS SQL Server 的优缺点
假设我有许多要执行的语句
一个固定的顺序。我想使用优化级别为 2 的 g++,所以一些
语句可以重新排序。必须使用哪些工具来强制执行某种语句顺序?
考虑以下示例。
using Clock = std::chrono::high_resolution_clock;
auto t1 = Clock::now(); // Statement 1
foo(); // Statement 2
auto t2 = Clock::now(); // Statement 3
auto elapsedTime = t2 - t1;
using Clock=std::chrono::high_resolution_clock;
foo(); // Statement 2
auto t1 = Clock::now(); // Statement 1
auto t2 = Clock::now(); // Statement 3
auto elapsedTime = t2 - t1;
最佳答案
在与 C++ 标准委员会讨论之后,我想尝试提供一个更全面的答案。除了是 C++ 委员会的成员之外,我还是 LLVM 和 Clang 编译器的开发人员。
从根本上说,没有办法在序列中使用屏障或某些操作来实现这些转换。基本问题是,实现完全知道诸如整数加法之类的操作语义。它可以模拟它们,它知道它们不能被正确的程序观察到,并且总是可以自由地移动它们。
我们可以尝试防止这种情况发生,但它会产生极其负面的结果,最终会失败。
首先,在编译器中防止这种情况的唯一方法是告诉它所有这些基本操作都是可观察的。问题是这会排除绝大多数编译器优化。在编译器内部,我们基本上没有很好的机制来模拟时间是可观察的,但没有别的。我们甚至没有一个很好的模型来说明哪些操作需要时间。例如,将 32 位无符号整数转换为 64 位无符号整数是否需要时间?在 x86-64 上它需要零时间,但在其他架构上它需要非零时间。这里没有一般正确的答案。
但即使我们通过一些英雄主义成功地阻止编译器重新排序这些操作,也不能保证这就足够了。考虑一种在 x86 机器上执行 C++ 程序的有效且一致的方法:DynamoRIO。这是一个动态评估程序机器码的系统。它可以做的一件事是在线优化,它甚至能够在时间之外推测性地执行整个范围的基本算术指令。这种行为并不是动态评估器独有的,实际的 x86 CPU 也会推测(数量少得多)指令并动态重新排序它们。
基本的认识是,算术不可观察(即使在时序级别)这一事实已渗透到计算机的各个层。对于编译器、运行时,甚至硬件来说都是如此。强制它是可观察的会极大地限制编译器,但它也会极大地限制硬件。
但所有这些都不应该让你失去希望。当您想要为基本数学运算的执行计时时,我们已经深入研究了可靠工作的技术。通常在进行微基准测试时使用这些。我在 CppCon2015 上讲过这个:https://youtu.be/nXaxk27zwlk
那里展示的技术也由各种微基准库提供,例如 Google 的:https://github.com/google/benchmark#preventing-optimization
这些技术的关键是关注数据。您使计算的输入对优化器不透明,而计算的结果对优化器不透明。一旦你这样做了,你就可以可靠地计时。让我们看一下原始问题中示例的真实版本,但定义为 foo
对实现完全可见。我还提取了一个(非可移植)版本的 DoNotOptimize
来自谷歌基准库,你可以在这里找到:https://github.com/google/benchmark/blob/master/include/benchmark/benchmark_api.h#L208
#include <chrono>
template <class T>
__attribute__((always_inline)) inline void DoNotOptimize(const T &value) {
asm volatile("" : "+m"(const_cast<T &>(value)));
}
// The compiler has full knowledge of the implementation.
static int foo(int x) { return x * 2; }
auto time_foo() {
using Clock = std::chrono::high_resolution_clock;
auto input = 42;
auto t1 = Clock::now(); // Statement 1
DoNotOptimize(input);
auto output = foo(input); // Statement 2
DoNotOptimize(output);
auto t2 = Clock::now(); // Statement 3
return t2 - t1;
}
foo
周围标记为不可优化。 ,并且仅在这些标记周围计算时间。由于您使用数据来钳制计算,因此可以保证保持在两个时间之间,但允许优化计算本身。最近构建的 Clang/LLVM 生成的 x86-64 程序集是:
% ./bin/clang++ -std=c++14 -c -S -o - so.cpp -O3
.text
.file "so.cpp"
.globl _Z8time_foov
.p2align 4, 0x90
.type _Z8time_foov,@function
_Z8time_foov: # @_Z8time_foov
.cfi_startproc
# BB#0: # %entry
pushq %rbx
.Ltmp0:
.cfi_def_cfa_offset 16
subq $16, %rsp
.Ltmp1:
.cfi_def_cfa_offset 32
.Ltmp2:
.cfi_offset %rbx, -16
movl $42, 8(%rsp)
callq _ZNSt6chrono3_V212system_clock3nowEv
movq %rax, %rbx
#APP
#NO_APP
movl 8(%rsp), %eax
addl %eax, %eax # This is "foo"!
movl %eax, 12(%rsp)
#APP
#NO_APP
callq _ZNSt6chrono3_V212system_clock3nowEv
subq %rbx, %rax
addq $16, %rsp
popq %rbx
retq
.Lfunc_end0:
.size _Z8time_foov, .Lfunc_end0-_Z8time_foov
.cfi_endproc
.ident "clang version 3.9.0 (trunk 273389) (llvm/trunk 273380)"
.section ".note.GNU-stack","",@progbits
foo(input)
的调用。直到一条指令,
addl %eax, %eax
,但没有将它移到时间之外或在不断输入的情况下完全消除它。
DoNotOptimize
的 API 的可能性。这里。
关于c++ - 在 C++ 中强制执行语句顺序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37786547/
我有一个“有趣”的问题,即以两种不同的方式运行 wine 会导致: $> wine --version /Applications/Wine.app/Contents/Resources/bin/wi
我制作了这个网络抓取工具来获取网页中的表格。我使用 puppeteer (不知道 crontab 有问题)、Python 进行清理并处理数据库的输出 但令我惊讶的是,当我执行它时 */50 * * *
JavaScript 是否被调用或执行取决于什么?准确地说,我有两个函数,它们都以相同的方式调用: [self.mapView stringByEvaluatingJavaScriptFromStri
我目前正在使用 python 做一个机器学习项目(这里是初学者,从头开始学习一切)。 只是想知道 statsmodels 的 OLS 和 scikit 的 PooledOlS 使用我拥有的相同面板数据
在使用集成对象模型 (IOM) 后,我可以执行 SAS 代码并将 SAS 数据集读入 .Net/C# 数据集 here . 只是好奇,使用 .Net 作为 SAS 服务器的客户端与使用 Enterpr
有一些直接的 jQuery 在单击时隐藏打开的 div 未显示,但仍将高度添加到导航中以使其看起来好像要掉下来了。 这个脚本工作正常: $(document).ready(funct
这个问题已经有答案了: How do I compare strings in Java? (23 个回答) 已关闭 4 年前。 这里是 Java 新手,我正在使用 NetBeans 尝试一些简单的代
如果我将它切换到 Python 2.x,它执行 10。这是为什么? 训练逻辑回归模型 import keras.backend as
我有两个脚本,它们包含在 HTML 正文中。在第一个脚本中,我初始化一个 JS 对象,该对象在第二个脚本标记中引用。 ... obj.a = 1000; obj.
每当我运行该方法时,我都会收到一个带有数字的错误 以下是我的代码。 public String getAccount() { String s = "Listing the accounts";
我已经用 do~while(true) 创建了我的菜单;但是每次用户输入一个数字时,它不会运行程序,而是再次显示菜单!你怎么看? //我的主要方法 public static void main(St
执行命令后,如何让IPython通知我?我可以使用铃声/警报还是通过弹出窗口获取它?我正在OS X 10.8.5的iTerm上运行Anaconda。 最佳答案 使用最新版本的iTerm,您可以在she
您好,我刚刚使用菜单栏为 Swing 编写了代码。但是问题出现在运行中。我输入: javac Menu.java java Menu 它没有给出任何错误,但 GUI 没有显示。这是我的源代码以供引用:
我觉得这里缺少明显的东西,但是我看不到它写在任何地方。 我使用Authenticode证书对可执行文件进行签名,但是当我开始学习有关它的更多信息时,我对原样的值(value)提出了质疑。 签名的exe
我正在设计一个应用程序,它使用 DataTables 中的预定义库来创建数据表。我想对数据表执行删除操作,为此应在按钮单击事件上执行 java 脚本。 $(document).ready(functi
我是 Haskell 新手,如果有人愿意帮助我,我会很高兴!我试图让这个程序与 do while 循环一起工作。 第二个 getLine 命令的结果被放入变量 goGlenn 中,如果 goGlenn
我有一个用 swing 实现迷你游戏的程序,在主类中我有一个循环,用于监听游戏 map 中的 boolean 值。使用 while 实现的循环不会执行一条指令,如果它是唯一的一条指令,我不知道为什么。
我正在尝试开发一个连接到 Oracle 数据库并执行函数的 Java 应用程序。如果我在 Eclipse 中运行该应用程序,它可以工作,但是当我尝试在 Windows 命令提示符中运行 .jar 时,
我正在阅读有关 Java 中的 Future 和 javascript 中的 Promises 的内容。下面是我作为示例编写的代码。我的问题是分配给 future 的任务什么时候开始执行? 当如下行创
我有一个常见的情况,您有两个变量(xSpeed 和 ySpeed),当它们低于 minSpeed 时,我想将它们独立设置为零,并在它们都为零时退出。 最有效的方法是什么?目前我有两种方法(方法2更干净
我是一名优秀的程序员,十分优秀!