c++ - 使用 -O3 或 -Ofast 来编译基准代码是否现实，或者它会删除代码吗？-6ren

c++ - 使用 -O3 或 -Ofast 来编译基准代码是否现实，或者它会删除代码吗？

转载作者：塔克拉玛干更新时间：2023-11-03 02:01:31

25

4

当使用 -O3 编译下面的基准代码时，它在延迟方面的差异给我留下了深刻的印象，所以我开始怀疑编译器是否通过某种方式删除代码来“作弊”。有办法检查吗？我可以安全地使用 -O3 进行基准测试吗？期望速度提高 15 倍是否现实？

没有 -O3 的结果:平均:239 纳米最小值:230 纳米(900 万次迭代)
-O3 的结果:平均:14 纳米，最小值:12 纳米(900 万次迭代)

int iterations = stoi(argv[1]);
int load = stoi(argv[2]);

long long x = 0;

for(int i = 0; i < iterations; i++) {

    long start = get_nano_ts(); // START clock

    for(int j = 0; j < load; j++) {
        if (i % 4 == 0) {
            x += (i % 4) * (i % 8);
        } else {
            x -= (i % 16) * (i % 32);
        }
    }

    long end = get_nano_ts(); // STOP clock

    // (omitted for clarity)
}

cout << "My result: " << x << endl;

注意:我正在使用 clock_gettime 来测量:

long get_nano_ts() {
    struct timespec ts;
    clock_gettime(CLOCK_MONOTONIC, &ts);
    return ts.tv_sec * 1000000000 + ts.tv_nsec;
}

最佳答案

在启用优化编译时，编译器肯定会“作弊”并删除不必要的代码。它实际上花了很长时间来加速你的代码，这几乎总是会带来令人印象深刻的加速。如果它能够以某种方式推导出一个公式来计算常数时间的结果而不是使用这个循环，它就会。常数因子 15 没什么特别的。

但这不意味着您应该分析未优化的构建!事实上，当使用像 C 和 C++ 这样的语言时，未优化构建的性能几乎完全没有意义。您根本不必担心这一点。

当然，这可能会干扰您上面显示的微基准。有两点:

通常情况下，这种微优化也无关紧要。更喜欢分析您的实际程序，然后消除瓶颈。
如果您真的想要这样的微基准测试，请让它依赖于一些运行时输入并显示结果。这样一来，编译器就无法删除功能本身，只能使其相当快。

由于您似乎正在这样做，所以您展示的代码很有可能成为一个合理的微观基准。您应该注意的一件事是您的编译器是否将对 get_nano_ts(); 的两个调用都移动到循环的同一侧。允许这样做，因为“运行时”不算作可观察到的副作用。 (该标准甚至不要求您的机器以有限速度运行。)有人争论 here这通常不是问题，但我无法真正判断给出的答案是否有效。

如果您的程序除了您要进行基准测试的事情之外没有做任何昂贵的事情(如果可能的话，它无论如何都不应该做)，您也可以将时间测量“移到”外部，例如与 time .

关于c++ - 使用 -O3 或 -Ofast 来编译基准代码是否现实，或者它会删除代码吗？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31195802/

25

4

0

文章推荐： c++ - 代码块 C++ 错误预期在枚举之前的主表达式

文章推荐： windows - Windows 切换焦点时击键会发生什么

文章推荐： c - 在内存中打开和加载文件的方法

文章推荐： c++ - 在 OpenCV/C++ 中通过(扩展)卡尔曼滤波器实现数据融合

java - 用于构建项目的库？我可以使用 C++ 编译 C++，或者使用 python 编译 java，或者使用 C++ 编译 java，等等？
是否有任何库或框架旨在促进从另一种成熟的编程语言中构建项目？在 C++、java 等编程语言中指定逻辑、集合和复杂规则非常容易，但在 Makefile 中完成这些事情似乎是一场艰苦的战斗。我还没有深
c++ - 代码可以用 clang 编译，但不能用 gcc 编译
我有这段代码可以用 clang 编译得很好(即使使用 -Weverything)，但是 gcc 会发出错误。 #include #include #include using namespace
c++ - C 头文件不能用 C 编译，但可以用 C++ 编译
我有以下 block 头文件 BKE_mesh.h: /* Connectivity data */ typedef struct IndexNode { struct IndexNode *
c++ - 如果使用 Makefile 编译，代码可以正常工作，如果使用 XCode 编译，代码会崩溃
我在我的一个项目中遇到了一个奇怪的问题。我的代码库依赖于一个外部库，其中包含一个名为 Dataset 的类. Dataset类私有(private)继承自 std::vector (其中 Sample
c++ - C/C++ 项目可以使用 Xcode 编译，但不能使用 gcc/g++ 编译
当使用 gcc、g++ 或 make 在终端中编译一个小型 C 或 C++ 项目时，我收到以下错误: /tmp/ccG1caGi.o: In function `main': main.c:(.tex
emacs - 如何在 Windows 上为 Emacs 23.1.50 编译 CEDET 1.0pre7 编译？
我正在尝试从 CVS 为 Windows 上的 Emacs 23.1.50 编译 CEDET，但在“第 6 步:打开 EDE...”时出现错误:“defvar:作为变量的符号值是无效的:cedet-m
c - fflush(stdin) 不能在 cygwin 中用 gcc 编译，但可以用 visual studio 2010 编译
我正在(重新)学习编程，我从 C 开始。我的 IDE(如果我可以这么说)是 Windows7 上的 cygwin(32 位)和 Visual-Studio 2010。我总是编译我用 gcc (cygw
C++ GCC 为什么这段 sfinae 代码可以用 GCC 4.7 编译，但不能用 4.8 编译？
我喜欢在模板类中使用本地类来执行类似“static if”的构造。但是我遇到了 gcc 4.8 不想编译我的代码的问题。但是 4.7 可以。这个例子: #include #include #in
Java - 使用 java 1.4 编译 src/main/java 并使用 1.5 编译 src/test/java
我有一个项目，必须仅使用 java 1.4 进行编译。但我计划使用mockito 编写一些单元测试。我想要一种在 pom 中指定的方法，以便 src/main/java 使用 jdk 1.4 编译，但
PHP 编译
我想了解 PHP 编译过程是如何工作的。假设我有一个名为funcs.php 的文件并且这个文件有三个函数，如果我include 或require 它，所有的在文件加载期间编译三个函数？或者源代码会被
gcc/g++编译
编译工具链我们写程序的时候用的都是集成开发环境 (IDE: Integrated Development Environment)，集成开发环境可以极大地方便我们程序员编写程序，但是配置起来
scala - 编译 for 循环时出现奇怪的错误
当我编写一些 Scala 代码时，在尝试编译代码时收到一条奇怪的错误消息。我将代码分解为一个更简单的代码(从语义的角度来看这完全没有意义，但仍然显示了错误)。 scala> :paste // Ent
带注释的 SASS 编译
我正在编译一个 SCSS 文件，它似乎删除了我的评论。我可以使用什么命令来保留所有评论？ >SASS input.scss output.css 我在 SCSS 中看到两种类型的注释。 // Comm
编译 C 结构
这是我的代码: #include typedef struct { const char *description; float value; int age; } swag
Grails GSP 编译？
当您编译 grails war 时，我知道 .groovy 代码被编译为字节码类文件，但我不明白容器(例如 tomcat)如何在请求 GSP 时知道如何编译它们。容器了解 GSP 吗？安装在服务器上的
编译 : undefined reference to
我正在努力将多个文件编译成一个通用程序。我收到一个错误: undefined reference to 'pi' 这是我的代码和 Makefile 的框架。我做错了什么？谢谢! 文件:calcPi.c
编译 LD_PRELOAD 包装器的冲突类型
我尝试使用 LD_PRELOAD 来 Hook sprintf function ，所以我将打印到缓冲区的结果: #define _GNU_SOURCE #include #include int
javascript - CoffeeScript 编译
我正在寻找最简单的方法来自动将 CoffeeScript 重新编译为 JS。阅读documentation但仍然很难得到我想要的东西。我需要它来监视文件夹 src/ 中的任何 *.coffee 文
javascript - CoffeeScript 编译
我想使用定制waveformjs 。我发现this on SO但是，我不知道如何编译/安装波形来开始。我从 GitHub 克隆它并进行了更改，但是我不知道如何将其转换为 .js 文件。最佳答案为了
java - 编译/捕获异常
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它，visit the help center 。已关

首页

博学

6Ren·AI

商城

c++ - 使用 -O3 或 -Ofast 来编译基准代码是否现实，或者它会删除代码吗？