c++ - g++ -O3 比 -O2 优化得更好，添加了所有额外的优化-6ren

c++ - g++ -O3 比 -O2 优化得更好，添加了所有额外的优化

转载作者：可可西里更新时间：2023-11-01 18:35:43

27

4

<分区>

这是我正在查看的函数:

template <uint8_t Size>
inline uint64_t parseUnsigned( const char (&buf)[Size] )
{
  uint64_t val = 0;
  for (uint8_t i = 0; i < Size; ++i)
    if (buf[i] != ' ')
      val = (val * 10) + (buf[i] - '0');
  return val;
}

我有一个测试工具，它传递所有可能的数字，其中 Size=5，左边用空格填充。我正在使用 GCC 4.7.2。当我在使用 -O3 编译后在 callgrind 下运行程序时，我得到:

I   refs:      7,154,919

当我使用 -O2 编译时，我得到:

I   refs:      9,001,570

好的，所以 -O3 提高了性能(我确认一些改进来自上述功能，而不仅仅是测试工具)。但我不想完全从 -O2 切换到 -O3，我想找出要添加的特定选项。所以我查阅 man g++ 以获取它所说的由 -O3 添加的选项列表:

-fgcse-after-reload                         [enabled]
-finline-functions                          [enabled]
-fipa-cp-clone                              [enabled]
-fpredictive-commoning                      [enabled]
-ftree-loop-distribute-patterns             [enabled]
-ftree-vectorize                            [enabled]
-funswitch-loops                            [enabled]

所以我再次使用 -O2 进行编译，然后使用上述所有选项。但这给我的性能比普通的 -O2 更差:

I   refs:      9,546,017

我发现将 -ftree-vectorize 添加到 -O2 是造成这种性能下降的原因。但我无法弄清楚如何将 -O3 性能与任何选项组合相匹配。我该怎么做？

如果您想自己尝试，这里是测试工具(将上面的 parseUnsigned() 定义放在#includes 下):

#include <cmath>
#include <stdint.h>
#include <cstdio>
#include <cstdlib>
#include <cstring>

template <uint8_t Size>
inline void increment( char (&buf)[Size] )
{
  for (uint8_t i = Size - 1; i < 255; --i)
  {
    if (buf[i] == ' ')
    {
      buf[i] = '1';
      break;
    }

    ++buf[i];
    if (buf[i] > '9')
      buf[i] -= 10;
    else
      break;
  }
}

int main()
{
  char str[5];
  memset(str, ' ', sizeof(str));

  unsigned max = std::pow(10, sizeof(str));
  for (unsigned ii = 0; ii < max; ++ii)
  {
    uint64_t result = parseUnsigned(str);
    if (result != ii)
    {
      printf("parseUnsigned(%*s) from %u: %lu\n", sizeof(str), str, ii, result);
      abort();
    }
    increment(str);
  }
}

27

4

0

文章推荐： c++ - std::string 到 std::chrono time_point

文章推荐： c++ - boost.graph 1.56.0 和 g++ 4.6.4 编译错误

文章推荐： c++ - initializer_list 对 T 的赋值运算符要求

文章推荐： c++ - 通过 TCP 套接字接收可变大小的数据

dart - 额外/重定向默认路由时
我配置了我的RouteInitializer如下: class AppRouteInitializer implements RouteInitializer { init(Router rout
Android PendingIntent 额外
我正在尝试从 Android 应用程序发送短信。我正在使用 PendingIntent 以便我可以使用 Broadcast Receiver 检查它是否发送正常。由于 sendTextMessage
mongoDB使用投影剔除‘额外’字段的操作过程
目录简介 1 "额外"字段是什么 1.1 "额外"是指与业务无关 1.2 产生
java - android发送 Intent 额外
应用程序读取 JSON 数据。然后它会将其放入 ListView (正确)，但在按下某个项目后，我总是会得到显示的相同值。下面的代码我认为是问题所在，但我找不到。 try{ JSONArray
android - 覆盖 Intent 额外
我正在使用以下代码 (Kotlin) 创建通知 val builder = NotificationCompat.Builder(ctx) ........ .set
Java JPanel 自己稍微移动 + 额外
我有一个问题。现在我正在使用 3 个面板，mainPanel 和其他 2 个面板(btnPanel 和 iconPanel)。所以问题是当我按下“重置”按钮时，我删除了 iconPanel 并再次添加
css - 跨度，额外 margin
这是我的 html: Settings Export Import 和CSS: span.button { float:right; margin-righ
mongodb - Golang Mongodb %!(额外
我正在尝试将一个结构编码为 JSON，然后将其插入我的 Mongo 数据库，但不断出现此错误:%!(EXTRA main.Test={575590180 Me})。我究竟做错了什么？我完全从我从事的另
latex - !额外}，或者忘记\endgroup。 latex
嘿，我遇到了这些 latex 格式问题，有人可以提供一些帮助吗？ .tex 文件: \begin{table}{} \renewcommand{\arraystretch}{1.1} \c
java - fragment 作为可序列化 bundle 额外
我在 FragmentPagerAdapter 中使用了 Fragment 的 ArrayList。我想在 saveState() 中保存此 ArrayList 的状态，并在 restoreStat
Swift MapKit - 向注释添加(额外)属性？
我做了this MapKit-教程一切正常，但如何为我的 pin 添加额外的属性？这是我的课车: import Foundation import MapKit class Car: NSObje
android - Android 额外 Intent 的文档
关于 Android intent 将提供的附加功能有哪些文档？更新: 我做了一些进一步的调查。我知道我们可以假设每个 Intent 都不会解析任何数据或额外内容，除非有明确记录。此外，一些(但不是
python - SqlAlchemy TIMESTAMP 'on update' 额外
我在 python3.4.3 上使用 SqlAlchemy 来管理 MySQL 数据库。我正在创建一个表: from datetime import datetime from sqlalchemy
html - Bootstrap 1 额外 px in chrome
我正在使用 bootstrap 创建网页。我在两个 block (内容和标题)上派生了正文。在内容 block 中，我有 div 类 .container .sameTable 在里面我有 div 类
mingw - 构建无需 MinGW 和 MSYS 额外 dll 即可运行的程序
我在Windows 7上的MinGW和MSYS下使用gfortran构建了一些fortran程序。但是当我在未安装MinGW和MSYS的其他计算机上运行它们时，系统总是要求一些dll，例如libgfo
javascript - 使用 jQuery 将多个元素彼此相邻放置后，第一个元素的(额外)填充/边距是多少
第一个元素的右侧似乎有额外的间距，我不知道它是从哪里来的。有人可以帮助我吗？这是我使用的代码: http://jsfiddle.net/srabeat/tenx4y1c/1/ for (i = 0;
javascript - fs-额外 : Error: EPERM: operation not permitted, 取消链接
我使用 fs-extra 收到以下错误: ERROR { [Error: EPERM: operation not permitted, unlink 'C:\Projects\xxx\branche
c++ - AES-128 CBC 模式下加密流末尾的 Crypto++ 额外 block
我正在尝试在 CBC 模式下使用 AES-128 加密 320 字节的二进制数据，并将密码存储到一个文件中。输出文件应该是 320 字节，但我得到了 336 字节。这是我的代码: #include
java - 使用带有 Android 额外 header 的 URL 打开浏览器
我有一个特定的要求，我必须从我的 Activity 中触发浏览器上的 url。我可以使用以下代码执行此操作: Intent browserIntent = new Intent( Intent.A
php - JMS DI 额外 bundle : How do I inject a dependency only if it exists
我正在使用 JMS DI 注入(inject)带有注解的服务: use JMS\DiExtraBundle\Annotation as DI; /** * @DI\Service("foo.bar.

首页

博学

6Ren·AI

商城

c++ - g++ -O3 比 -O2 优化得更好，添加了所有额外的优化