gpt4 book ai didi

c++ - 升级后内循环性能下降是什么原因?

转载 作者:行者123 更新时间:2023-12-01 09:20:42 25 4
gpt4 key购买 nike

我有一个手卷矩阵算法,它找到方阵右下方的最大数(因此在迭代时,某些部分被“跳过”) - 存储为密集矩阵。从 更新后至 它似乎要慢得多 - 总体上下降了大约 50%。经过一番调查,这位于寻找绝对最大值的函数的内循环。看着输出,这似乎是由于一些额外的 指令被插入紧密的循环中。以不同的方式重新处理循环似乎可以解决或部分解决问题。
相比之下,似乎没有这个“问题”。

简化示例(fabs 并不总是需要重现):

#include <cmath>
#include <iostream>

int f_slow(double *A, size_t from, size_t w)
{
double biga_absval = *A;
size_t ir = 0,ic=0;
for ( size_t j = 0; j < w; j++ ) {
size_t n = j*w;
for ( ; n < j*w+w; n++ ) {
if ( fabs(A[n]) <= biga_absval ) {
biga_absval = fabs( A[n] );
ir = j;
ic = n;
}
n++;
}
}

std::cout << ir <<ic;
return 0;
}

int f_fast(double *A, size_t from, size_t w)
{
double* biga = A;
double biga_absval = *biga;

double* n_begin = A + from;
double* n_end = A + w;
for (double* A_n = n_begin; A_n < n_end; ++A_n) {
if (fabs(*A_n) > biga_absval) {
biga_absval = fabs(*A_n);
biga = A_n;
}
}

std::cout << biga;
return 0;
}

int f_faster(double *A, size_t from, size_t w)
{
double biga_absval = *A;
size_t ir = 0,ic=0;
for ( size_t j = 0; j < w; j++ ) {
size_t n = j;
for ( ; n < j*w+w; n++ ) {
if ( fabs(A[n]) > biga_absval ) {
biga_absval = fabs( A[n] );
ir = j;
ic = n - j*w;
}
n++;
}
}

std::cout << ir <<ic;
return 0;
}

请注意 :创建示例仅用于查看输出(和索引等不一定有意义):

https://godbolt.org/z/q9rWwi

所以我的问题是:这只是一个(已知的?)优化器错误(?)还是在这种情况下似乎是一个明显的优化失误背后有一些逻辑?

使用最新的稳定版 15.9.5

更新:额外的 我看到的是在跳转代码之前 - 在编译器资源管理器中找到的最简单方法是右键单击 if然后“滚动到”。

最佳答案

好吧,我不知道为什么 VC 在你的情况下变得更糟,但我想提供一些提示,如何保护一些操作。

void f_faster( const double* A, const std::size_t w ) {
double biga_absval = A[ 0 ];
std::size_t ir, ic_n;
for ( std::size_t j = 0; j < w; ++j ) {
const auto N = j * w + w;
for ( std::size_t n = j; n < N; n += 2 ) {
if ( const auto new_big_a = std::fabs( A[ n ] ); new_big_a > biga_absval ) {
biga_absval = new_big_a;
ir = j;
ic_n = n;
}
}
}

std::cout << ir << ( ic_n - ir * w );
}
  • 内循环不计算ic,只存储n供以后使用
  • 使用 const 帮助优化器
  • 不要两次评估 std::fabs
  • 后增量创建一个拷贝,您不需要(可能已优化)
  • 将循环的上限存储在外面,否则它可能会被重新评估(可能被优化掉)
  • 只需将 n 增加 2,而不是两次增加 1
  • 不要用未使用的值初始化

  • 也许这已经足以摆脱额外的 mov 了?

    关于c++ - 升级后内循环性能下降是什么原因?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54422760/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com