gpt4 book ai didi

c - 使用优化的内存带宽方法时,我没有看到性能提升

转载 作者:太空宇宙 更新时间:2023-11-04 00:05:37 26 4
gpt4 key购买 nike

我看到了一个循环的例子,它应该比这之后的循环慢:

for (i = 0; i < 1000; i++) 
column_sum[i] = 0.0;
for (j = 0; j < 1000; j++)
column_sum[i] += b[j][i];

与这个相比:

for (i = 0; i < 1000; i++)
column_sum[i] = 0.0;
for (j = 0; j < 1000; j++)
for (i = 0; i < 1000; i++)
column_sum[i] += b[j][i];

现在,我编写了一个工具来测试不同索引号的数量,但在我尝试这个概念后我没有看到太多的性能优势,我担心我的代码与它有关......

应该是在我的代码中工作的较慢的循环:

    for (i = 0; i < val; i++){
column_sum[i] = 0.0;
for (j = 0; j < val; j++){
int index = i * (int)val + j;
column_sum[i] += p[index];
}
}

应该是“显着”更快的代码:

    for (i = 0; i < val; i++) {
column_sum[i] = 0.0;
}
for (j = 0; j < val; j++) {
for (i = 0; i < val; i++) {
int index = j * (int)val + i;
column_sum[i] += p[index];
}
}

数据对比:

enter image description here

最佳答案

我混淆了循环中的索引值:int index = j * (int)val + i;

较慢的循环:

    for (i = 0; i < val; i++) {
column_sum[i] = 0.0;
for (j = 0; j < val; j++){
int index = j * (int)val + i;
column_sum[i] += p[index];
}
}

更快的循环:

    for (i = 0; i < val; i++) {
column_sum[i] = 0.0;
}
for (j = 0; j < val; j++) {
for (i = 0; i < val; i++) {
int index = j * (int)val + i;
column_sum[i] += p[index];
}
}

关于c - 使用优化的内存带宽方法时,我没有看到性能提升,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25844205/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com