gpt4 book ai didi

c - OMP 使用 if 语句优化嵌套循环

转载 作者:行者123 更新时间:2023-11-30 17:38:48 25 4
gpt4 key购买 nike

我尝试并行运行以下几行代码

void optimized(int data_len, unsigned int * input_array, unsigned int * output_array, unsigned int * filter_list, int filter_len) {

#pragma omp parallel for
for (int j = 0; j < filter_len; j++) {
for (int i = 0; i < data_len; i++) {
if (input_array[i] == filter_list[j]) {
output_array[i] = filter_list[j];
}
}
}
}

仅仅放置 pragma 语句确实创造了奇迹,但我正在尝试进一步减少此代码的运行时间。我已经尝试了很多方法,从数组填充到折叠循环再到创建任务,但迄今为止唯一有效的方法是循环展开。有谁对我可能进一步加快此代码的速度有什么建议吗?

最佳答案

您正在进行纯内存访问。这受到机器内存带宽的限制。多线程不会对你有太大帮助。 gcc -O2 已经为您提供了 SSE 指令优化。所以直接使用intel指令可能也没有帮助。您可以尝试一次检查 4 个 int,因为 SSE 支持 128 个寄存器(请参阅 https://gcc.gnu.org/onlinedocs/gcc-4.4.5/gcc/X86-Built_002din-Functions.html 和 google 获取一些示例)此外,如果可以的话,使用短而不是 int 来减少数据量也有帮助。

关于c - OMP 使用 if 语句优化嵌套循环,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22032707/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com