gpt4 book ai didi

c - 使用 C 与 OpenMP 求和

转载 作者:行者123 更新时间:2023-12-04 11:46:25 25 4
gpt4 key购买 nike

我已经尝试并行化这段代码大约两天了,但一直出现逻辑错误。该程序是使用非常小的 dx 的总和来计算积分的面积,并计算积分的每个离散值。我正在尝试用 openmp 实现这个,但实际上我没有使用 openmp 的经验。我需要你的帮助。实际目标是在线程中并行化 suma 变量,以便每个线程计算更少的积分值。程序编译成功,但当我执行程序时返回错误结果。

#include <omp.h>
#include <stdio.h>
#include <stdlib.h>
#include <time.h>

int main(int argc, char *argv[]){
float down = 1, up = 100, dx, suma = 0, j;
int steps, i, nthreads, tid;
long starttime, finishtime, runtime;

starttime = omp_get_wtime();
steps = atoi(argv[1]);
dx = (up - down) / steps;

nthreads = omp_get_num_threads();
tid = omp_get_thread_num();
#pragma omp parallel for private(i, j, tid) reduction(+:suma)
for(i = 0; i < steps; i++){
for(j = (steps / nthreads) * tid; j < (steps / nthreads) * (tid + 1); j += dx){
suma += ((j * j * j) + ((j + dx) * (j + dx) * (j + dx))) / 2 * dx;
}
}
printf("For %d steps the area of the integral 3 * x^2 + 1 from %f to %f is: %f\n", steps, down, up, suma);
finishtime = omp_get_wtime();
runtime = finishtime - starttime;
printf("Runtime: %ld\n", runtime);
return (0);
}

最佳答案

问题出在您的 for 循环中。如果您使用 for-pragma,OpenMP 会为您进行循环拆分:

#pragma omp parallel for private(i) reduction(+:suma)
for(i = 0; i < steps; i++) {
// recover the x-position of the i-th step
float x = down + i * dx;
// evaluate the function at x
float y = (3.0f * x * x + 1)
// add the sum of the rectangle to the overall integral
suma += y * dx
}

即使您将转换为必须自己计算索引的并行化方案,这也会有问题。外层循环应该只执行 n 线程次。

您还应该考虑切换到 double 以提高准确性。

关于c - 使用 C 与 OpenMP 求和,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7687499/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com