gpt4 book ai didi

parallel-processing - 系统地并行化fortran 2008 `do concurrent`,可能与openmp并行

转载 作者:行者123 更新时间:2023-12-04 06:06:35 25 4
gpt4 key购买 nike

fortran 2008 do concurrent构造是一个do循环,它告诉编译器没有迭代会影响其他任何迭代。因此,它可以安全地并行化。

一个有效的例子:

program main
implicit none
integer :: i
integer, dimension(10) :: array
do concurrent( i= 1: 10)
array(i) = i
end do
end program main

可以以任何顺序进行迭代的地方。您可以阅读有关它的更多信息 here

据我所知,gfortran不会自动并行化这些 do concurrent循环,而我还记得有关此操作的gfortran-diffusion-list邮件( here)。它只是将它们转换为经典的 do循环。

我的问题:您知道一种系统地并行化 do concurrent循环的方法吗?例如,使用系统的openmp语法?

最佳答案

自动进行操作并非易事。 DO CONCURRENT构造具有forall header ,这意味着它可以接受多个循环,索引变量定义和掩码。基本上,您需要替换:

DO CONCURRENT([<type-spec> :: ]<forall-triplet-spec 1>, <forall-triplet-spec 2>, ...[, <scalar-mask-expression>])
<block>
END DO

和:
[BLOCK
<type-spec> :: <indexes>]

!$omp parallel do
DO <forall-triplet-spec 1>
DO <forall-triplet-spec 2>
...
[IF (<scalar-mask-expression>) THEN]
<block>
[END IF]
...
END DO
END DO
!$omp end parallel do

[END BLOCK]

(方括号中的内容是可选的,具体取决于所有标题中相应部分的存在)

请注意,这不像使用 <iters 1>*<iters 2>*...独立迭代来并行化一个大循环那样有效。还要注意,forall-header允许一种类型规范,该规范允许在头内部定义循环索引,并且您将需要将整个内容包围在 DO CONCURRENT构造中以保留语义。您还需要检查scalar-mask-expr是否在forall header 的末尾存在,如果确实存在,还应该将该 BLOCK ... END BLOCK放在最里面的循环中。

如果在 IF ... END IF主体内仅具有数组分配,则还可以将其转换为 DO CONCURRENT并使用 FORALL OpenMP指令。这将比上面容易得多。
DO CONCURRENT <forall-header>
<block>
END DO

会成为:
!$omp parallel workshare
FORALL <forall-header>
<block>
END FORALL
!$omp end parallel workshare

鉴于以上所有内容,我能想到的唯一系统的方法是系统地遍历您的源代码,搜索 workshare并根据forall-header和循环主体的内容将其系统地替换为上述转换后的结构之一。

编辑:目前不鼓励使用OpenMP DO CONCURRENT指令。事实证明,至少Intel Fortran编译器和GCC对 workshare语句进行了序列化并在OpenMP FORALL指令内部进行了构造,方法是在编译过程中将它们与OpenMP workshare指令一起包围,这丝毫不会提高速度。其他编译器可能会以不同的方式实现它,但是如果要实现可移植的性能,最好避免使用它。

关于parallel-processing - 系统地并行化fortran 2008 `do concurrent`,可能与openmp并行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11550432/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com