- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试使用 OpenMP 并行运行涡流模拟代码。这些类似于粒子模拟,其中在每个时间步长,必须根据其速度计算下一个时间步长的涡流位置,该速度由当前时间步长的所有其他涡流的位置确定。一旦离开域,涡流就会被删除。我比较并行版本代码和串行版本代码在每个时间步的涡流数量,并多次运行每个版本。
对于串行版本,涡流计数在每个时间步都完全匹配。对于并行情况,在几十个时间步长内,所有运行都与串行情况匹配,之后,每个并行运行都显示出差异,但与串行情况保持在 7-10% 的误差范围内(如中所示下面的结果链接)。我知道这可能是由于并行情况下由于不同线程之间的分布导致计算步骤顺序不同而导致的舍入误差,但误差真的应该高达 10% 吗?
我只在并行 do 构造中使用了 reduction 子句。整个代码中唯一的并行区域是函数 vblob()
内,它位于模块内,我从主代码中调用它。 vblob()
内的所有函数调用都是ixi()
,fxi()
在这个模块之外。
function vblob(blobs,xj,gj)
complex(8), intent(in) :: blobs(:,:), xj
complex(8) :: delxi, delxic, di, gvic, xi
real(8), intent(in) :: gj
real(8) :: vblob(2)
integer :: p
gvic = 0.0; delxi = 0.0; delxic = 0.0; di = 0.0; xi = 0.0
!$omp parallel do private(xi,delxic,delxi,di) shared(xj) reduction(+:gvic)
do p = 1, size(blobs,1)
xi = ixi(blobs(p,1))
delxic = xj-conjg(xi)
delxi = xj-xi
di = del*fxi(xi)
gvic = gvic + real(blobs(p,2))*1/delxic
if (abs(delxi) .gt. 1.E-4) then
gvic = gvic + (-1)*real(blobs(p,2))*1/delxi
end if
end do
!$omp end parallel do
gvic = j*gvic*fxi(xj)/(2*pi)
vblob(1) = real(gvic)
vblob(2) = -imag(gvic)
end function vblob
如果我构建并行代码的方式是错误的,那么错误应该从前几个时间步开始就出现了,对吧?
(在这个result中可以看出,'blobs'和'sheets'只是涡旋元素的类型,蓝线是总元素。P和S分别代表Parallel和Serial, R代表runs,实心的plot marker是串行代码,空心的是并行代码的三轮)
编辑:当我将变量的数值精度更改为 real(4) 时,结果中的分歧发生在比上面的 real(8) 情况更早的时间步长。所以这显然是一个舍入错误问题。
TLDR:我想与任何其他在一定时间步长范围内看到此类结果的人一起澄清这一点,其中并行代码在前几个时间步长匹配然后发散?
最佳答案
您的代码基本上总结了 gvic
中的很多术语。浮点运算不是关联的,即 (a+b)+c
由于四舍五入而与 a+(b+c)
不同。此外,根据条款上的值和符号,每次操作可能会严重损失精度。参见 here对于真正必读的主题。
当顺序循环计算时(假设没有聪明的编译器优化):
gvic = (...((((g_1 + g_2) + g_3) + g_4) + g_5) + ...)
其中 g_i
是通过迭代 i
添加到 gvic
的值,并行版本计算:
gvic = t_0 + t_1 + t_2 + ... t_(#threads-1)
其中t_i
是线程i
中gvic
的累积私有(private)值(OpenMP 中的线程即使在Fortran 中也是0 编号)。未指定不同 t_i
的缩减顺序。 OpenMP 实现可以自由选择它认为合适的任何内容。即使所有的 t_i
都按顺序求和,结果仍然与顺序循环计算的结果不同。不稳定的数值算法在并行化时特别容易产生不同的结果。
这是您很难完全避免的事情,而是学会控制或简单地接受其后果。在许多情况下,问题的数值解无论如何都是一个近似值。您应该关注守恒或统计属性。例如,遍历分子动力学模拟可能会并行产生完全不同的相轨迹,但总能量或热力学平均值等值将非常接近(除非存在一些严重的算法错误或非常糟糕的数值不稳定性)。
旁注 - 您现在进入这个领域实际上很幸运,因为大多数 CPU 使用标准的 32 位和 64 位浮点运算。多年前,当 x87 流行时,浮点运算以 80 位内部精度完成,最终结果将取决于值离开并重新进入 FPU 寄存器的次数。
关于fortran - 与串行和附加并行运行相比,并行仿真在一些时间步后给出不同的结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62848699/
是的,我知道..,这不是想象的...这是一个真正的 Fortran 问题。 以前的版本是指 Fortran 2003、95、90,甚至 77。 我所说的“向后兼容”是指可以轻松运行为 2008 年以前
我有一个程序,它的变量中有一个值。一旦确定了该值,我想调用另一个程序并使用该变量的值来确定在新程序中的位置。有人知道该怎么做吗? 最佳答案 如果您有 Fortran 2008 编译器,您将拥有标准子例
namelist 是一种有用的 fortran 结构,可以从文件中快速初始化变量。 namelist 有一个名称并包含一组具有已知类型的变量。这使得它类似于 type 结构。 通常情况下,给程序或子例
我正在遍历索引,我正在检查我是否不在第一个循环交互和另一个条件中。如果第一个条件是 .False.,我不想评估第二个条件。 do i = 1, n if ( i /= 1 .and. var(
Fortran 2003 具有用于数组连接的方括号语法,Intel fortran 编译器也支持它。我在这里为矩阵连接写了一个简单的代码: program matrix implicit none r
我正在尝试通过重载类型名称来制作自定义数据类型构造函数。但是,在进行调用时,将调用默认构造函数。我不明白我做错了什么。 这是有问题的代码片段。 module test type, pu
我的最终目标是在 Fortran 中有一个通用的映射函数,即一个接受任意类型 A 的数组和一个 A->B 类型的函数的函数,将此函数应用于给定数组的所有元素并返回一个B 类型的数组。我无法用数组实现它
我正在学习 Fortran,在使用格式编写时发现了一些奇怪的东西(我使用的是 Fortran onlinegdb) Program Hello real, dimension(3,2):: array
Fortran 中的INTERFACE 语句是否使其成为正式实现multiple dispatch 的编程语言? ? (我问是因为所链接的维基百科文章在其看似全面的支持相关范式的示例编程语言列表中并未
我可以使用 Fortran 95 编译器编译 Fortran 90 文件吗? Fortran 95 似乎有很多,但 Fortran 90 没有。 最佳答案 这个可以: NAGWare f95 Comp
嗨,我在 Fortran 中对二维离散化问题强加边界条件时遇到了麻烦。我的离散化网格是一个二维正方形,在 x,y 方向上从 -L 到 L。 我想强加这样的边界条件, 在 x=L 的边界线上,指定了函数
Fortran 是否有与 C assert 等效的标准函数/关键字? ? 我找不到 assert我在Fortran2003标准中提到过。我发现了一些如何使用预处理器的方法,但是在这个 answer建议
我有一系列的作业,使用“;”将它们分配给同一个ike。分开statemnts,但我收到此错误: 1.0;磅(1,9) 1个 错误:(1)处无法分类的陈述 在文件LJ.F90:223中 如果每个语句都在
我正在使用 gfortran -std=f2008。我有一个函数,它返回一个包含可分配数组的派生类型。该函数在返回之前调用allocate()。似乎在分配数组的函数返回之后,数组会自动释放一段时间,并
我制作了这个小型测试程序来“证明”在编译之前(或者如果你让它们可分配),你不能在不指定它们的大小的情况下使用向量。我的观点失败了。我期待本地向量“num”会失败。程序在执行程序之前无法知道它的大小。大
出于优化原因,Fortran 强制子例程或函数的虚拟参数不是别名,即它们不指向相同的内存位置。 我想知道相同的约束是否适用于函数的返回值。 换句话说,对于给定的 myfunc 函数: function
我已经在Fortran 90中编写了一个相当大的程序。它已经运行了一段时间了,但是今天我尝试将其提高一个档次并增加问题的大小(这是研究非标准的有限元求解器,如果那样的话)。可以帮助任何人...)现在,
在 C 和 C++ 中,有许多操作会导致未定义的行为,即允许编译器做任何它想做的事情的情况。 Examples包括在释放变量后使用它,释放变量两次和取消引用空指针。 Fortran 是否也有未定义的行
通常我使用fortran进行数值分析,然后使用matlab、R和python进行后期和前期工作。 我发现 matlab、R 和 python 在终端中提供了命令提示符,以便您可以运行脚本以及从命令行立
在 Fortran 中将变量设置为 +Infinity 的最安全方法是什么?目前我正在使用: program test implicit none print *,infinity() con
我是一名优秀的程序员,十分优秀!