fortran - Fortran 中的向量化总和-6ren

fortran - Fortran 中的向量化总和

转载作者：行者123 更新时间：2023-12-02 12:13:51

24

4

我正在使用 gfortran 和 -mavx 编译我的 Fortran 代码，并已验证某些指令是通过 objdump 进行矢量化的code>，但我没有获得预期的速度提升，因此我想确保以下参数被矢量化(这条指令大约占运行时的 50%)。

我知道有些指令可以矢量化，而其他指令则不能，所以我想确保可以:

sum(A(i1:i2,ir))

同样，这一行占用了大约 50% 的运行时间，因为我是在一个非常大的矩阵上执行此操作。我可以提供更多关于为什么我这样做的信息，但只要说这是必要的就足够了，尽管我可以在必要时重组内存(例如，我可以将总和作为 sum(A(ir,i1:i2)) 如果可以向量化的话。

这条线是否被矢量化？我怎么知道？如果没有进行矢量化，如何强制矢量化？

编辑:感谢这些评论，我现在意识到我可以通过 -ftree-vectorizer-verbose 检查此求和的矢量化，并发现这不是矢量化。我已将代码重组如下:

tsum = 0.0d0
tn = i2 - i1 + 1
tvec(1:tn) = A(i1:i2, ir)
do ii = 1,tn
    tsum = tsum + tvec(ii)
enddo

并且这个仅在我打开-funsafe-math-optimizations时进行矢量化，但由于矢量化，我确实看到速度又提高了 70%。问题仍然存在:为什么 sum(A(i1:i2,ir)) 不矢量化以及如何获得简单的 sum 进行矢量化？

最佳答案

事实证明，除非包含 -ffast-math 或 -funsafe-math-optimizations，否则我无法使用矢量化。

我使用的两个代码片段是:

tsum = 0.0d0
tvec(1:n) = A(i1:i2, ir)
do ii = 1,n
    tsum = tsum + tvec(ii)
enddo

和

tsum = sum(A(i1:i2,ir))

这是我使用不同编译选项运行第一个代码片段时得到的时间:

10.62 sec ... None
10.35 sec ... -mtune=native -mavx
 7.44 sec ... -mtune-native -mavx -ffast-math
 7.49 sec ... -mtune-native -mavx -funsafe-math-optimizations

最后，通过这些相同的优化，我可以对 tsum = sum(A(i1:i2,ir)) 进行矢量化以获得

 7.96 sec ... None
 8.41 sec ... -mtune=native -mavx
 5.06 sec ... -mtune=native -mavx -ffast-math
 4.97 sec ... -mtune=native -mavx -funsafe-math-optimizations

当我们将 sum 和 -mtune=native -mavx 与 -mtune=native -mavx -funsafe-math-optimizations 进行比较时，显示出约 70% 的加速。 (请注意，这些仅运行一次 - 在我们发布之前，我们将对多次运行进行真正的基准测试)。

不过我确实受到了一点打击。当我使用 -f 选项时，我的值会略有变化。如果没有它们，我的变量(v1、v2)的错误是:

v1 ... 5.60663e-15     9.71445e-17     1.05471e-15
v2 ... 5.11674e-14     1.79301e-14     2.58127e-15

但是通过优化，错误是:

v1 ... 7.11931e-15     5.39846e-15     3.33067e-16
v2 ... 1.97273e-13     6.98608e-14     2.17742e-14

这表明确实发生了一些不同的事情。

关于fortran - Fortran 中的向量化总和，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/32257244/

24

4

0

文章推荐： vba - 工作簿名称何时需要扩展名？

文章推荐： numbers - ASM 比较 2 个数字

文章推荐： excel - 在 Rails 中将 Excel 单元格从数字格式化为文本

fortran - Fortran 2008 是否向后兼容以前的 Fortran 版本？
是的，我知道..，这不是想象的...这是一个真正的 Fortran 问题。以前的版本是指 Fortran 2003、95、90，甚至 77。我所说的“向后兼容”是指可以轻松运行为 2008 年以前
fortran - 能否将一个值从一个 Fortran 程序传递到另一个 Fortran 程序？
我有一个程序，它的变量中有一个值。一旦确定了该值，我想调用另一个程序并使用该变量的值来确定在新程序中的位置。有人知道该怎么做吗？最佳答案如果您有 Fortran 2008 编译器，您将拥有标准子例
fortran - Fortran 中的嵌套名单
namelist 是一种有用的 fortran 结构，可以从文件中快速初始化变量。 namelist 有一个名称并包含一组具有已知类型的变量。这使得它类似于 type 结构。通常情况下，给程序或子例
fortran - Fortran 能否在逻辑运算中强制遵守参数顺序？
我正在遍历索引，我正在检查我是否不在第一个循环交互和另一个条件中。如果第一个条件是 .False.，我不想评估第二个条件。 do i = 1, n if ( i /= 1 .and. var(
fortran - Fortran 中的二维数组串联
Fortran 2003 具有用于数组连接的方括号语法，Intel fortran 编译器也支持它。我在这里为矩阵连接写了一个简单的代码: program matrix implicit none r
fortran - Fortran 中未调用派生类型的自定义构造函数
我正在尝试通过重载类型名称来制作自定义数据类型构造函数。但是，在进行调用时，将调用默认构造函数。我不明白我做错了什么。这是有问题的代码片段。 module test type, pu
fortran - Fortran 中的通用映射函数
我的最终目标是在 Fortran 中有一个通用的映射函数，即一个接受任意类型 A 的数组和一个 A->B 类型的函数的函数，将此函数应用于给定数组的所有元素并返回一个B 类型的数组。我无法用数组实现它
fortran - Fortran 格式描述符的问题
我正在学习 Fortran，在使用格式编写时发现了一些奇怪的东西(我使用的是 Fortran onlinegdb) Program Hello real, dimension(3,2):: array
fortran - Fortran 是多调度编程语言吗？
Fortran 中的INTERFACE 语句是否使其成为正式实现multiple dispatch 的编程语言？？ (我问是因为所链接的维基百科文章在其看似全面的支持相关范式的示例编程语言列表中并未
fortran - Fortran 90 和 Fortran 95 之间的区别
我可以使用 Fortran 95 编译器编译 Fortran 90 文件吗？ Fortran 95 似乎有很多，但 Fortran 90 没有。最佳答案这个可以: NAGWare f95 Comp
fortran - Fortran 中的二维边界条件
嗨，我在 Fortran 中对二维离散化问题强加边界条件时遇到了麻烦。我的离散化网格是一个二维正方形，在 x,y 方向上从 -L 到 L。我想强加这样的边界条件，在 x=L 的边界线上，指定了函数
fortran - Fortran 中的断言
Fortran 是否有与 C assert 等效的标准函数/关键字？ ? 我找不到 assert我在Fortran2003标准中提到过。我发现了一些如何使用预处理器的方法，但是在这个 answer建议
fortran - FORTRAN 90中同一行上的多个语句
我有一系列的作业，使用“;”将它们分配给同一个ike。分开statemnts，但我收到此错误: 1.0;磅(1,9) 1个错误:(1)处无法分类的陈述在文件LJ.F90:223中如果每个语句都在
fortran - Fortran 中的自动数组释放
我正在使用 gfortran -std=f2008。我有一个函数，它返回一个包含可分配数组的派生类型。该函数在返回之前调用allocate()。似乎在分配数组的函数返回之后，数组会自动释放一段时间，并
fortran - Fortran 数组边界检查的运行时检查未触发
我制作了这个小型测试程序来“证明”在编译之前(或者如果你让它们可分配)，你不能在不指定它们的大小的情况下使用向量。我的观点失败了。我期待本地向量“num”会失败。程序在执行程序之前无法知道它的大小。大
fortran - Fortran 函数中的别名
出于优化原因，Fortran 强制子例程或函数的虚拟参数不是别名，即它们不指向相同的内存位置。我想知道相同的约束是否适用于函数的返回值。换句话说，对于给定的 myfunc 函数: function
fortran - Fortran 90中的堆栈溢出
我已经在Fortran 90中编写了一个相当大的程序。它已经运行了一段时间了，但是今天我尝试将其提高一个档次并增加问题的大小(这是研究非标准的有限元求解器，如果那样的话)。可以帮助任何人...)现在，
fortran - Fortran 是否有未定义的行为？
在 C 和 C++ 中，有许多操作会导致未定义的行为，即允许编译器做任何它想做的事情的情况。 Examples包括在释放变量后使用它，释放变量两次和取消引用空指针。 Fortran 是否也有未定义的行
fortran - Fortran 可以在终端中有输入和输出命令提示符吗？
通常我使用fortran进行数值分析，然后使用matlab、R和python进行后期和前期工作。我发现 matlab、R 和 python 在终端中提供了命令提示符，以便您可以运行脚本以及从命令行立
fortran - Fortran 中的无穷大
在 Fortran 中将变量设置为 +Infinity 的最安全方法是什么？目前我正在使用: program test implicit none print *,infinity() con

首页

博学

6Ren·AI

商城

fortran - Fortran 中的向量化总和