fortran - 为什么按元素矩阵行交换比 Fortran 中按数组行交换更有效？-6ren

fortran - 为什么按元素矩阵行交换比 Fortran 中按数组行交换更有效？

转载作者：行者123 更新时间：2023-12-05 03:49:06

26

4

我有一些执行矩阵行交换的 Fortran 代码。在遗留代码中，它写成

do J = 1,N
   save_val  = B(IROW,J)
   B(IROW,J) = B(JCOL,J)
   B(JCOL,J) = save_val
end do

这会将 IROW 行与 JCOL 行进行交换(IROW 和 JCOL 是整数)。但是，该代码块的功能并不直观。在我看来，这样写会更直观，或者至少有助于提高可读性:

save_row  = B(IROW,:)
B(IROW,:) = B(JCOL,:)
B(JCOL,:) = save_row

(更清楚的是行正在移动)。

从附图中可以清楚地看出，循环方法相对于数组操作提供了更好的性能。为什么是这样？是因为当数组中的元素数量变大时，这会变成一个内存受限的过程吗？ (即数组会被“分块”)还是其他原因？

编译为 gfortran -O3 test.f95。添加标志 fstack-arrays 没有产生显着差异。

program test

  implicit none

  integer  :: N
  integer  :: M
  integer  :: loop_max = 1e7
  integer  :: i                    ! loop index
  real     :: t1, t2
  real     :: time_loop, time_array, time_sub_loop, time_sub_array

  real, dimension(:, :), allocatable   :: B
  real, dimension(:)   , allocatable   :: save_row

  real :: save_val
  integer :: IROW, J, JCOL

  character(*), parameter :: format_header = '(A5, 1X, 4(A12,1X))'
  character(*), parameter :: format_data = '(I5, 1X, 4(ES12.5, 1X))'


  open(1, file = 'TimingRowExchange.txt', status = 'unknown')
  write(1, format_header) 'N', 't_loop', 't_array', 't_sub_loop', 't_sub_array'

  do N = 1, 100
    M = N + 1
    allocate(B(N,N), save_row(M))
    call random_number(B)

    JCOL = 1
    IROW = 3

    call CPU_time(t1)
    do i = 1, loop_max
      do J = 1,N
        save_val  = B(IROW,J)
        B(IROW,J) = B(JCOL,J)
        B(JCOL,J) = save_val
      end do
    end do
    call CPU_time(t2)
    time_loop = t2 - t1
    ! write ( *, * ) 'Using Loop =', t2 - t1


    call CPU_time(t1)
    do i = 1, loop_max
        save_row(1:N) = B(IROW,:)
        B(IROW,:)     = B(JCOL,:)
        B(JCOL,:)     = save_row(1:N)
    end do
    call CPU_time(t2)
    time_array = t2 - t1
    ! write ( *, * ) 'Using Array =', t2 - t1

    call CPU_time(t1)
    do i = 1, loop_max
      call exchange_rows_loop(B, JCOL, IROW)
    end do
    call CPU_time(t2)
    time_sub_loop = t2 - t1
    ! write ( *, * ) 'Loop Subrout =', t2 - t1


    call CPU_time(t1)
    do i = 1, loop_max
      call exchange_rows_array(B, JCOL, IROW)
    end do
    call CPU_time(t2)
    time_sub_array = t2 - t1
    ! write ( *, * ) 'Array Subrout =', t2 - t1

    deallocate(B, save_row)
    write(1, format_data) N, time_loop, time_array, time_sub_loop, time_sub_array
  end do


contains


  subroutine print_mat(A)
    implicit none
    real, dimension(:,:), intent(in) :: A
    integer :: n

    n = size(A,1) ! # of rows

    do i = 1,n
      print*, A(i,:)
    end do
    print*,

  end subroutine print_mat



  subroutine exchange_rows_loop(A, row1, row2)
    implicit none
    real, dimension(:,:), intent(in out) :: A
    integer,              intent(in)     :: row1, row2

    integer :: J
    real :: save_val

    do J = 1, size(A,1)
      save_val  = A(row1,J)
      A(row1,J) = A(row2,J)
      A(row2,J) = save_val
    end do

  end subroutine exchange_rows_loop



  subroutine exchange_rows_array(A, row1, row2)
    implicit none
    real, dimension(:,:), intent(in out) :: A
    integer,              intent(in)     :: row1, row2

    real, dimension(size(A,1))           :: save_row

    save_row  = A(row1,:)
    A(row1,:) = A(row2,:)
    A(row2,:) = save_row

  end subroutine exchange_rows_array


end program test

最佳答案

我对 Fortran 哲学(优势)的理解是，该语言应该帮助用户专注于科学，同时处理大多数与计算机相关的事情，例如速度优化、垃圾收集等。

通过 pure/elemental 函数和子例程的函数式编程风格是恕我直言，已被引入但未得到充分利用的最伟大的工具之一，因为它使代码更清晰、更简单且更丰富健壮。

所以我又添加了一个带有 elemental 交换例程的测试:

  subroutine exchange_rows_elemental(A, row1, row2)
    implicit none
    real, dimension(:,:), intent(in out) :: A
    integer,              intent(in)     :: row1, row2
    call swap(A(row1,:),A(row2,:))
  end subroutine exchange_rows_elemental  

  elemental subroutine swap(a,b)
     real, intent(inout) :: a,b
     real :: save_val
     save_val = a
     a = b
     b = save_val
  end subroutine swap

主要是:

call CPU_time(t1)
do i = 1, loop_max
  call exchange_rows_elemental(B, JCOL, IROW)
end do
call CPU_time(t2)
time_elemental = t2 - t1
! write ( *, * ) 'Elemental =', t2 - t1

这是我在 Windows 上使用 gfortran 9.2.0 得到的结果:

elemental 版本几乎与最快的循环版本一样快，但它可能以矢量化方式运行。我确定在这种情况下，编译器可能正在内联 swap 例程(如果它在另一个文件中，它可能无法这样做)，但仍然告诉编译器 swap 例程可以矢量化可能有助于它实现最佳性能。我喜欢它，因为它是一种很好的方式，可以充分利用编译器优化，而不会用嵌套循环和循环变量使源代码困惑。

关于fortran - 为什么按元素矩阵行交换比 Fortran 中按数组行交换更有效？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/64119063/

26

4

0

文章推荐： c# - Prism WPF 动态区域

fortran - Fortran 2008 是否向后兼容以前的 Fortran 版本？
是的，我知道..，这不是想象的...这是一个真正的 Fortran 问题。以前的版本是指 Fortran 2003、95、90，甚至 77。我所说的“向后兼容”是指可以轻松运行为 2008 年以前
fortran - 能否将一个值从一个 Fortran 程序传递到另一个 Fortran 程序？
我有一个程序，它的变量中有一个值。一旦确定了该值，我想调用另一个程序并使用该变量的值来确定在新程序中的位置。有人知道该怎么做吗？最佳答案如果您有 Fortran 2008 编译器，您将拥有标准子例
fortran - Fortran 中的嵌套名单
namelist 是一种有用的 fortran 结构，可以从文件中快速初始化变量。 namelist 有一个名称并包含一组具有已知类型的变量。这使得它类似于 type 结构。通常情况下，给程序或子例
fortran - Fortran 能否在逻辑运算中强制遵守参数顺序？
我正在遍历索引，我正在检查我是否不在第一个循环交互和另一个条件中。如果第一个条件是 .False.，我不想评估第二个条件。 do i = 1, n if ( i /= 1 .and. var(
fortran - Fortran 中的二维数组串联
Fortran 2003 具有用于数组连接的方括号语法，Intel fortran 编译器也支持它。我在这里为矩阵连接写了一个简单的代码: program matrix implicit none r
fortran - Fortran 中未调用派生类型的自定义构造函数
我正在尝试通过重载类型名称来制作自定义数据类型构造函数。但是，在进行调用时，将调用默认构造函数。我不明白我做错了什么。这是有问题的代码片段。 module test type, pu
fortran - Fortran 中的通用映射函数
我的最终目标是在 Fortran 中有一个通用的映射函数，即一个接受任意类型 A 的数组和一个 A->B 类型的函数的函数，将此函数应用于给定数组的所有元素并返回一个B 类型的数组。我无法用数组实现它
fortran - Fortran 格式描述符的问题
我正在学习 Fortran，在使用格式编写时发现了一些奇怪的东西(我使用的是 Fortran onlinegdb) Program Hello real, dimension(3,2):: array
fortran - Fortran 是多调度编程语言吗？
Fortran 中的INTERFACE 语句是否使其成为正式实现multiple dispatch 的编程语言？？ (我问是因为所链接的维基百科文章在其看似全面的支持相关范式的示例编程语言列表中并未
fortran - Fortran 90 和 Fortran 95 之间的区别
我可以使用 Fortran 95 编译器编译 Fortran 90 文件吗？ Fortran 95 似乎有很多，但 Fortran 90 没有。最佳答案这个可以: NAGWare f95 Comp
fortran - Fortran 中的二维边界条件
嗨，我在 Fortran 中对二维离散化问题强加边界条件时遇到了麻烦。我的离散化网格是一个二维正方形，在 x,y 方向上从 -L 到 L。我想强加这样的边界条件，在 x=L 的边界线上，指定了函数
fortran - Fortran 中的断言
Fortran 是否有与 C assert 等效的标准函数/关键字？ ? 我找不到 assert我在Fortran2003标准中提到过。我发现了一些如何使用预处理器的方法，但是在这个 answer建议
fortran - FORTRAN 90中同一行上的多个语句
我有一系列的作业，使用“;”将它们分配给同一个ike。分开statemnts，但我收到此错误: 1.0;磅(1,9) 1个错误:(1)处无法分类的陈述在文件LJ.F90:223中如果每个语句都在
fortran - Fortran 中的自动数组释放
我正在使用 gfortran -std=f2008。我有一个函数，它返回一个包含可分配数组的派生类型。该函数在返回之前调用allocate()。似乎在分配数组的函数返回之后，数组会自动释放一段时间，并
fortran - Fortran 数组边界检查的运行时检查未触发
我制作了这个小型测试程序来“证明”在编译之前(或者如果你让它们可分配)，你不能在不指定它们的大小的情况下使用向量。我的观点失败了。我期待本地向量“num”会失败。程序在执行程序之前无法知道它的大小。大
fortran - Fortran 函数中的别名
出于优化原因，Fortran 强制子例程或函数的虚拟参数不是别名，即它们不指向相同的内存位置。我想知道相同的约束是否适用于函数的返回值。换句话说，对于给定的 myfunc 函数: function
fortran - Fortran 90中的堆栈溢出
我已经在Fortran 90中编写了一个相当大的程序。它已经运行了一段时间了，但是今天我尝试将其提高一个档次并增加问题的大小(这是研究非标准的有限元求解器，如果那样的话)。可以帮助任何人...)现在，
fortran - Fortran 是否有未定义的行为？
在 C 和 C++ 中，有许多操作会导致未定义的行为，即允许编译器做任何它想做的事情的情况。 Examples包括在释放变量后使用它，释放变量两次和取消引用空指针。 Fortran 是否也有未定义的行
fortran - Fortran 可以在终端中有输入和输出命令提示符吗？
通常我使用fortran进行数值分析，然后使用matlab、R和python进行后期和前期工作。我发现 matlab、R 和 python 在终端中提供了命令提示符，以便您可以运行脚本以及从命令行立
fortran - Fortran 中的无穷大
在 Fortran 中将变量设置为 +Infinity 的最安全方法是什么？目前我正在使用: program test implicit none print *,infinity() con

首页

博学

6Ren·AI

商城

fortran - 为什么按元素矩阵行交换比 Fortran 中按数组行交换更有效？