fortran - 使用 MPI IO 编写多个分布式数组-6ren

fortran - 使用 MPI IO 编写多个分布式数组

转载作者：行者123 更新时间：2023-12-02 16:16:10

我正在重写一个数值模拟代码，该代码在一个方向上使用 MPI 并行化。到目前为止，包含数据的数组由主 MPI 进程保存，这意味着将所有 MPI 进程的数据传输到一个进程，并分配巨大的数组来存储整个数据。它不是很高效，也不是很优雅，并且对于大分辨率来说是一个问题。

因此，我尝试使用 MPI-IO 直接从分布式数组写入文件。我的限制之一是写入的文件需要遵循 fortran“未格式化”格式(即每个字段前后有 4 个字节整数指示其大小)。

我编写了一个简单的测试程序，当我仅将一个分布式数组写入文件时，该程序可以工作。但是，当我写入多个数组时，文件的总大小是错误的，并且与等效的 fortran“未格式化”文件相比，文件是不同的。

这里是示例代码:

module arrays_dim
   implicit none
   INTEGER,        PARAMETER :: dp   = kind(0.d0) 
   integer,        parameter :: imax = 500 
   integer,        parameter :: jmax = 50 
   integer,        parameter :: kmax = 10 
end module arrays_dim
module mpi_vars
   use mpi 
   implicit none
   integer, save          :: ierr, myID, numprocs
   integer, save          :: i_start, i_end, i_mean, i_loc
   integer, save          :: subArray, fileH
   integer(MPI_OFFSET_KIND), save   :: offset, currPos
end module mpi_vars

program test
   use mpi 
   use arrays_dim
   use mpi_vars
   real(dp), dimension(0:imax,0:jmax+1,0:kmax+1) :: v, w
   real(dp), dimension(:,:,:), allocatable       :: v_loc, w_loc
   integer                                       :: i, j, k

   call MPI_INIT(ierr) 
   call MPI_COMM_RANK(MPI_COMM_WORLD, myID, ierr) 
   call MPI_COMM_SIZE(MPI_COMM_WORLD, numprocs, ierr) 

   i_mean = (imax+1)/numprocs
   i_start = myID*i_mean
   i_end   = i_start+i_mean-1
   if(i_mean*numprocs<imax+1) then 
    if(myID == numprocs-1) i_end = imax
   endif
   i_loc = i_end - i_start + 1
   allocate(v_loc(i_start:i_end,0:jmax+1,0:kmax+1))
   allocate(w_loc(i_start:i_end,0:jmax+1,0:kmax+1))

   print*, 'I am:', myID, i_start, i_end, i_loc
   do k=0,kmax+1
      do j=0,jmax+1
         do i=0,imax
            v(i,j,k) = i+j+k
            w(i,j,k) = i*j*k
         enddo
      enddo
   enddo

   if(myID==0) then 
       open(10,form='unformatted')
       write(10) v
       !write(10) w
       close(10)
   endif

   do k=0,kmax+1
      do j=0,jmax+1
         do i=i_start,i_end
            v_loc(i,j,k) = i+j+k
            w_loc(i,j,k) = i*j*k
         enddo
      enddo
   enddo

   call MPI_Type_create_subarray (3, [imax+1, jmax+2, kmax+2], [i_loc, jmax+2, kmax+2], &
                                     [i_start, 0, 0], &
                                    MPI_ORDER_FORTRAN, MPI_DOUBLE_PRECISION, subArray,  ierr)
   call MPI_Type_commit(subArray, ierr)
   call MPI_File_open(MPI_COMM_WORLD, 'mpi.dat',         &
                     MPI_MODE_WRONLY + MPI_MODE_CREATE + MPI_MODE_APPEND, &
                     MPI_INFO_NULL, fileH, ierr )   


   call saveMPI(v_loc, (i_loc)*(jmax+2)*(kmax+2))
   !call saveMPI(w_loc, (i_loc)*(jmax+2)*(kmax+2))

   call MPI_File_close(fileH, ierr)      

   deallocate(v_loc,w_loc)
   call MPI_FINALIZE(ierr) 
end program test
!
subroutine saveMPI(array, n)
   use mpi
   use arrays_dim
   use mpi_vars

   implicit none
   real(dp), dimension(n) :: array
   integer                   :: n

   offset = (imax+1)*(jmax+2)*(kmax+2)*8
   if(myID==0) then
     call MPI_File_seek(fileH, int(0,MPI_OFFSET_KIND), MPI_SEEK_CUR, ierr)
     call MPI_File_write(fileH, [(imax+1)*(jmax+2)*(kmax+2)*8], 1, MPI_INTEGER, MPI_STATUS_IGNORE, ierr)
     call MPI_File_seek(fileH, offset, MPI_SEEK_CUR, ierr)
     call MPI_File_write(fileH, [(imax+1)*(jmax+2)*(kmax+2)*8], 1, MPI_INTEGER, MPI_STATUS_IGNORE, ierr)
   endif 
   call MPI_File_set_view(fileH, int(4,MPI_OFFSET_KIND), MPI_DOUBLE_PRECISION, subArray, 'native', MPI_INFO_NULL, ierr)
   call MPI_File_write_all(fileH, array, (i_loc)*(jmax+2)*(kmax+2), MPI_DOUBLE_PRECISION, MPI_STATUS_IGNORE, ierr)  
end subroutine saveMPI

当行 !write(10) w 和 !call saveMPI(w_loc, (i_loc)*(jmax+2)*(kmax+2)) 为评论(即我只写 v 数组)，代码工作正常:

mpif90.openmpi -O3 -o prog main.f90
mpirun.openmpi -np 4 ./prog
cmp mpi.dat fort.10

cmp 不生成输出，因此文件是相同的。但是，如果我取消注释这些行，则生成的文件(mpi.dat 和 fort.10)会有所不同。我确信问题在于我定义用于将数据写入文件上正确位置的偏移量的方式，但我不知道如何向 saveMPI 的第二次调用指示初始位置应该是结束位置文件的。我缺少什么？

最佳答案

只有第一次调用 saveMPI 才能按您的预期工作。从第二次通话开始，一切都变得一团糟。以下是正在发生的事情的一些迹象:

MPI_File_set_view 将独立文件指针和共享文件指针重置为零。请参阅MPI_File_set_view更多细节。因此，当您在 saveMPI 中调用 MPI_File_set_view 时，实际上是用 w 数据覆盖 v 数据。
与 MPI_File_write ，数据被写入当前 View 指定的文件部分。这意味着您将大小信息添加到文件中的方式与之前为 v 设置的 View 并不真正兼容。
使用MPI_SEEK_CUR调用MPI_File_seek设置相对于单个指针当前位置的位置。所以，对于第二次调用，它是相对于进程0的个体指针

我不太使用并行 IO，所以我无法提供更多帮助，除非我进入文档，但我没有时间。我可以给出的提示是:

向 saveMPI 添加一个附加参数，其中包含要写入的数据的绝对位移；这可以是一个[in out] arg。对于第一次调用，它将为零，对于后续调用，它将是已写入文件的所有数据的大小，包括大小信息。可以在 saveMPI 中更新它。
在写入大小信息(通过进程 0)之前，调用 MPI_File_set_view 将 View 重置为线性字节流，如 MPI_File_open 最初给出的那样。这可以通过在调用 MPI_File_set_view 时将 etype 和 filetype 设置为 MPI_BYTE 来完成。查看doc of MPI_File_open了解更多信息。然后，您必须在 saveMPI 中调用 MPI_File_set_view。

您的 saveMPI 子例程可能如下所示

subroutine saveMPI(array, n, disp)
    use mpi
    use arrays_dim
    use mpi_vars

    implicit none
    real(dp), dimension(n) :: array
    integer                   :: n, disp

    offset = (imax+1)*(jmax+2)*(kmax+2)*8
    call MPI_File_set_view(fileH, int(disp,MPI_OFFSET_KIND), MPI_BYTE, MPI_BYTE, 'native', MPI_INFO_NULL, ierr)
    if(myID==0) then
        call MPI_File_seek(fileH, int(0,MPI_OFFSET_KIND), MPI_SEEK_END, ierr)
        call MPI_File_write(fileH, [(imax+1)*(jmax+2)*(kmax+2)*8], 1, MPI_INTEGER, MPI_STATUS_IGNORE, ierr)
        call MPI_File_seek(fileH, int(offset,MPI_OFFSET_KIND), MPI_SEEK_CUR, ierr)
        call MPI_File_write(fileH, [(imax+1)*(jmax+2)*(kmax+2)*8], 1, MPI_INTEGER, MPI_STATUS_IGNORE, ierr)
    endif
    call MPI_File_set_view(fileH, int(disp+4,MPI_OFFSET_KIND), MPI_DOUBLE_PRECISION, subArray, 'native', MPI_INFO_NULL, ierr)
    call MPI_File_write_all(fileH, array, (i_loc)*(jmax+2)*(kmax+2), MPI_DOUBLE_PRECISION, MPI_STATUS_IGNORE, ierr)
    disp = disp+offset+8
end subroutine saveMPI

并调用如下:

disp = 0
call saveMPI(v_loc, (i_loc)*(jmax+2)*(kmax+2), disp)
call saveMPI(w_loc, (i_loc)*(jmax+2)*(kmax+2), disp)

最后，请确保在两次调用之间删除该文件，因为您正在使用 MPI_MODE_APPEND。

关于fortran - 使用 MPI IO 编写多个分布式数组，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/32280100/

文章推荐： java - 将基本数组中的值添加到 Set

文章推荐： java - 将 JSON 数组发布到 Spring Boot RestController 中

文章推荐： java - 继承两个Java类

文章推荐： java - JAVA 字节消耗的全局与局部(变量和列表)

fortran - Fortran 2008 是否向后兼容以前的 Fortran 版本？
是的，我知道..，这不是想象的...这是一个真正的 Fortran 问题。以前的版本是指 Fortran 2003、95、90，甚至 77。我所说的“向后兼容”是指可以轻松运行为 2008 年以前
fortran - 能否将一个值从一个 Fortran 程序传递到另一个 Fortran 程序？
我有一个程序，它的变量中有一个值。一旦确定了该值，我想调用另一个程序并使用该变量的值来确定在新程序中的位置。有人知道该怎么做吗？最佳答案如果您有 Fortran 2008 编译器，您将拥有标准子例
fortran - Fortran 中的嵌套名单
namelist 是一种有用的 fortran 结构，可以从文件中快速初始化变量。 namelist 有一个名称并包含一组具有已知类型的变量。这使得它类似于 type 结构。通常情况下，给程序或子例
fortran - Fortran 能否在逻辑运算中强制遵守参数顺序？
我正在遍历索引，我正在检查我是否不在第一个循环交互和另一个条件中。如果第一个条件是 .False.，我不想评估第二个条件。 do i = 1, n if ( i /= 1 .and. var(
fortran - Fortran 中的二维数组串联
Fortran 2003 具有用于数组连接的方括号语法，Intel fortran 编译器也支持它。我在这里为矩阵连接写了一个简单的代码: program matrix implicit none r
fortran - Fortran 中未调用派生类型的自定义构造函数
我正在尝试通过重载类型名称来制作自定义数据类型构造函数。但是，在进行调用时，将调用默认构造函数。我不明白我做错了什么。这是有问题的代码片段。 module test type, pu
fortran - Fortran 中的通用映射函数
我的最终目标是在 Fortran 中有一个通用的映射函数，即一个接受任意类型 A 的数组和一个 A->B 类型的函数的函数，将此函数应用于给定数组的所有元素并返回一个B 类型的数组。我无法用数组实现它
fortran - Fortran 格式描述符的问题
我正在学习 Fortran，在使用格式编写时发现了一些奇怪的东西(我使用的是 Fortran onlinegdb) Program Hello real, dimension(3,2):: array
fortran - Fortran 是多调度编程语言吗？
Fortran 中的INTERFACE 语句是否使其成为正式实现multiple dispatch 的编程语言？？ (我问是因为所链接的维基百科文章在其看似全面的支持相关范式的示例编程语言列表中并未
fortran - Fortran 90 和 Fortran 95 之间的区别
我可以使用 Fortran 95 编译器编译 Fortran 90 文件吗？ Fortran 95 似乎有很多，但 Fortran 90 没有。最佳答案这个可以: NAGWare f95 Comp
fortran - Fortran 中的二维边界条件
嗨，我在 Fortran 中对二维离散化问题强加边界条件时遇到了麻烦。我的离散化网格是一个二维正方形，在 x,y 方向上从 -L 到 L。我想强加这样的边界条件，在 x=L 的边界线上，指定了函数
fortran - Fortran 中的断言
Fortran 是否有与 C assert 等效的标准函数/关键字？ ? 我找不到 assert我在Fortran2003标准中提到过。我发现了一些如何使用预处理器的方法，但是在这个 answer建议
fortran - FORTRAN 90中同一行上的多个语句
我有一系列的作业，使用“;”将它们分配给同一个ike。分开statemnts，但我收到此错误: 1.0;磅(1,9) 1个错误:(1)处无法分类的陈述在文件LJ.F90:223中如果每个语句都在
fortran - Fortran 中的自动数组释放
我正在使用 gfortran -std=f2008。我有一个函数，它返回一个包含可分配数组的派生类型。该函数在返回之前调用allocate()。似乎在分配数组的函数返回之后，数组会自动释放一段时间，并
fortran - Fortran 数组边界检查的运行时检查未触发
我制作了这个小型测试程序来“证明”在编译之前(或者如果你让它们可分配)，你不能在不指定它们的大小的情况下使用向量。我的观点失败了。我期待本地向量“num”会失败。程序在执行程序之前无法知道它的大小。大
fortran - Fortran 函数中的别名
出于优化原因，Fortran 强制子例程或函数的虚拟参数不是别名，即它们不指向相同的内存位置。我想知道相同的约束是否适用于函数的返回值。换句话说，对于给定的 myfunc 函数: function
fortran - Fortran 90中的堆栈溢出
我已经在Fortran 90中编写了一个相当大的程序。它已经运行了一段时间了，但是今天我尝试将其提高一个档次并增加问题的大小(这是研究非标准的有限元求解器，如果那样的话)。可以帮助任何人...)现在，
fortran - Fortran 是否有未定义的行为？
在 C 和 C++ 中，有许多操作会导致未定义的行为，即允许编译器做任何它想做的事情的情况。 Examples包括在释放变量后使用它，释放变量两次和取消引用空指针。 Fortran 是否也有未定义的行
fortran - Fortran 可以在终端中有输入和输出命令提示符吗？
通常我使用fortran进行数值分析，然后使用matlab、R和python进行后期和前期工作。我发现 matlab、R 和 python 在终端中提供了命令提示符，以便您可以运行脚本以及从命令行立
fortran - Fortran 中的无穷大
在 Fortran 中将变量设置为 +Infinity 的最安全方法是什么？目前我正在使用: program test implicit none print *,infinity() con

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

fortran - 使用 MPI IO 编写多个分布式数组