gpt4 book ai didi

python - 当内部和内部通信器合并时,使用 Spawn() 从 python 生成的 Fortran 子进程(或 C++ 或 python)不会断开连接

转载 作者:行者123 更新时间:2023-12-04 04:12:51 31 4
gpt4 key购买 nike

我正在尝试在 Fortran90 中并行化我的一小部分 python 代码。因此,作为开始,我试图了解生成函数的工作原理。

首先,我尝试从 python 父进程在 python 中生成子进程。我使用了 mpi4py tutorial 中的动态流程管理示例.一切正常。在这种情况下,据我了解,仅使用了父进程和子进程之间的相互通信器。

然后,我继续使用 fortran90 从 python 父进程生成子进程的示例。为此,我使用了 previous post 中的一个示例。在 stackoverflow 中。生成 fortran 子项的 python 代码 (master.py) 如下:

from mpi4py import MPI
import numpy

'''
slavef90 is an executable built starting from slave.f90
'''
# Spawing a process running an executable
# sub_comm is an MPI intercommunicator
sub_comm = MPI.COMM_SELF.Spawn('slavef90', args=[], maxprocs=1)
# common_comm is an intracommunicator accross the python process and the spawned process.
# All kind sof collective communication (Bcast...) are now possible between the python process and the c process
common_comm=sub_comm.Merge(False)
print('parent in common_comm ', common_comm.Get_rank(), ' of ', common_comm.Get_size())
data = numpy.arange(1, dtype='int32')
data[0]=42
print("Python sending message to fortran: {}".format(data))
common_comm.Send([data, MPI.INT], dest=1, tag=0)

print("Python over")
# disconnecting the shared communicators is required to finalize the spawned process.
sub_comm.Disconnect()
common_comm.Disconnect()

生成子进程的相应 fortran90 代码 (slave.f90) 如下:

  program test
!
implicit none
!
include 'mpif.h'
!
integer :: ierr,s(1),stat(MPI_STATUS_SIZE)
integer :: parentcomm,intracomm
!
call MPI_INIT(ierr)
call MPI_COMM_GET_PARENT(parentcomm, ierr)
call MPI_INTERCOMM_MERGE(parentcomm, 1, intracomm, ierr)
call MPI_RECV(s, 1, MPI_INTEGER, 0, 0, intracomm,stat, ierr)
print*, 'fortran program received: ', s
call MPI_COMM_DISCONNECT(intracomm, ierr)
call MPI_COMM_DISCONNECT(parentcomm, ierr)
call MPI_FINALIZE(ierr)
endprogram test

我使用 mpif90 slave.f90 -o slavef90 -Wall 编译了 fortran90 代码。我通常使用 python master.py 运行 python 代码。我能够获得所需的输出,但是,生成的进程不会断开连接,即断开连接命令后的任何语句(call MPI_COMM_DISCONNECT(intracomm, ierr)call MPI_COMM_DISCONNECT(parentcomm , ierr)) 不会在 fortran 代码中执行(因此 python 代码中 Disconnect 命令后的任何语句也不会执行)并且我的代码不会在终端中终止。

在这种情况下,根据我的理解,内部通信器和内部通信器被合并,因此子进程和父进程不再是两个不同的组。而且,断开它们时似乎存在一些问题。但是,我无法找到解决方案。我尝试重现 fortran90 代码,其中子进程也在 C++ 和 python 中生成,但遇到了同样的问题。任何帮助表示赞赏。谢谢。

最佳答案

请注意,您的 Python 脚本首先断开内部通信器,然后断开内部通信器,但是您的 Fortran 程序首先断开内部通信器,然后断开内部通信器。

我能够在 mac(Open MPImpi4pybrew 安装)上运行这个测试在修复顺序和释放后内部沟通者。

这是我的master.py

#!/usr/local/Cellar/python@3.8/3.8.2/bin/python3

from mpi4py import MPI
import numpy

'''
slavef90 is an executable built starting from slave.f90
'''
# Spawing a process running an executable
# sub_comm is an MPI intercommunicator
sub_comm = MPI.COMM_SELF.Spawn('slavef90', args=[], maxprocs=1)
# common_comm is an intracommunicator accross the python process and the spawned process.
# All kind sof collective communication (Bcast...) are now possible between the python process and the c process
common_comm=sub_comm.Merge(False)
print('parent in common_comm ', common_comm.Get_rank(), ' of ', common_comm.Get_size())
data = numpy.arange(1, dtype='int32')
data[0]=42
print("Python sending message to fortran: {}".format(data))
common_comm.Send([data, MPI.INT], dest=1, tag=0)

print("Python over")
# free the (merged) intra communicator
common_comm.Free()
# disconnect the inter communicator is required to finalize the spawned process.
sub_comm.Disconnect()

和我的slave.f90

  program test
!
implicit none
!
include 'mpif.h'
!
integer :: ierr,s(1),stat(MPI_STATUS_SIZE)
integer :: parentcomm,intracomm
integer :: rank, size
!
call MPI_INIT(ierr)
call MPI_COMM_GET_PARENT(parentcomm, ierr)
call MPI_INTERCOMM_MERGE(parentcomm, .true., intracomm, ierr)
call MPI_COMM_RANK(intracomm, rank, ierr)
call MPI_COMM_SIZE(intracomm, size, ierr)
call MPI_RECV(s, 1, MPI_INTEGER, 0, 0, intracomm,stat, ierr)
print*, 'fortran program', rank, ' / ', size, ' received: ', s
print*, 'Slave frees intracomm'
call MPI_COMM_FREE(intracomm, ierr)
print*, 'Slave disconnect intercomm'
call MPI_COMM_DISCONNECT(parentcomm, ierr)
print*, 'Slave finalize'
call MPI_FINALIZE(ierr)
endprogram test

关于python - 当内部和内部通信器合并时,使用 Spawn() 从 python 生成的 Fortran 子进程(或 C++ 或 python)不会断开连接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61425092/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com