- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我们有一个大型 Fortran/MPI 代码库,它利用节点上的 system-V 共享内存段。我们在具有 32 个处理器的胖节点上运行,但只有 2 或 4 个 NIC,每个 CPU 的内存相对较少;所以我们的想法是我们建立一个共享内存段,每个 CPU 在它上面执行它的计算(在它的 SMP 数组块中)。 MPI 然后用于处理节点间通信,但仅在 SMP 组中的主站上。该过程是双缓冲的,对我们来说效果很好。
当我们决定切换到异步通信以隐藏一些延迟时,问题就出现了。由于节点上只有几个 CPU 通过 MPI 通信,但所有 CPU 都看到接收到的数组(通过共享内存),CPU 不知道通信 CPU 何时完成,除非我们设置某种屏障,并且那么为什么要做异步通信呢?
理想的假设解决方案是将请求标签放在 SMP 段中,并在需要知道的 CPU 上运行 mpi_request_get_status。当然,请求标签只注册在正在通信的CPU上,所以是行不通的!另一种建议的可能性是在通信线程上分支一个线程,并使用它在循环中运行 mpi_request_get_status,在共享内存段中使用标志参数,以便所有其他图像都可以看到。不幸的是,这也不是一个选项,因为我们被限制不能使用线程库。
我们提出的唯一可行的选择似乎有效,但感觉就像一个肮脏的黑客。我们在接收缓冲区的上限地址中放置了一个不可能的值,这样一旦 mpi_irecv 完成,该值就会改变,因此每个 CPU 都知道何时可以安全地使用缓冲区。这可以吗?似乎只有在 MPI 实现可以保证连续传输数据的情况下,它才能可靠地工作。这听起来很有说服力,因为我们是用 Fortran 编写的,所以我们的数组是连续的;我会想象访问也会。
有什么想法吗?
谢谢,
乔利
这是我正在做的事情的伪代码模板。家里还没拿到代码作为引用,所以我希望我没有忘记任何重要的东西,但我回到办公室时会确保......
pseudo(array_arg1(:,:), array_arg2(:,:)...)
integer, parameter : num_buffers=2
Complex64bit, smp : buffer(:,:,num_buffers)
integer : prev_node, next_node
integer : send_tag(num_buffers), recv_tag(num_buffers)
integer : current, next
integer : num_nodes
boolean : do_comms
boolean, smp : safe(num_buffers)
boolean, smp : calc_complete(num_cores_on_node,num_buffers)
allocate_arrays(...)
work_out_neighbours(prev_node,next_node)
am_i_a_slave(do_comms)
setup_ipc(buffer,...)
setup_ipc(safe,...)
setup_ipc(calc_complete,...)
current = 1
next = mod(current,num_buffers)+1
safe=true
calc_complete=false
work_out_num_nodes_in_ring(num_nodes)
do i=1,num_nodes
if(do_comms)
check_all_tags_and_set_safe_flags(send_tag, recv_tag, safe) # just in case anything else has finished.
check_tags_and_wait_if_need_be(current, send_tag, recv_tag)
safe(current)=true
else
wait_until_true(safe(current))
end if
calc_complete(my_rank,current)=false
calc_complete(my_rank,current)=calculate_stuff(array_arg1,array_arg2..., buffer(current), bounds_on_process)
if(not calc_complete(my_rank,current)) error("fail!")
if(do_comms)
check_all_tags_and_set_safe(send_tag, recv_tag, safe)
check_tags_and_wait_if_need_be(next, send_tag, recv_tag)
recv(prev_node, buffer(next), recv_tag(next))
safe(next)=false
wait_until_true(all(calc_complete(:,current)))
check_tags_and_wait_if_need_be(current, send_tag, recv_tag)
send(next_node, buffer(current), send_tag(current))
safe(current)=false
end if
work_out_new_bounds()
current=next
next=mod(next,num_buffers)+1
end do
end pseudo
最佳答案
“……除非我们设置某种障碍,否则为什么要进行异步通信?”
这句话有点糊涂。异步通信的目的是重叠通信和计算;希望您可以在通信进行的同时完成一些真正的工作。但这意味着您现在有两个最终必须同步的任务发生,所以有 有 成为在第一个通信阶段结束时阻止任务进入第二个计算阶段(或其他)之前的东西。
在这种情况下该怎么做才能很好地实现事物(看起来您现在所拥有的东西可以工作,但您正确地担心结果的脆弱性)的问题取决于您如何进行实现。您使用线程这个词,但是 (a) 您使用的是 sysv 共享内存段,如果您有线程,则不需要这样做,并且 (b) 您被限制不能使用线程库,所以大概您实际上意味着你在 MPI_Init() 之后 fork()ing 进程或其他什么?
我同意 Hristo 的观点,您最好的选择几乎肯定是使用 OpenMP 进行计算的节点上分布,并且可能会大大简化您的代码。了解更多关于不使用线程库的约束会有所帮助。
除了 MPI 之外,另一种仍然可以避免您必须“推出自己的”基于进程的通信层的方法是让节点上的所有进程都是 MPI 进程,但创建一些通信器 - 一个来执行全局通信,每个节点一个“本地”通信器。每个节点只有几个进程是实际进行节点外通信的通信器的一部分,而其他进程则在共享内存段上工作。然后,您可以使用基于 MPI 的同步方法(Wait 或 Barrier)进行节点同步。即将推出的 MPI3 实际上将明确支持以这种方式使用本地共享内存段。
最后,如果您绝对有信心并决心继续通过本质上是您自己的本地节点专用 IPC 实现来做事 --- 因为您已经在使用 SysV 共享内存段,您不妨使用 SysV semaphores做同步。当数据准备好计算时,您已经在使用自己的(有点微妙的)类似信号量的机制来“标记”;在这里,您可以使用更强大的、已经编写好的信号量来让非 MPI 进程知道数据何时可以进行计算(以及让 MPI 进程知道其他进程何时完成计算的类似机制)。
关于mpi - 带有 SysV 共享内存的异步 MPI,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10627715/
是否有等级编号对组编号的概括?对于我的代码,我想创建 MPI::COMM_WORLD 的分层分解。假设我们使用 16 个线程。我使用 MPI::COMM_WORLD.Split 创建 4 个通信器,每
能够使用多个节点执行 MPI 作业以加快流程 这是我目前使用的命令: mpirun --hostfile myhost -np 2 --map-by slot Job.x//只在第一个节点执行 mpi
我想创建一个新的通信器,它只保留处理中使用的行列,如果我有 24 个可用处理器而我只需要 10 个,那么该组应该只保留这 10 个,否则它将保留所有他们。出于某种原因,当我尝试创建一个通信器时,一切都
我正在开发一些程序,而不是在每个节点上有 4 个内核的 4 节点集群上运行。我有一个非常快的 OpenMP 版本的程序,它只在一个集群上运行,我正在尝试使用 MPI 扩展它。由于我的经验有限,我想知道
这是我尝试在 MPI 中编写经典平滑像素平均算法的代码。我几乎让它工作了,但是光晕交换发生了一些奇怪的事情,因为可以看到边缘的线条。我似乎找不到错误。我是否正确地交换了光环?我应该收集最终数组的哪一部
我有兴趣使用 MPI(消息传递接口(interface))实现一种事件驱动的调度队列。我要解决的基本问题是:我有一个主进程,它将作业插入全局队列,每个可用的从进程检索队列中的下一个作业(如果有的话)。
当我们在集群上使用命令 say mpirun -np 4 a.out 启动 MPI 程序时,然后MPI 运行时系统如何跨 CPU 分配进程? 我的意思是,假设它在集群中找到一个空闲的四核 CPU,它会
使用 mpirun 启动 MPI 作业时或 mpiexec ,我可以理解人们如何开始每个单独的过程。但是,如果没有任何编译器魔法,这些包装器可执行文件如何将安排(MPI 通信器)传达给 MPI 进程?
MPI 中的等级和进程有什么区别? 最佳答案 Here是我从中学习所有 MPI 的资源,您可能会发现它很有用。 关于你的问题:流程 是正在运行的程序的实际实例。 MPI 允许您创建逻辑 团体进程,并且
MPI 障碍的时间复杂度是多少?它们是否可以扩展到大量核心(>> 10k)? 最佳答案 屏障复杂性与实现高度相关。它可以是线性的,可以是对数的,也可以是更好或更差。某些架构为某些集体操作提供专用网络,
我正在尝试 MPI,想知道这段代码是否会导致死锁。 MPI_Comm_rank (comm, &my_rank); if (my_rank == 0) { MPI_Send (sendbuf,
我有一个简单的 MPI 代码,可以打印出进程的等级,使用 Intel 编译器和 MPI 库进行编译和链接。然后我在集群的主节点上以交互方式运行它:mpiexec -n 50 ./a.out该节点只有
我正在尝试使用 mpi run 使用扭矩调度程序来运行我的程序。虽然在我的 pbs 文件中我通过 加载了所有库 export LD_LIBRARY_PATH=/path/to/library 但它给出
我在所有等级上都有一个相同长度的数组(假设为 10)。数组中的某些值包含处理器的等级。例如 ... Proc 1: [1 0 0 0 0 1 0 0 0 1] Proc 2: [0 2 2 0 0 0
我想在集群中的每台机器上独立地轻松执行集体通信。假设我有 4 台机器,每台机器有 8 个内核,我的 MPI 程序将运行 32 个 MPI 任务。对于给定的功能,我想要的是: 在每个主机上,只有一个任务
我希望能够获得某个通信器的唯一 ID,但是当您通过 MPI_Comm_split() 调用获得此通信器时,这似乎是一项不可能完成的任务。我知道什么时候 MPI_Comm_split() 被集体调用,每
非阻塞发送/接收立即在 MPI 中返回,操作在后台完成。我看到这种情况发生的唯一方法是当前进程/线程调用/创建另一个进程/线程并将发送/接收代码的图像加载到其中并返回。然后这个新进程/线程完成这个操作
冗长的背景 我正在为心脏电生理学模拟并行处理一些代码。由于用户可以使用内置脚本语言指定他们自己的模拟,我无法知道如何在通信与计算之间进行权衡。为了解决这个问题,我正在制作一种运行时分析器,一旦看到要运
我打算做一些并行计算,我完全是这方面的初学者。我将使用 MPI 来完成并行工作,采用 Master-Slave 模型。我现在有四台机器,希望其中一台作为主节点。但是,我不知道如何指定运行该程序的其他机
我可以在我的大学使用 PelicanHPC 访问集群网络,其中运行各种 MPI 程序,但在家里我想练习编写/使用其他 MPI 程序。有没有办法在我自己的系统上运行 MPI 程序? (我在 Ubuntu
我是一名优秀的程序员,十分优秀!