mpi - openmpi mpirun v1.8 中 --map-by 选项的语法-6ren

mpi - openmpi mpirun v1.8 中 --map-by 选项的语法

转载作者：行者123 更新时间：2023-12-04 05:17:51

25

4

查看 openmpi manual 中的以下摘录

--map-by <foo>
    Map to the specified object, defaults to socket. Supported options
    include slot, hwthread, core, L1cache, L2cache, L3cache, socket, 
    numa, board, node, sequential, distance, and ppr. Any object can 
    include modifiers by adding a : and any combination of PE=n (bind n
    processing elements to each proc), SPAN (load balance the processes 
    across the allocation), OVERSUBSCRIBE (allow more processes on a node
    than processing elements), and NOOVERSUBSCRIBE. This includes PPR,
    where the pattern would be terminated by another colon to separate 
    it from the modifiers.

我对语法有不同的问题以及对它们的一些评论:

选项有哪些 sequential , distance和 ppr引用？

特别是 ppr让我困惑。它是什么的缩写？

我应该如何理解 --map-by ppr:4:socket 之类的选项关于手册的摘录？

当然，我可以通过查看报告的绑定(bind) --report-bindings 来查看前一个选项的结果。 (只有 4 个进程映射到一个套接字，默认绑定(bind)到一个套接字的 4 个核心)，但我无法理解语法。在手册的另一行，它说这个新选项取代了已弃用的 --npersocket。 :

-npersocket, --npersocket <#persocket>
    On each node, launch this many processes times the number of processor
    sockets on the node. The -npersocket option also turns on the -bind-
    to-socket option. (deprecated in favor of --map-by ppr:n:socket)

最佳答案

ppr表示每个资源的进程。它的语法是ppr:N:resource它的意思是“将 N 个进程分配给主机上可用的每个资源类型资源”。例如，在具有 --map-by ppr:4:socket 的 6 核 CPU 的 4 插槽系统上产生以下流程图:

 socket   ---- 0 ----    ---- 1 ----    ---- 2 ----    ---- 3 ----
 core     0 1 2 3 4 5    0 1 2 3 4 5    0 1 2 3 4 5    0 1 2 3 4 5
 process  A B C D        E F G H        I J K L        M N O P

(在本例中，进程编号从 A 到 Z)

手册的意思是整个 ppr:N:resource被视为单个说明符，可以在其后添加选项，由 : 分隔，例如 ppr:2:socket:pe=2 .这应该读作“每个套接字启动两个进程并将它们中的每一个绑定(bind)到两个处理元素”，并且应该在给定相同的四套接字系统的情况下产生以下映射:

 socket   ---- 0 ----    ---- 1 ----    ---- 2 ----    ---- 3 ----
 core     0 1 2 3 4 5    0 1 2 3 4 5    0 1 2 3 4 5    0 1 2 3 4 5
 process  A A B B        C C D D        E E F F        G G H H

sequential mapper 逐行读取主机文件，并为在那里找到的每个主机启动一个进程。如果给定，它会忽略插槽计数。
dist mapper 根据 NUMA 节点与给定 PCI 资源的距离来映射进程。它只在 NUMA 系统上有意义。同样，让我们使用玩具四插槽系统，但这次扩展表示以显示 NUMA 拓扑:

 Socket 0 ------------- Socket 1
    |                      |
    |                      |
    |                      |
    |                      |
    |                      |
 Socket 2 ------------- Socket 3
    |
   ib0

插槽之间的线代表 CPU 链接。那些是，例如Intel CPU 的 QPI 链接和 AMD CPU 的 HT 链接。 ib0是用于与其他计算节点通信的 InfiniBand HCA。现在，在该系统中，Socket 2 直接与 InfiniBand HCA 对话。 Socket 0 和 Socket 3 必须通过一个 CPU 链路才能与 ib0 通信。并且 Socket 1 必须跨越 2 个 CPU 链路。这意味着，在 Socket 2 上运行的进程将具有尽可能低的延迟，而在 Socket 1 上发送和接收消息和进程将具有尽可能高的延迟。

它是如何工作的？如果您的主机文件指定例如该主机上有 16 个插槽，映射选项为 --map-by dist:ib0 ，它可能会导致以下 map :

 socket   ---- 0 ----    ---- 1 ----    ---- 2 ----    ---- 3 ----
 core     0 1 2 3 4 5    0 1 2 3 4 5    0 1 2 3 4 5    0 1 2 3 4 5
 process  G H I J K L                   A B C D E F    M N O P

6 个进程被映射到最接近 InfiniBand HCA 的 Socket 2，然后另外 6 个被映射到第二近的 Socket 0，另外 4 个被映射到 Socket 3。也可以分散进程而不是线性填充处理元素。 --map-by dist:ib0:span结果是:

 socket   ---- 0 ----    ---- 1 ----    ---- 2 ----    ---- 3 ----
 core     0 1 2 3 4 5    0 1 2 3 4 5    0 1 2 3 4 5    0 1 2 3 4 5
 process  E F G H        M N O P        A B C D        I J K L

使用 hwloc 获得实际的 NUMA 拓扑。库，它读取 BIOS 提供的距离信息。 hwloc包括一个名为 hwloc-ls 的命令行工具(也称为 lstopo )可用于显示系统的拓扑。通常它只在其输出中包含处理元素的拓扑结构和 NUMA 域，但如果你给它 -v选项它还包括 PCI 设备。

关于mpi - openmpi mpirun v1.8 中 --map-by 选项的语法，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/28216897/

25

4

0

文章推荐： atom-editor - 无法在Atom的vendor/目录内搜索

文章推荐： php - phpmailer中的for循环

文章推荐： methods - 未定义的方法 `options=' 为真 :TrueClass

mpi - 将 MPI 等级数推广到 MPI 组？
是否有等级编号对组编号的概括？对于我的代码，我想创建 MPI::COMM_WORLD 的分层分解。假设我们使用 16 个线程。我使用 MPI::COMM_WORLD.Split 创建 4 个通信器，每
mpi - 如何在多个节点中运行 MPI-Job？ (多节点 MPI 作业执行)
能够使用多个节点执行 MPI 作业以加快流程这是我目前使用的命令: mpirun --hostfile myhost -np 2 --map-by slot Job.x//只在第一个节点执行 mpi
mpi - 新的通信器无效的 MPI
我想创建一个新的通信器，它只保留处理中使用的行列，如果我有 24 个可用处理器而我只需要 10 个，那么该组应该只保留这 10 个，否则它将保留所有他们。出于某种原因，当我尝试创建一个通信器时，一切都
mpi - OpenMP 和 MPI 混合程序比纯 MPI 更快吗？
我正在开发一些程序，而不是在每个节点上有 4 个内核的 4 节点集群上运行。我有一个非常快的 OpenMP 版本的程序，它只在一个集群上运行，我正在尝试使用 MPI 扩展它。由于我的经验有限，我想知道
mpi - MPI 中的图像处理
这是我尝试在 MPI 中编写经典平滑像素平均算法的代码。我几乎让它工作了，但是光晕交换发生了一些奇怪的事情，因为可以看到边缘的线条。我似乎找不到错误。我是否正确地交换了光环？我应该收集最终数组的哪一部
mpi - 事件驱动的 MPI
我有兴趣使用 MPI(消息传递接口(interface))实现一种事件驱动的调度队列。我要解决的基本问题是:我有一个主进程，它将作业插入全局队列，每个可用的从进程检索队列中的下一个作业(如果有的话)。
mpi - MPI 运行时系统分配的进程的物理位置
当我们在集群上使用命令 say mpirun -np 4 a.out 启动 MPI 程序时，然后MPI 运行时系统如何跨 CPU 分配进程？我的意思是，假设它在集群中找到一个空闲的四核 CPU，它会
mpi - MPI 进程是如何启动的？
使用 mpirun 启动 MPI 作业时或 mpiexec ，我可以理解人们如何开始每个单独的过程。但是，如果没有任何编译器魔法，这些包装器可执行文件如何将安排(MPI 通信器)传达给 MPI 进程？
mpi - MPI 中的等级和进程有什么区别？
MPI 中的等级和进程有什么区别？最佳答案 Here是我从中学习所有 MPI 的资源，您可能会发现它很有用。关于你的问题:流程是正在运行的程序的实际实例。 MPI 允许您创建逻辑团体进程，并且
mpi - MPI 障碍的复杂性
MPI 障碍的时间复杂度是多少？它们是否可以扩展到大量核心(>> 10k)？最佳答案屏障复杂性与实现高度相关。它可以是线性的，可以是对数的，也可以是更好或更差。某些架构为某些集体操作提供专用网络，
mpi - MPI 死锁
我正在尝试 MPI，想知道这段代码是否会导致死锁。 MPI_Comm_rank (comm, &my_rank); if (my_rank == 0) { MPI_Send (sendbuf,
mpi - MPI 进程数可以超过节点上的逻辑处理器数
我有一个简单的 MPI 代码，可以打印出进程的等级，使用 Intel 编译器和 MPI 库进行编译和链接。然后我在集群的主节点上以交互方式运行它:mpiexec -n 50 ./a.out该节点只有
mpi - 在 open-mpi/mpi-run 中加载共享库
我正在尝试使用 mpi run 使用扭矩调度程序来运行我的程序。虽然在我的 pbs 文件中我通过加载了所有库 export LD_LIBRARY_PATH=/path/to/library 但它给出
mpi - 使用 MPI 合并所有等级的数组
我在所有等级上都有一个相同长度的数组(假设为 10)。数组中的某些值包含处理器的等级。例如 ... Proc 1: [1 0 0 0 0 1 0 0 0 1] Proc 2: [0 2 2 0 0 0
mpi - 按主机对 MPI 任务进行分组
我想在集群中的每台机器上独立地轻松执行集体通信。假设我有 4 台机器，每台机器有 8 个内核，我的 MPI 程序将运行 32 个 MPI 任务。对于给定的功能，我想要的是: 在每个主机上，只有一个任务
mpi - 有没有办法在 MPI 中获取唯一的通信器标识符？
我希望能够获得某个通信器的唯一 ID，但是当您通过 MPI_Comm_split() 调用获得此通信器时，这似乎是一项不可能完成的任务。我知道什么时候 MPI_Comm_split() 被集体调用，每
mpi - 非阻塞 MPI 调用的抽象实现
非阻塞发送/接收立即在 MPI 中返回，操作在后台完成。我看到这种情况发生的唯一方法是当前进程/线程调用/创建另一个进程/线程并将发送/接收代码的图像加载到其中并返回。然后这个新进程/线程完成这个操作
mpi - MPI I/O 是如何实现的？
冗长的背景我正在为心脏电生理学模拟并行处理一些代码。由于用户可以使用内置脚本语言指定他们自己的模拟，我无法知道如何在通信与计算之间进行权衡。为了解决这个问题，我正在制作一种运行时分析器，一旦看到要运
mpi - 使用 MPI 指定运行程序的机器
我打算做一些并行计算，我完全是这方面的初学者。我将使用 MPI 来完成并行工作，采用 Master-Slave 模型。我现在有四台机器，希望其中一台作为主节点。但是，我不知道如何指定运行该程序的其他机
mpi - 我们可以在单个系统中运行 MPI 程序还是必须只在集群中运行它？
我可以在我的大学使用 PelicanHPC 访问集群网络，其中运行各种 MPI 程序，但在家里我想练习编写/使用其他 MPI 程序。有没有办法在我自己的系统上运行 MPI 程序？ (我在 Ubuntu

首页

博学

6Ren·AI

商城

mpi - openmpi mpirun v1.8 中 --map-by 选项的语法