- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一组需要在集群中执行的计算操作(可能像 512 MPI 进程)。现在,我让集群上的根节点打开一个套接字并在计算操作之间将数据传输到我的本地计算机,但我想知道是否可以只创建两个 MPI 组,其中一个是我的本地机器和另一个远程集群,并使用 MPI 命令在它们之间发送数据。
这可能吗?
最佳答案
是的,这是可能的,只要集群节点和您的机器之间有网络路径即可。 MPI 标准提供了执行此操作的抽象机制,而 Open MPI 提供了一种非常简单的方法来使事情正常工作。您必须查看标准的流程创建和管理部分(MPI-2.2 的第 10 章),特别是建立通信小节(MPI-2.2 的第 10.4 节)。基本上步骤是:
MPI_Open_port()
创建网络端口。 .此 MPI 调用返回唯一的端口名称,然后必须使用 MPI_Publish_name()
将其发布为众所周知的服务名称.一旦端口打开,就可以通过调用阻塞例程MPI_Comm_accept()
来接受客户端连接。 .该作业现在已成为服务器作业。 MPI_Lookup_name()
从服务名称解析端口名称。 .一旦有了端口名称,它就可以调用 MPI_Comm_connect()
为了连接到远程服务器。 MPI_Comm_connect()
与相应的 MPI_Comm_accept()
配对,这两个作业将在它们之间建立一个互通器,然后可以来回发送消息。 mpiexec
用于使用
mpiexec
的 URI 启动客户端作业的命令服务器作业,它充当一种目录服务。为此,您应该使用
--report-uri -
启动服务器作业。使其将其 URI 打印到标准输出的参数:
$ mpiexec --report-uri - <other arguments like -np> ./server ...
1221656576.0;tcp://10.1.13.164:36351;tcp://192.168.221.41:36351
.现在您必须将此 URI 提供给客户端
mpiexec
与
--ompi-server uri
选项:
$ mpiexec --ompi-server 1221656576.0;tcp://10.1.13.164:36351... ./client ...
mpiexec
已启动。您应该确保客户能够联系到其中至少一个。还要确保您在启用的 BTL 组件列表中有 TCP BTL 组件,否则不会有消息流过。 TCP BTL 通常默认启用,但在某些 InfiniBand 安装中,它被显式禁用,方法是设置环境变量
OMPI_MCA_btl
的相应值。或在默认的 Open MPI MCA 配置文件中。可以使用
--mca
覆盖 MCA 参数选项,例如:
$ mpiexec --mca btl self,sm,openib,tcp --report-uri - ...
关于openmpi - 是否可以在本地计算机和远程集群上运行 OpenMPI?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15939757/
有没有办法在不进行提交/ check out 的情况下应用差异补丁或类似补丁? 我的情况:我工作时经常在计算机之间切换,我的提交历史记录有一堆“switching machines”消息。 我最初的猜
我的自定义引导加载程序中有代码从地址 0x8E00 处的 512 字节缓冲区复制内存。进入高内存,0x100000和更高。这在某些计算机上运行良好,而在其他计算机上崩溃(我假设是三重故障)。此代码在
服务器有没有办法将一些数据无线无缝地推送到客户端,可能是 Windows(电话)、iPhone、Mac 或 Android 设备,没有任何操作系统集成? 如果是这样,最好的设计模式是什么,最好的技术是
我无法理解hadoop的真正本质。 如果我有足够的资源来购买可以处理PB级数据的 super 计算机,那么为什么我需要Hadoop基础架构来管理如此大的数据? 最佳答案 hadoop的全部目的是能够在
我有一个奇怪的问题,或者我可能无法理解Grails i18n机制的工作原理。 我将以下内容插入到index.gsp文件中: LocaleContextHolder.locale:
我正在尝试为我的小弟弟编写一个简单的程序。他经常在他的电脑后面,但他应该为学校学习简单的算术 :D 我想制作以下程序: 他启动了他的电脑 他需要做一些简单的练习并完成 如果他做对了 x 次,他可以继续
有人能告诉我如何在 diff 主机(计算机)上为 MySQL 数据库做一个简单的数据库备份吗?我正在尝试将我的数据库从一台主机(服务器)移动到一台新主机(服务器) 最佳答案 如果您只是需要在服务器之间
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是无关紧要的,因
我正在尝试让 Android 应用程序使用 USB 电缆与运行 ubuntu 12.04 lts 的 Linux 计算机进行通信。我正在尝试使用 usbdeviceconnection 类,但是当我通
我刚刚使用 docker-toolbox 1.8.2 安装了 docker在 Windows 10 上。 由于由于this issue我不得不使用这些命令重新创建 docker 镜像 docker-m
如何删除处于 GURU_MEDITATION 错误状态的 VirtualBox 计算机?在 VirtualBox 未运行时删除该目录是否足够? 编辑:发布后,我删除了“在文件管理器中显示”导航到的整个
当我们在 Azure 机器学习服务中将模型部署为 ACIWebService 时,不需要指定任何 deployment_target。 根据AzureML documentation对于 azurem
当我们在 Azure 机器学习服务中将模型部署为 ACIWebService 时,不需要指定任何 deployment_target。 根据AzureML documentation对于 azurem
我遇到的主要问题是当我选择 stay 时会发生什么上hand_one ,然后 hit上hand_two . 而不是让我hit or stay上hand_two再次,它让我回到hit or stay上h
我知道我可以使用 putty 来 ssh 进入每台 Linux 机器并更新 CentOS 服务器...但我希望有人能够为我指明正确的方向,告诉我如何通过 PowerShell 或 Windows 中的
在 MIX 计算机中,一个单词由五个字节和一个符号组成。符号在内存中是如何表示的?是另一个字节,所以每个字真的是六个字节吗? 谢谢。 最佳答案 你的问题不是很清楚。体系结构规范未指定实际实现。它仅指定
我是 Python 的初级程序员,我的电脑有一个奇怪的问题。当我的计算机上有一个 .py 文件(包含一个有效的脚本)并双击它打开时,会发生以下情况:程序打开(它是黑屏 View ),但它会在一秒钟内自
我正在尝试在 Windows 上使用 plink 创建到 Linux 机器的隧道,并让转储文件最终出现在 Windows 机器上。看起来 this answer会工作,是我的问题的基础。但是尝试一下并
我想在 Windows 7 和 10 计算机上执行重启,但我首先需要将 Jenkins 节点暂时离线。在执行重启之前,我需要完成所有正在运行的任务。然后我远程登录到服务器并重新启动计算机。然而,在我重
我正在编写一个简单的程序,从 MySQL 数据库中提取计算机名称,然后将这些名称存储到字符串数组列表中(这部分工作正常)。之后,我编写了一个类和一个方法,将字符串作为参数(这将是计算机名称)并尝试对其
我是一名优秀的程序员,十分优秀!