gpt4 book ai didi

twitter - Apache Mesos 可以识别 GPU 核心吗?

转载 作者:行者123 更新时间:2023-12-02 15:47:47 25 4
gpt4 key购买 nike

this talk的第25张幻灯片中Twitter 开源办公室负责人表示,Mesos 甚至允许跟踪和管理 GPU(我猜他指的是 GPGPU)资源。但我在其他地方找不到任何关于此的信息。有人可以帮忙吗?除了Mesos之外,还有其他支持GPGPU的集群管理器吗?

最佳答案

Mesos 尚未提供对 (GP)GPU 的直接支持,但支持自定义资源类型。如果您在启动 mesos-slave 时指定 --resources="gpu(*):8" ,那么这将成为框架资源提供的一部分,框架可以启动声称使用这些资源的任务资源。一旦某个任务使用了某些 GPU 资源,则只会再次提供剩余的资源,直到该任务完成并且 GPU 资源再次可用。这样,Mesos 资源分配器就可以实际调度您声明的 GPU 资源,并确保只有声明的数量才提供/分配给框架。

Mesos 尚不支持 GPU 隔离,但通过“可插入隔离器模块”,您可以构建自己的 GPU 隔离器来强制执行 GPU 资源限制。

或者,如果您不想分配单独的 GPU 资源,而只想声明某些节点具有 GPU,而其他节点没有,则可以使用 --attributes="hasGpu:true" 或类似的东西来区分有/没有 GPU 的节点。此信息也会传递到资源提供中的框架,但这些属性不能被正在运行的任务“消耗”,因此它们将始终为该节点提供。

有关详细信息,请参阅https://mesos.apache.org/documentation/attributes-resources/

关于twitter - Apache Mesos 可以识别 GPU 核心吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27872558/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com