gpt4 book ai didi

c++ - 分布式计算的 Tensorflow 设置

转载 作者:太空狗 更新时间:2023-10-29 20:56:02 24 4
gpt4 key购买 nike

任何人都可以提供有关如何设置 tensorflow 以在网络中的多个 CPU 上工作的指导吗?到目前为止,我发现的所有示例最多只使用一个本地盒子和多个 GPU。我发现我可以在 session_opts 中传递目标列表,但我不确定如何在每个盒子上设置 tensorflow 以监听网络节点/任务。任何例子将不胜感激!

最佳答案

TensorFlow 的开源版本(目前为 0.6.0)仅支持单进程执行:特别是 tensorflow::SessionOptions 中唯一有效的目标是空字符串,这意味着“当前进程。”

TensorFlow whitepaper描述了我们在 Google 内部使用的分布式实现的结构(参见图 3)。基本思想是可以使用 RPC 对 master 实现 Session 接口(interface); master 可以在多个 worker 进程中跨一组设备划分计算,这些进程也使用 RPC 进行通信。可惜的是,当前版本严重依赖于 Google 内部技术(如 Borg ),因此要使其为外部使用做好准备还有很多工作要做。我们目前正在努力解决这个问题,您可以关注this GitHub issue的进展。 .

2016 年 2 月 26 日编辑:今天我们发布了一个 initial version of the distributed runtime到 GitHub。它支持多台机器和多个 GPU。

关于c++ - 分布式计算的 Tensorflow 设置,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34439045/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com