gpt4 book ai didi

tensorflow - 训练期间GPU利用率大部分为0%

转载 作者:行者123 更新时间:2023-12-04 01:11:13 24 4
gpt4 key购买 nike

(GTX 1080,Tensorflow 1.0.0)

在训练期间nvidia-smi输出(如下所示)表明,大部分时间GPU的利用率为0%(尽管GPU的使用)。关于我已经训练的时间,情况似乎是这样。偶尔,它有时会达到100%或类似的峰值。

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 375.26 Driver Version: 375.26 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 GeForce GTX 1080 Off | 0000:01:00.0 On | N/A |
| 33% 35C P2 49W / 190W | 7982MiB / 8110MiB | 0% Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| 0 1093 G /usr/lib/xorg/Xorg 175MiB |
| 0 1915 G compiz 90MiB |
| 0 4383 C python 7712MiB |
+-----------------------------------------------------------------------------+

我在 this问题中描述了这种情况。
可以使用该github存储库中的代码或通过遵循tensorflow网站上的 this简单再培训示例并在 session 中传递受限的 per_process_gpu_memory_fraction(小于1.0)来复制该问题:
config = tf.ConfigProto()
config.gpu_options.per_process_gpu_memory_fraction = 0.4
session = tf.Session(config=config, ...)

问题1:在使用<1.0的GPU时,如何在训练过程中真正使用(利用)GPU?

问题2:如何在图形卡上真正使用完整的GPU(而不是将其设置为<1.0)?

帮助和提示表示赞赏!

最佳答案

当创建的图形大于GPU的内存时,TensorFlow会退回到CPU,因为它使用RAM和CPU而不是GPU。因此,只需删除per_process_gpu_memory_fraction的选项并减小批处理大小即可。这些示例很可能使用大批处理量,因为它是在多个GPU或大于32Gb的CPU中训练的,这不是您的情况。它也可以是您选择的优化程序算法。 SGD使用的内存少于其他算法,请尝试先进行设置。在GPU中使用8Gb时,您可以尝试使用16和SGD的批处理大小,它应该可以工作。然后,您可以增加批处理大小或使用其他算法(例如RMSprop)。

如果仍然无法正常工作,您可能正在做其他事情。例如,您在每次迭代中都保存一个检查点。保存检查点是在CPU中完成的,并且可能比在GPU中进行简单的迭代花费更多的时间。这可能是您看到GPU使用率激增的原因。

关于tensorflow - 训练期间GPU利用率大部分为0%,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42503112/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com