gpt4 book ai didi

python - Tensorflow C++ 评估性能比 Python 差

转载 作者:太空狗 更新时间:2023-10-29 22:59:41 31 4
gpt4 key购买 nike

我在 Tensorflow 中构建了一个 LSTM 分类器(使用 Python),现在我正在做一系列基准测试来衡量执行性能。基准测试代码加载在训练期间保存的模型并针对大量输入执行它。我有一个 Python 基准测试和一个 C++ 基准测试。

我在使用 Python(在 CPU 上)时每次输入得到 5ms,在使用 C++ 时得到 68ms。我期待 C++ 版本至少具有类似的性能。

是什么导致了这种差异?我不熟悉 Tensorflow 的内部结构,但我的猜测之一是 Python 版本使用 BLAS(我的 numpy 与 blas 链接)而不是 C++。如果是,是否意味着某些图形操作是在 Python 中执行的?

最佳答案

我不确定现在发布答案是否为时已晚。我遇到了同样的问题并从 tensorflow github 页面得到了答案:

https://github.com/tensorflow/tensorflow/issues/3471

解决方案很简单,只需使用-c opt 标志即可。

关于python - Tensorflow C++ 评估性能比 Python 差,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36164743/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com