gpt4 book ai didi

numpy - Theano 中是否有 GPU 加速的 numpy.max(X, axis=0) 实现?

转载 作者:行者123 更新时间:2023-12-04 17:48:46 24 4
gpt4 key购买 nike

我们是否有 numpy.max(X, axis=None) 版本的 GPU 加速?在Theano。
我查看了文档,发现 theano.tensor.max(X, axis=None) ,但它比 numpy 实现慢 4-5 倍。

我可以向你保证,它不会因为矩阵大小的错误选择而变慢。 theano.tensor.exp 下的相同矩阵比其对应的 numpy 快 40 倍。

有什么建议么?

最佳答案

前面的回答是片面的。该建议不应该起作用,因为解决方法是最终编译代码中使用的解决方法。有优化会自动进行这种转换。

问题的标题与内容不同。它们因轴参数而异。我会回答这两个问题。

如果轴为 0 或无,我们在 GPU 上支持该矩阵操作。如果轴是无,我们的基本实现没有得到很好的优化,因为它更难并行化。如果轴为 0,我们有一个基本的实现,但它更快,因为它更容易并行化。

另外,你的时间是怎么做的?如果您只使用该操作创建一个功能并通过 device=gpu 标志对其进行测试以进行比较,这将包括 CPU 和 GPU 之间的传输时间。这是一个内存绑定(bind)操作,所以如果你在你的时间安排中包含传输,我个人认为这种情况下不会有任何速度操作。要仅查看 GPU 操作,请使用 Theano 分析器:使用 Theano 标志 profile=True 运行。

关于numpy - Theano 中是否有 GPU 加速的 numpy.max(X, axis=0) 实现?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23788179/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com