gpt4 book ai didi

python - cublas cublasZgemm() 比预期慢

转载 作者:太空狗 更新时间:2023-10-30 03:06:07 25 4
gpt4 key购买 nike

根据 nvidia . cublasZgemm 比英特尔 MKL 快 6 倍。

但是,在我的 PC(i7 2600、Nvidia gtx560、操作系统:linux 64 位)上,cublasZgemm 比 MKL 稍慢。

我使用 enthought python distribution 附带的 numpy.dot()它将 numpy 与 MKL 10.3 联系起来。

使用 cublasZgemm 的矩阵乘法函数在共享库中编译,并在 python 脚本中使用 ctypes 调用。

将两个 1024x1024 的复数矩阵相乘时。 numpy.dot() 耗时 84 毫秒。 ctypes 函数调用花费了 110 毫秒,而 cublasZgemm() 部分花费了 97 毫秒。

我想知道为什么 cublassZgemm 没有 nvidia 说的那么快?

最佳答案

I wonder why cublassZgemm is not as fast as nvidia stated?

简短的回答是因为您使用的 GPU 执行 zgemm 的基准测试比 NVIDIA 用于生成其性能数据的速度慢得多。您的 GTX560 的 double 性能可能比 NVIDIA 在您的链接中使用的 Telsa M2090 慢 八倍

关于python - cublas cublasZgemm() 比预期慢,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9555257/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com