gpt4 book ai didi

python - GPU 上的 NumPy + BLAS + LAPACK(AMD 和 Nvidia)

转载 作者:太空宇宙 更新时间:2023-11-03 10:52:41 26 4
gpt4 key购买 nike

我们有一个 Python 代码,其中涉及昂贵的线性代数计算。数据存储在 NumPy 数组中。该代码使用 numpy.dot 和一些 BLAS 和 LAPACK 函数,这些函数当前可通过 scipy.linalg.blas 和 scipy.linalg.lapack 访问。当前代码是为 CPU 编写的。我们希望转换代码,以便在 GPU 上执行一些 NumPy、BLAS 和 LAPACK 操作。

我正在尝试确定执行此操作的最佳方法。据我所知,Numba 不支持 GPU 上的 BLAS 和 LAPACK 函数。看来 PyCUDA 可能是最好的路线,但我无法确定 PyCUDA 是否允许同时使用 BLAS 和 LAPACK 函数。

编辑:我们需要代码可以移植到不同的 GPU 架构,包括 AMD 和 Nvidia。虽然 PyCUDA 似乎提供了所需的功能,但 CUDA(以及 PyCUDA)无法在 AMD GPU 上运行。

最佳答案

您是否尝试过研究 scikit-cuda? https://scikit-cuda.readthedocs.io/en/latest/#

它似乎使用 pyCUDA 来访问 CUDA 工具包库(CUBLAS、CUSOLVER、CUFFT、CULA),并提供他们自己的一些基于 CUBLAS 的 LAPACK 例程的实现。

我已经将它用于 CUBLAS 例程,这是一次愉快的体验,我希望它对 LAPACK 也是如此

关于python - GPU 上的 NumPy + BLAS + LAPACK(AMD 和 Nvidia),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47209532/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com