gpt4 book ai didi

numpy - 为什么 Python 和 CUDA 不支持半精度复数浮点运算?

转载 作者:行者123 更新时间:2023-12-04 13:01:12 26 4
gpt4 key购买 nike

NumPY 有 complex64对应于两个 float32。

但它也有 float16 但没有 complex32。

怎么来的?我有涉及 FFT 的信号处理计算,我认为我可以使用 complex32,但我不知道如何到达那里。特别是我希望通过 cupy 在 NVidia GPU 上加速.

然而似乎 float16 是 slower在 GPU 上而不是更快。

为什么不支持和/或忽略半精度?

同样相关的是为什么我们没有 complex integers ,因为这也可能出现 opportunity for speedup .

最佳答案

这个问题已经在 CuPy 存储库中提出了一段时间:
https://github.com/cupy/cupy/issues/3370
但目前还没有具体的工作计划;大多数事情仍然具有探索性。
解决问题并非微不足道的原因之一是没有 numpy.complex32我们可以直接导入的 dtype(请注意,所有 CuPy 的 dtype 都只是 NumPy 的别名),因此在询问设备主机传输时会出现问题。另一件事是没有在 CPU 或 GPU 上为 complex32 编写原生数学函数。 ,所以我们需要自己编写它们来进行强制转换、ufunc 等等。在链接的问题中,有一个指向 NumPy 讨论的链接,我的印象是目前尚未考虑...

关于numpy - 为什么 Python 和 CUDA 不支持半精度复数浮点运算?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56777807/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com