gpt4 book ai didi

CUDA __umul24 函数,有用还是没用?

转载 作者:行者123 更新时间:2023-12-01 21:20:03 25 4
gpt4 key购买 nike

是否值得在 CUDA 内核中用 __umul24 函数替换所有乘法?我读到了不同和相反的观点,但我仍然无法做出一个基准来弄清楚

最佳答案

仅在具有 fermi 之前架构的设备中,即具有 2.0 之前的 cuda 功能,其中整数运算单元为 24 位。

在功能 >= 2.0 的 Cuda 设备上,架构是 32 位,_umul24 会更慢而不是更快。原因是它必须用 32 位架构来模拟 24 位操作。

现在的问题是:为了速度的提升值得付出努力吗?可能不是。

关于CUDA __umul24 函数,有用还是没用?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5544355/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com