gpt4 book ai didi

c++ - OpenCL,float vs uint,预期的性能提升?

转载 作者:太空宇宙 更新时间:2023-11-04 02:48:50 24 4
gpt4 key购买 nike

在 OpenCL 内核中使用 (u)int16 而不是 float 的预期性能增益是多少?如果有的话?我希望内存传输大致除以二,但设备负载呢?

奇怪的是,我几乎找不到关于这个主题的任何工作台或文档。 (或者也许我的 google fu 只是让我失望了...)

我正在研究图像处理(主要是过滤)。精度并不是那么关键,实际上几个内核操作的结果被转换成一个字符。我们缩小了几个可以接受较短数据类型的操作。所以我想知道是否可以通过在精度不重要的情况下使用较短的数据来加快这些操作。

感谢您的帮助。

最佳答案

GPU 倾向于比整数更好地执行浮点运算。例如,有些会为浮点运算提供额外的流水线,将所有内容整合起来只会降低 GPU 的吞吐量。数据复制可能不是您的瓶颈,使用 16 位整数将数量减半可能无济于事。此外,在英特尔或 AMD 等集成 GPU 上,您可以获得零复制行为。因此对图像或缓冲区大小的影响很小(在一定程度上)。

此外,您还可以查看 16 位 float 支持。这让您可以两全其美(一半的数据带有 float )。

关于c++ - OpenCL,float vs uint,预期的性能提升?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24238915/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com