gpt4 book ai didi

cuda - NPP功能没有完全优化吗?

转载 作者:行者123 更新时间:2023-12-04 03:45:10 25 4
gpt4 key购买 nike

我开发了一个朴素的功能,可以使用CUDA C++在水平或垂直方向上镜像图像。

然后我才知道NVIDIA Performance Primitives Library还提供了图像镜像功能。

为了比较起见,我将我的功能与NPP进行了计时。出乎意料的是,我的功能表现出色(尽管差距不大,但仍然...)。

我使用Windows计时器和CUDA计时器多次确认了结果。

我的问题是: NPP功能不是针对NVIDIA GPU完全优化的吗?

我正在使用CUDA 5.0,GeForce GTX460M(计算2.1)和Windows 8进行开发。

最佳答案

我冒通过发布此答案而得不到投票的风险。 :)

NVIDIA不断努力改善我们所有的CUDA库。 NPP是一个特别大的库,具有4000多个要维护的功能。我们的一个现实目标是为库提供比CPU等效的有用的加速,这些库已经在我们所有的GPU和支持的OS上进行了测试,并且得到了积极的改进和维护。有问题的功能(镜像)是一个已知的性能问题,我们将在以后的版本中对其进行改进。如果您需要对特定功能进行优化,则最好的方法是对其进行优先级排序是使用NVIDIA CUDA registered developers可以使用的错误提交表单提交RFE错误(增强请求)。

顺便说一句,我认为没有一个库可以被“完全优化”。有了一个庞大的库来支持不断增长的庞大硬件基础,对它进行优化的工作就永远不会完成! :)

我们鼓励人们继续尝试超越NVIDIA库,因为总的来说,它可以提高技术水平并有益于计算生态系统。

关于cuda - NPP功能没有完全优化吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12422498/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com