gpt4 book ai didi

c++ - nppiResizeSqrPixel_32f_C4R() 如何工作?

转载 作者:行者123 更新时间:2023-11-28 01:50:06 25 4
gpt4 key购买 nike

上述函数如何在cuda中执行操作。我们是否需要将 CudaMalloc() 或 MemCopy() 与此一起编写,或者只是在内部进行所有这些调用。

我写了

nppiResizeSqrPixel_32f_C4R(&in[0],sizeofImage,StepSize,&out[0],StepSizeOutput,DestRoi,Xfactor,YFactor,NULL,NULL,16);

此处“in”是具有输入图像的 vector ,“out”是空 vector 。但是执行上述函数后,输出 vector 仍然是 '0' 。你能指导我如何调整函数的大小吗?

最佳答案

它对设备数据进行操作,因此您需要使用设备分配(例如 cudaMalloc)并将数据复制到设备(例如 cudaMemcpy)等。

usual place 上提供了数量有限的 npp 调用文档。还有CUDA sample codes演示了 npp 库调用利用的一些示例。

对于这些资源 Unresolved 问题,您可能还需要查看 intel ipp 文档。在许多情况下,npp 例程与 intel ipp 功能非常相似,因此您可能会在那里获得一些见解。 Here是一个示例文档。

同时检查任何适当的 CUDA 或 npp 调用的返回值,您还可以使用 cuda-memcheck 运行您的代码以获取有关可能出现问题的提示。

关于c++ - nppiResizeSqrPixel_32f_C4R() 如何工作?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43348429/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com