gpt4 book ai didi

cuda - NPP 函数可以作为设备函数调用吗?

转载 作者:行者123 更新时间:2023-12-01 00:35:12 27 4
gpt4 key购买 nike

NPP 函数,更具体的 npps ( https://docs.nvidia.com/cuda/npp/group__npps.html ) 是否可以作为设备函数调用?

如果我创建一个全局函数,我可以在内部调用 npps 函数作为 nppsMaxIndx_32f(计算向量的最大值)吗?

例子:我有 100 个向量,每个向量有 10000 个 float ,如果我在主机代码中这样做,我必须对 npp 函数进行 100 次调用

如果我创建一个包含 100 个线程的全局函数,并在内部为每个向量调用 npp 函数,以便它们同时启动,这可行吗? nppsMaxIndx_32f 可以作为设备函数调用吗?

最佳答案

这是不可能的——NPP 函数是仅主机函数。尝试会产生错误:

functions.cu(237): error: calling a __host__ function("nppsMaxIndx_32f") from a 
__global__ function("computeMax") is notallowed

functions.cu(237): error: identifier "nppsMaxIndx_32f" is undefined in device code

但是,在没有 GPU 同步的情况下在主机代码中进行调用将几乎同时调用它们,而无需等待前一个调用完成,但只有在不需要调用顺序和重叠调用的数据是完全独立的。

关于cuda - NPP 函数可以作为设备函数调用吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52979133/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com