gpt4 book ai didi

c - More Kernel 和 One Kernel More Dimension 的区别

转载 作者:太空宇宙 更新时间:2023-11-04 08:53:09 28 4
gpt4 key购买 nike

在大型网格中执行的任务调用两个内核有区别吗

1.
for(int i=0;i<2;i++)
{
dim3 dimBlock(16, 8);
dim3 dimGrid(1,1);
FooTask<<dimGrid,dimBlock>>>(MatrixA,MatrixB)
}
2.
dim3 dimBlock(16, 16);
dim3 dimGrid(1,1);
FooTask<<dimGrid,dimBlock>>>(MatrixA,MatrixB)

在 Gpu 上创建内核是否有成本。

最佳答案

内核至少有几微秒的启动开销。如果您的内核完成的工作非常小/很短,那么我希望第一种情况需要更长的时间。如果内核正在做大量的工作,那么差异应该很小,按百分比计算。

请注意 <<<32,1>>><<<64,1>>>如果您想利用 GPU 的强大功能,在网格配置中是非常糟糕的选择。每个 block 仅运行一个线程的网格(启动)配置可能会留下超过 95% 的 GPU 功能未使用。

关于c - More Kernel 和 One Kernel More Dimension 的区别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18902837/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com