gpt4 book ai didi

CUDA,如何选择<<< block ,线程<>>?

转载 作者:行者123 更新时间:2023-12-04 04:41:55 28 4
gpt4 key购买 nike

在一个库中,我使用对几个CUDA内核的调用。我当然想获得最佳性能。用户使用该库的方式可能会有所不同。

块/线程的数量对此有重大影响。

有关于如何选择块/线程以获得最佳性能的规则吗?

例如(只是一个问题),最好选择块高,线程低的块吗?还是相反?
还是最好使用GetDeviceProperties()中的某些值?

最佳答案

您可以使用NVIDIA提供的dependency Calculator.xls来选择[您必须尝试更改xls中的线程和块的值]最佳配置,在该配置上您可以获得最佳占用率,从而获得最佳性能。

关于CUDA,如何选择<<< block ,线程<>>?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12660060/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com