gpt4 book ai didi

performance - 我应该创建多个 OpenCL 内核来避免条件语句吗?

转载 作者:行者123 更新时间:2023-12-04 06:42:11 26 4
gpt4 key购买 nike

在 OpenCL 中,我有一个内核需要对复杂的真实数据进行操作。我可以在其中放置一个条件语句来调用正确的代码行来处理这个问题,或者我可以有两个内核来调用并将条件语句推送到我的调用代码中。

这显然不利于可维护性,但它对性能重要吗?

最佳答案

如果这只是一个条件语句,根据我的经验,性能差异绝对可以忽略不计,至少在 NVidia 硬件上是这样。

基本上,只要所有(或大多数)工作项都遵循相同的代码路径,就可以了。由于采用的代码路径取决于您的情况下的内核参数,因此所有工作项都遵循相同的路径。

关于performance - 我应该创建多个 OpenCL 内核来避免条件语句吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4109307/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com