gpt4 book ai didi

c++ - 如何在内部函数中使用 if 条件

转载 作者:行者123 更新时间:2023-12-02 09:57:32 24 4
gpt4 key购买 nike

我想使用内部函数比较两个浮点变量。如果比较是真的,做点别的做点什么。我想按照正常的 if..else 条件来执行此操作。有没有办法使用内在函数?

//normal code
vector<float> v1, v2;
for(int i = 0; i < v1.size(); ++i)
if(v1[i]<v2[i])
{
//do something
}
else
{
//do something
)

如何使用 SSE2 或 AVX 做到这一点?

最佳答案

如果您期望 v1[i] < v2[i]几乎从不为真,几乎总是为真,或者通常长期保持不变(即使总体上可能没有特别的偏见),那么另一种技术也适用,它提供“真正的条件”(即不是“两者都做, discard one result")),这当然是一个代价,但你也可以实际跳过工作而不是仅仅忽略一些结果。

该技术相当简单,进行比较(矢量化),使用 _mm_movemask_ps 收集比较掩码,然后你有 3 个案例:

  • 所有比较都以相同的方式进行,它们都是 false ,执行适当的“做某事”代码,现在可能更容易矢量化,因为条件消失了。
  • 所有比较都以相同的方式进行,它们都是 true , 一样。
  • 混合型,使用更复杂的逻辑。根据您的需要,您可以分别检查所有位(回退到标量代码,但现在整个批处理只需 1 FP 比较),或者使用“仅迭代(未)设置位”技巧之一(很好地结合使用 bitscan 来恢复实际索引),或者有时您可以像往常一样退回到进行屏蔽和合并。

并非所有 3 种情况都总是相关的,通常你会应用它,因为谓词几乎总是以相同的方式进行,使得“所有相同”的情况之一非常罕见,以至于你可以将其与“混合”混为一谈.

这种技术绝对不是总是有用的。 “混合”的情况复杂而缓慢。快速路径必须通用且足够快,以值得测试您是否可以接受。

但它可能很有用,也许一侧非常缓慢且烦人,而分支的另一侧是很好的简单矢量化代码,相比之下不需要那么长时间。例如,慢速端可能必须对其他快速逼近的超越函数进行参数缩减,或者它可能必须在获取点积之前对某些 vector 进行归一化,或者对矩阵进行正交化,甚至可能从磁盘中获取数据。

或者,也许双方都不是很慢,但是他们从缓存中逐出彼此的数据(也许双方都是一个适合缓存的数组的循环,但数组不适合放在一起)所以无条件地这样做减慢他们两个。这可能是真的,但我还没有在野外看到它。

或者,也许一侧不能无条件地执行,做一些通常具有破坏性的事情,甚至可能是一些 IO。例如,如果您正在检查错误情况并记录它们。

关于c++ - 如何在内部函数中使用 if 条件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38006616/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com