gpt4 book ai didi

c++ - 如何检查 AVX intrinsic __m256 的 inf

转载 作者:太空狗 更新时间:2023-10-29 20:03:12 25 4
gpt4 key购买 nike

检查 AVX 内在 __m256(8 个 float 的 vector )是否包含任何 inf 的最佳方法是什么?我试过了

__m256 X=_mm256_set1_ps(1.0f/0.0f);
_mm256_cmp_ps(X,X,_CMP_EQ_OQ);

但这与 true 相比。请注意,此方法将找到 nan(与 false 比较)。所以一种方法是检查 X!=nan && 0*X==nan:

__m256 Y=_mm256_mul_ps(X,_mm256_setzero_ps());   // 0*X=nan if X=inf
_mm256_andnot_ps(_mm256_cmp_ps(Y,Y,_CMP_EQ_OQ),
_mm256_cmp_ps(X,X,_CMP_EQ_OQ));

但是,这看起来有些冗长。有没有更快的方法?

最佳答案

如果你想检查一个 vector 是否有任何无穷大:

#include <limits>

bool has_infinity(__m256 x){
const __m256 SIGN_MASK = _mm256_set1_ps(-0.0);
const __m256 INF = _mm256_set1_ps(std::numeric_limits<float>::infinity());

x = _mm256_andnot_ps(SIGN_MASK, x);
x = _mm256_cmp_ps(x, INF, _CMP_EQ_OQ);
return _mm256_movemask_ps(x) != 0;
}

如果你想要一个无穷大值的 vector 掩码:

#include <limits>

__m256 is_infinity(__m256 x){
const __m256 SIGN_MASK = _mm256_set1_ps(-0.0);
const __m256 INF = _mm256_set1_ps(std::numeric_limits<float>::infinity());

x = _mm256_andnot_ps(SIGN_MASK, x);
x = _mm256_cmp_ps(x, INF, _CMP_EQ_OQ);
return x;
}

关于c++ - 如何检查 AVX intrinsic __m256 的 inf,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30674291/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com