gpt4 book ai didi

c - SSE 中的 0xFFFF 标志

转载 作者:太空宇宙 更新时间:2023-11-04 01:58:07 28 4
gpt4 key购买 nike

我想创建一个 SSE 寄存器,其值可以存储在一个整数数组中,来自另一个包含标志 0xFFFF 和零的 SSE 寄存器。例如:

__m128i regComp = _mm_cmpgt_epi16(regA, regB);

为了论证,我们假设 regComp 加载了 { 0, 0xFFFF, 0, 0xFFFF }。我想将其转换为 { 0, 80, 0, 80 }

我的想法是创建一个整数数组,初始化为 80 并将它们加载到寄存器 regC。然后,在regCregComp 之间执行_mm_and_si128 并将结果存储在regD 中。然而,这并不能解决问题,这让我认为我不理解 SSE 寄存器中的正标志。有人可以回答这个问题并简要解释为什么我的解决方案不起作用吗?

short valA[16] = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16 };
short valB[16] = { 5, 5, 5, 5, 5, 5, 5, 5, 5, 10, 10, 10, 10, 10, 10, 10 };
short ones[16] = { 1 };
short final[16];

__m128i vA, vB, vOnes, vRes, vRes2;

vOnes = _mm_load_si128((__m128i *)&(ones)[0] );

for( i=0 ; i < 16 ;i+=8){
vA = _mm_load_si128((__m128i *)&(valA)[i] );
vB = _mm_load_si128((__m128i *)&(valB)[i] );

vRes = _mm_cmpgt_epi16(vA,vB);

vRes2 = _mm_and_si128(vRes,vOnes);
_mm_storeu_si128((__m128i *)&(final)[i], vRes2);
}

最佳答案

您只需将数组 ones 的第一个元素设置为 1(数组的其余部分初始化为 0)。

我建议您完全删除数组 ones,然后更改这一行:

vOnes = _mm_load_si128((__m128i *)&(ones)[0] );

到:

vOnes = _mm_set1_epi16(1);

不过,如果您只想将 SIMD TRUE (0xffff) 结果转换为 1,可能是一个更好的解决方案,那就是使用 shift:

for (i = 0; i < 16; i += 8) {
vA = _mm_loadu_si128((__m128i *)&pA[i]);
vB = _mm_loadu_si128((__m128i *)&pB[i]);

vRes = _mm_cmpgt_epi16(vA, vB); // generate 0xffff/0x0000 results

vRes = _mm_srli_epi16(vRes, 15); // convert to 1/0 results

_mm_storeu_si128((__m128i *)&final[i], vRes2);
}

关于c - SSE 中的 0xFFFF 标志,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30975329/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com