gpt4 book ai didi

c# - 使用 SIMD 查找 Span 中是否存在 'ushort' 的最快方法?

转载 作者:太空狗 更新时间:2023-10-30 01:29:15 28 4
gpt4 key购买 nike

在 .NET Core 上的 C# 中,我正在寻找最快的方法来检查给定的 ushort 是否存在。值存在于 Span<ushort> 中范围。天真的选项包括枚举跨度,但我强烈怀疑通过 SIMD(即 SSE 或 AVX)存在更快的单核选项。

这里最快的选项是什么? (不安全的代码是可以的)

最佳答案

基本实现(在应用优化之前,例如 Peter 在评论中描述的优化)可能会像这样工作:

static unsafe bool ContainsUshort(Span<ushort> data, ushort val)
{
int vecSize = Vector<ushort>.Count;
var value = new Vector<ushort>(val);
int i;
fixed (ushort* ptr = &data[0])
{
int limit = data.Length - vecSize;
for (i = 0; i <= limit; i += vecSize)
{
var d = Unsafe.ReadUnaligned<Vector<ushort>>(ptr + i);
if (Vector.EqualsAny(d, value))
return true;
}
}
for (; i < data.Length; i++)
{
if (data[i] == val)
return true;
}
return false;
}

这需要用于不安全读取的 System.Runtime.CompilerServices.Unsafe 包,如果不从跨度(或数组)创建向量,效率会低得多。顺便说一下,EqualsAny 内在函数是用 (v)ptest 而不是 (v)pmovmskb 实现的,ptest 通常花费更多微操作,因此相对而言,将其影响降至最低更为重要 - 但由于无法直接访问 ptestpmovmskb(可以通过使用较新的平台来避免此限制- 特定的 System.Runtime.Intrinsics.X86 API)最终的“条件向量”AFAIK 仍然必须使用 Vector.EqualsAny 完成(向量填充为 0xFFFF)这有点傻..不过它在我的机器上要快一点(测试返回值将是false,所以稍早的非展开版本的退出没有进入播放)

var allSet = new Vector<ushort>(0xFFFF);
int limit = data.Length - vecSize * 2;
for (i = 0; i <= limit; i += vecSize * 2)
{
var d0 = Unsafe.ReadUnaligned<Vector<ushort>>(ptr + i);
var d1 = Unsafe.ReadUnaligned<Vector<ushort>>(ptr + i + vecSize);
var eq = Vector.Equals(d0, value) | Vector.Equals(d1, value);
if (Vector.EqualsAny(eq, allSet))
return true;
}

关于c# - 使用 SIMD 查找 Span<ushort> 中是否存在 'ushort' 的最快方法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53342460/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com