gpt4 book ai didi

C# 标记结构性能

转载 作者:行者123 更新时间:2023-11-30 14:07:39 25 4
gpt4 key购买 nike

在 F# 中,我们有几个非常好的设计时类型安全解决方案:类型别名和单例结构联合(并且没有开始的隐式转换!):

// type aliases are erased at compile time
type Offset = int64<offset>

// no allocations
[<Struct>]
type Offset = Offset of int64

C# 的替代方案是什么?

我从未见过标记结构(包含单个元素)的实际用法,但看起来如果我们添加显式 类型转换,那么我们可以获得与类型别名非常相似的设计时行为在 F# 中。也就是说 - IDE 会提示类型不匹配,并且必须显式转换值。

下面是一些POC代码:

public struct Offset {
private readonly long _value;
private Offset(long value) {
_value = value;
}

[MethodImpl(MethodImplOptions.AggressiveInlining)]
public static explicit operator Offset(long value) {
return new Offset(value);
}

[MethodImpl(MethodImplOptions.AggressiveInlining)]
public static explicit operator long(Offset offset) {
return offset._value;
}
}

public interface IIndex<T> {
Offset OffsetOf(T value);
T AtOffset(Offset offset);
}

public class SmapleUsage
{
public void Test(IIndex<long> idx)
{
// without explicit cast we have nice red squiggles
var valueAt = idx.AtOffset((Offset)123);
long offset = (long)idx.OffsetOf(42L);
}
}

所以,IDE 很不错!但是我打算问什么是性能影响和其他缺点,并且为了避免“只是衡量它”评论只是衡量它并且最初停止写这个问题......但结果却相反 -直观的:

[Test]
public void OffsetTests() {
var array = Enumerable.Range(0, 1024).ToArray();
var sw = new Stopwatch();

for (int rounds = 0; rounds < 10; rounds++) {
sw.Restart();
long sum = 0;
for (int rp = 0; rp < 1000000; rp++) {
for (int i = 0; i < array.Length; i++) {
sum += GetAtIndex(array, i);
}
}
sw.Stop();
if (sum < 0) throw new Exception(); // use sum after loop
Console.WriteLine($"Index: {sw.ElapsedMilliseconds}");

sw.Restart();
sum = 0;
for (int rp = 0; rp < 1000000; rp++) {
for (int i = 0; i < array.Length; i++) {
sum += GetAtOffset(array, (Offset)i);
}
}
if (sum < 0) throw new Exception(); // use sum after loop
sw.Stop();
Console.WriteLine($"Offset: {sw.ElapsedMilliseconds}");

sw.Restart();
sum = 0;
for (int rp = 0; rp < 1000000; rp++) {
for (int i = 0; i < array.Length; i++) {
sum += array[i];
}
}
if (sum < 0) throw new Exception(); // use sum after loop
sw.Stop();
Console.WriteLine($"Direct: {sw.ElapsedMilliseconds}");
}
}

[MethodImpl(MethodImplOptions.AggressiveInlining)]
private int GetAtIndex(int[] array, long index) {
return array[index];
}

[MethodImpl(MethodImplOptions.AggressiveInlining)]
private int GetAtOffset(int[] array, Offset offset) {
return array[(long)offset];
}

令人惊讶的是,在 i7@2.2Hz x64/Release 上,使用 Offset 的情况在每一轮测试中都明显更快 - 典型值为:

Int64: 1046
Offset: 932
Direct: 730

与仅使用 int64 相比,我希望得到相同或更慢的结果。那么这是怎么回事?您能否重现相同的差异或发现一些缺陷,例如如果我测量不同的东西?

最佳答案

1. 在 Int64 测试中将 for (int i = 0; 替换为 for (long i = 0; 后,性能将与直接测试相同。

在使用 int 时,它会生成这样的 x86-64 指令:

inc         ecx  
cmp ecx,0F4240h

在使用 long 时,它会生成这样的 x86-64 指令:

inc         rcx  
cmp rcx,0F4240h

因此,使用 32 位寄存器 ecx 或其 64 位版本 rcx 的唯一区别,由于 CPU 设计,后者速度更快。

2.在 Offset 测试中使用 long 作为迭代器,您会看到类似的性能。

3. 因为代码在 Release模式下进行了优化,所以使用Int64Offset几乎没有区别,但是在某些时候对说明进行了一些重新安排。

使用 Offset 时(少一条指令):

movsxd      rdx,eax  
movsxd r8,r14d
cmp rdx,r8
jae <address>

使用 Int64 时(多一条指令):

movsxd      rdx,r14d  
movsxd r8,eax
cmp r8,rdx
jae <address>
movsxd rdx,eax

4. 直接测试是最快的,因为它不使用上面#3 中显示的指令进行数组边界检查。当您编写如下循环时会发生此优化:

for (var i=0; i<array.Length; i++) { ... array[i] ... }

通常,如果您的索引在数组边界之外,它会抛出 IndexOutOfRangeException,但在这种情况下,编译器知道它不会发生,因此它会忽略检查。

然后,即使在其他测试中有额外的指令,由于 CPU 分支预测器,它们也具有相似的性能,它会在需要时提前开始运行指令,并在条件失败时丢弃结果。

关于C# 标记结构性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39179385/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com