gpt4 book ai didi

c# - 为什么 Calli 比委托(delegate)调用更快?

转载 作者:IT王子 更新时间:2023-10-29 03:55:44 26 4
gpt4 key购买 nike

我在玩 Reflection.Emit 并发现了关于很少使用的 EmitCalli .出于好奇,我想知道它是否与常规方法调用有什么不同,所以我编写了以下代码:

using System;
using System.Diagnostics;
using System.Reflection.Emit;
using System.Runtime.InteropServices;
using System.Security;

[SuppressUnmanagedCodeSecurity]
static class Program
{
const long COUNT = 1 << 22;
static readonly byte[] multiply = IntPtr.Size == sizeof(int) ?
new byte[] { 0x8B, 0x44, 0x24, 0x04, 0x0F, 0xAF, 0x44, 0x24, 0x08, 0xC3 }
: new byte[] { 0x0f, 0xaf, 0xca, 0x8b, 0xc1, 0xc3 };

static void Main()
{
var handle = GCHandle.Alloc(multiply, GCHandleType.Pinned);
try
{
//Make the native method executable
uint old;
VirtualProtect(handle.AddrOfPinnedObject(),
(IntPtr)multiply.Length, 0x40, out old);
var mulDelegate = (BinaryOp)Marshal.GetDelegateForFunctionPointer(
handle.AddrOfPinnedObject(), typeof(BinaryOp));

var T = typeof(uint); //To avoid redundant typing

//Generate the method
var method = new DynamicMethod("Mul", T,
new Type[] { T, T }, T.Module);
var gen = method.GetILGenerator();
gen.Emit(OpCodes.Ldarg_0);
gen.Emit(OpCodes.Ldarg_1);
gen.Emit(OpCodes.Ldc_I8, (long)handle.AddrOfPinnedObject());
gen.Emit(OpCodes.Conv_I);
gen.EmitCalli(OpCodes.Calli, CallingConvention.StdCall,
T, new Type[] { T, T });
gen.Emit(OpCodes.Ret);

var mulCalli = (BinaryOp)method.CreateDelegate(typeof(BinaryOp));

var sw = Stopwatch.StartNew();
for (int i = 0; i < COUNT; i++) { mulDelegate(2, 3); }
Console.WriteLine("Delegate: {0:N0}", sw.ElapsedMilliseconds);
sw.Reset();

sw.Start();
for (int i = 0; i < COUNT; i++) { mulCalli(2, 3); }
Console.WriteLine("Calli: {0:N0}", sw.ElapsedMilliseconds);
}
finally { handle.Free(); }
}

delegate uint BinaryOp(uint a, uint b);

[DllImport("kernel32.dll", SetLastError = true)]
static extern bool VirtualProtect(
IntPtr address, IntPtr size, uint protect, out uint oldProtect);
}

我在 x86 模式和 x64 模式下运行代码。结果呢?

32-bit:

  • Delegate version: 994
  • Calli version: 46

64-bit:

  • Delegate version: 326
  • Calli version: 83

我想这个问题现在已经很明显了……为什么会有如此巨大的速度差异?


更新:

我也创建了一个 64 位 P/Invoke 版本:

  • Delegate version: 284
  • Calli version: 77
  • P/Invoke version: 31

显然,P/Invoke 更快...这是我的基准测试的问题,还是发生了什么我不明白的事情? (顺便说一句,我处于 Release模式。)

最佳答案

鉴于您的性能数据,我假设您一定在使用 2.0 框架或类似的东西? 4.0 中的数字要好得多,但“Marshal.GetDelegate”版本仍然较慢。

问题是,并非所有代表生来都是平等的。

托管代码函数的委托(delegate)本质上只是一个直接的函数调用(在 x86 上,这是一个 __fastcall),如果您正在调用一个静态函数,则添加一点“switcheroo”(但这只是 3 或 4 条指令x86).

另一方面,由“Marshal.GetDelegateForFunctionPointer”创建的委托(delegate)是对“ stub ”函数的直接函数调用,它在调用非托管函数之前会产生一些开销(编码等)。在这种情况下,几乎没有编码,并且此调用的编码在 4.0 中似乎已经优化(但很可能仍然通过 2.0 上的 ML 解释器) - 但即使在 4.0 中,也有一个 stackWalk 要求非托管代码权限不是您的审稿人代表的一部分。

我通常发现,如果不了解 .NET 开发团队中的某个人,要弄清楚托管/非托管互操作发生了什么,最好的办法是对 WinDbg 和 SOS 进行一些挖掘。

关于c# - 为什么 Calli 比委托(delegate)调用更快?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5893024/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com