gpt4 book ai didi

delphi - 为什么这个 LEA 指令不能编译?

转载 作者:行者123 更新时间:2023-12-03 15:46:31 24 4
gpt4 key购买 nike

我正在将 32 位 Delphi BASM 代码移植到 64 位 FPC(Win64 目标操作系统),并想知道为什么下一条指令不能在 64 位 FPC 中编译:

{$IFDEF FPC}
{$ASMMODE INTEL}
{$ENDIF}

procedure DoesNotCompile;
asm
LEA ECX,[ECX + ESI + $265E5A51]
end;

// Error: Asm: 16 or 32 Bit references not supported

可能的解决方法是:

procedure Compiles1;
asm
ADD ECX,ESI
ADD ECX,$265E5A51
end;

procedure Compiles2;
asm
LEA ECX,[RCX + RSI + $265E5A51]
end;

我只是不明白Win64目标中的32位LEA指令有什么问题(它在32位Delphi中编译正常,因此它是正确的CPU指令)。

<小时/>

优化备注:

接下来的代码是64位FPC 2.6.2编译的

  {$MODE DELPHI}
{$ASMMODE INTEL}

procedure Test;
asm
LEA ECX,[RCX + RSI + $265E5A51]
NOP
LEA RCX,[RCX + RSI + $265E5A51]
NOP
ADD ECX,$265E5A51
ADD ECX,ESI
NOP
end;

生成下一个汇编器输出:

00000000004013F0 4883ec08                 sub    $0x8,%rsp
project1.lpr:10 LEA ECX,[RCX + RSI + $265E5A51]
00000000004013F4 8d8c31515a5e26 lea 0x265e5a51(%rcx,%rsi,1),%ecx
project1.lpr:11 NOP
00000000004013FB 90 nop
project1.lpr:12 LEA RCX,[RCX + RSI + $265E5A51]
00000000004013FC 488d8c31515a5e26 lea 0x265e5a51(%rcx,%rsi,1),%rcx
project1.lpr:13 NOP
0000000000401404 90 nop
project1.lpr:14 ADD ECX,$265E5A51
0000000000401405 81c1515a5e26 add $0x265e5a51,%ecx
project1.lpr:15 ADD ECX,ESI
000000000040140B 01f1 add %esi,%ecx
project1.lpr:16 NOP
000000000040140D 90 nop
project1.lpr:17 end;
000000000040140E 4883c408 add $0x8,%rsp

获胜者是(7 个字节长):

LEA     ECX,[RCX + RSI + $265E5A51]

所有 3 个替代方案(包括不由 64 位 FPC 编译的 LEA ECX,[ECX + ESI + $265E5A51])均为 8 个字节长。

不确定获胜者的速度是最好的。

最佳答案

我认为这是 FPC 汇编器中的一个错误。您提供的 asm 代码是有效的,并且在 64 位模式下,将 LEA 与 32 位寄存器一起使用是完全有效的,就像您所做的那样。英特尔处理器文档对此事有明确说明。 Delphi 64 位内联汇编器接受此代码。

要解决此问题,您需要手动汇编代码:

DQ    $265e5a510e8c8d67

在 Delphi CPU View 中,结果如下:

Project1.dpr.12: DQ    $265e5a510e8c8d670000000000424160 678D8C0E515A5E26 lea ecx,[esi+ecx+$265e5a51]

I performed a very simple benchmarking to compare the use of 32 and 64 bit operands, and a version using two ADDs. The code looks like this:

{$APPTYPE CONSOLE}

uses
System.Diagnostics;

function BenchWithTwoAdds: Integer;
asm
MOV EDX,ESI
XOR EAX,EAX
MOV ESI,$98C34
MOV ECX,$ffffffff
@loop:
ADD EAX,ESI
ADD EAX,$265E5A51
DEC ECX
CMP ECX,0
JNZ @loop
MOV ESI,EDX
end;

function BenchWith32bitOperands: Integer;
asm
MOV EDX,ESI
XOR EAX,EAX
MOV ESI,$98C34
MOV ECX,$ffffffff
@loop:
LEA EAX,[EAX + ESI + $265E5A51]
DEC ECX
CMP ECX,0
JNZ @loop
MOV ESI,EDX
end;

{$IFDEF CPUX64}
function BenchWith64bitOperands: Integer;
asm
MOV EDX,ESI
XOR EAX,EAX
MOV ESI,$98C34
MOV ECX,$ffffffff
@loop:
LEA EAX,[RAX + RSI + $265E5A51]
DEC ECX
CMP ECX,0
JNZ @loop
MOV ESI,EDX
end;
{$ENDIF}

var
Stopwatch: TStopwatch;

begin
{$IFDEF CPUX64}
Writeln('64 bit');
{$ELSE}
Writeln('32 bit');
{$ENDIF}
Writeln;

Writeln('BenchWithTwoAdds');
Stopwatch := TStopwatch.StartNew;
Writeln('Value = ', BenchWithTwoAdds);
Writeln('Elapsed time = ', Stopwatch.ElapsedMilliseconds);
Writeln;

Writeln('BenchWith32bitOperands');
Stopwatch := TStopwatch.StartNew;
Writeln('Value = ', BenchWith32bitOperands);
Writeln('Elapsed time = ', Stopwatch.ElapsedMilliseconds);
Writeln;

{$IFDEF CPUX64}
Writeln('BenchWith64bitOperands');
Stopwatch := TStopwatch.StartNew;
Writeln('Value = ', BenchWith64bitOperands);
Writeln('Elapsed time = ', Stopwatch.ElapsedMilliseconds);
{$ENDIF}

Readln;
end.

我的 Intel i5-2300 上的输出:

32 bitBenchWithTwoAddsValue = -644343429Elapsed time = 2615BenchWith32bitOperandsValue = -644343429Elapsed time = 3915----------------------64 bitBenchWithTwoAddsValue = -644343429Elapsed time = 2612BenchWith32bitOperandsValue = -644343429Elapsed time = 3917BenchWith64bitOperandsValue = -644343429Elapsed time = 3918

正如您所看到的,基于此,LEA 选项之间没有任何选择。它们的时间之间的差异完全在测量的可变性范围内。然而,两次使用 ADD 的变体毫无疑问地获胜了。

不同机器的一些不同结果。以下是 Xeon E5530 上的输出:

64 bitBenchWithTwoAddsValue = -644343429Elapsed time = 3434BenchWith32bitOperandsValue = -644343429Elapsed time = 3295BenchWith64bitOperandsValue = -644343429Elapsed time = 3279

在 Xeon E5-4640 v2 上:

64 bitBenchWithTwoAddsValue = -644343429Elapsed time = 4102BenchWith32bitOperandsValue = -644343429Elapsed time = 5868BenchWith64bitOperandsValue = -644343429Elapsed time = 5868

关于delphi - 为什么这个 LEA 指令不能编译?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26485966/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com