- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在将 32 位 Delphi BASM 代码移植到 64 位 FPC(Win64 目标操作系统),并想知道为什么下一条指令不能在 64 位 FPC 中编译:
{$IFDEF FPC}
{$ASMMODE INTEL}
{$ENDIF}
procedure DoesNotCompile;
asm
LEA ECX,[ECX + ESI + $265E5A51]
end;
// Error: Asm: 16 or 32 Bit references not supported
可能的解决方法是:
procedure Compiles1;
asm
ADD ECX,ESI
ADD ECX,$265E5A51
end;
procedure Compiles2;
asm
LEA ECX,[RCX + RSI + $265E5A51]
end;
我只是不明白Win64目标中的32位LEA
指令有什么问题(它在32位Delphi中编译正常,因此它是正确的CPU指令)。
优化备注:
接下来的代码是64位FPC 2.6.2编译的
{$MODE DELPHI}
{$ASMMODE INTEL}
procedure Test;
asm
LEA ECX,[RCX + RSI + $265E5A51]
NOP
LEA RCX,[RCX + RSI + $265E5A51]
NOP
ADD ECX,$265E5A51
ADD ECX,ESI
NOP
end;
生成下一个汇编器输出:
00000000004013F0 4883ec08 sub $0x8,%rsp
project1.lpr:10 LEA ECX,[RCX + RSI + $265E5A51]
00000000004013F4 8d8c31515a5e26 lea 0x265e5a51(%rcx,%rsi,1),%ecx
project1.lpr:11 NOP
00000000004013FB 90 nop
project1.lpr:12 LEA RCX,[RCX + RSI + $265E5A51]
00000000004013FC 488d8c31515a5e26 lea 0x265e5a51(%rcx,%rsi,1),%rcx
project1.lpr:13 NOP
0000000000401404 90 nop
project1.lpr:14 ADD ECX,$265E5A51
0000000000401405 81c1515a5e26 add $0x265e5a51,%ecx
project1.lpr:15 ADD ECX,ESI
000000000040140B 01f1 add %esi,%ecx
project1.lpr:16 NOP
000000000040140D 90 nop
project1.lpr:17 end;
000000000040140E 4883c408 add $0x8,%rsp
获胜者是(7 个字节长):
LEA ECX,[RCX + RSI + $265E5A51]
所有 3 个替代方案(包括不由 64 位 FPC 编译的 LEA ECX,[ECX + ESI + $265E5A51]
)均为 8 个字节长。
不确定获胜者的速度是最好的。
最佳答案
我认为这是 FPC 汇编器中的一个错误。您提供的 asm 代码是有效的,并且在 64 位模式下,将 LEA 与 32 位寄存器一起使用是完全有效的,就像您所做的那样。英特尔处理器文档对此事有明确说明。 Delphi 64 位内联汇编器接受此代码。
要解决此问题,您需要手动汇编代码:
DQ $265e5a510e8c8d67
在 Delphi CPU View 中,结果如下:
Project1.dpr.12: DQ $265e5a510e8c8d670000000000424160 678D8C0E515A5E26 lea ecx,[esi+ecx+$265e5a51]
I performed a very simple benchmarking to compare the use of 32 and 64 bit operands, and a version using two ADDs. The code looks like this:
{$APPTYPE CONSOLE}
uses
System.Diagnostics;
function BenchWithTwoAdds: Integer;
asm
MOV EDX,ESI
XOR EAX,EAX
MOV ESI,$98C34
MOV ECX,$ffffffff
@loop:
ADD EAX,ESI
ADD EAX,$265E5A51
DEC ECX
CMP ECX,0
JNZ @loop
MOV ESI,EDX
end;
function BenchWith32bitOperands: Integer;
asm
MOV EDX,ESI
XOR EAX,EAX
MOV ESI,$98C34
MOV ECX,$ffffffff
@loop:
LEA EAX,[EAX + ESI + $265E5A51]
DEC ECX
CMP ECX,0
JNZ @loop
MOV ESI,EDX
end;
{$IFDEF CPUX64}
function BenchWith64bitOperands: Integer;
asm
MOV EDX,ESI
XOR EAX,EAX
MOV ESI,$98C34
MOV ECX,$ffffffff
@loop:
LEA EAX,[RAX + RSI + $265E5A51]
DEC ECX
CMP ECX,0
JNZ @loop
MOV ESI,EDX
end;
{$ENDIF}
var
Stopwatch: TStopwatch;
begin
{$IFDEF CPUX64}
Writeln('64 bit');
{$ELSE}
Writeln('32 bit');
{$ENDIF}
Writeln;
Writeln('BenchWithTwoAdds');
Stopwatch := TStopwatch.StartNew;
Writeln('Value = ', BenchWithTwoAdds);
Writeln('Elapsed time = ', Stopwatch.ElapsedMilliseconds);
Writeln;
Writeln('BenchWith32bitOperands');
Stopwatch := TStopwatch.StartNew;
Writeln('Value = ', BenchWith32bitOperands);
Writeln('Elapsed time = ', Stopwatch.ElapsedMilliseconds);
Writeln;
{$IFDEF CPUX64}
Writeln('BenchWith64bitOperands');
Stopwatch := TStopwatch.StartNew;
Writeln('Value = ', BenchWith64bitOperands);
Writeln('Elapsed time = ', Stopwatch.ElapsedMilliseconds);
{$ENDIF}
Readln;
end.
我的 Intel i5-2300 上的输出:
32 bitBenchWithTwoAddsValue = -644343429Elapsed time = 2615BenchWith32bitOperandsValue = -644343429Elapsed time = 3915----------------------64 bitBenchWithTwoAddsValue = -644343429Elapsed time = 2612BenchWith32bitOperandsValue = -644343429Elapsed time = 3917BenchWith64bitOperandsValue = -644343429Elapsed time = 3918
正如您所看到的,基于此,LEA 选项之间没有任何选择。它们的时间之间的差异完全在测量的可变性范围内。然而,两次使用 ADD
的变体毫无疑问地获胜了。
不同机器的一些不同结果。以下是 Xeon E5530 上的输出:
64 bitBenchWithTwoAddsValue = -644343429Elapsed time = 3434BenchWith32bitOperandsValue = -644343429Elapsed time = 3295BenchWith64bitOperandsValue = -644343429Elapsed time = 3279
在 Xeon E5-4640 v2 上:
64 bitBenchWithTwoAddsValue = -644343429Elapsed time = 4102BenchWith32bitOperandsValue = -644343429Elapsed time = 5868BenchWith64bitOperandsValue = -644343429Elapsed time = 5868
关于delphi - 为什么这个 LEA 指令不能编译?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26485966/
谁能告诉我这条汇编指令的意义是什么: 0xb48daed9 : lea -0xc(%ebp),%esp 我对组装说明不是很满意。实际上,我在我的应用程序中收到了一个 SIGABRT,罪魁祸首似乎是这个
LEA: Improving Sentence Similarity Robustness to Typos Using Lexical Attention Bias 论文阅读 KDD 202
这个问题在这里已经有了答案: 9年前关闭。 Possible Duplicate: What's the purpose of the LEA instruction? 当我需要某个地址的值时,我可以
我只是想确保我读对了: movl 12(%ebp), %edx leal (%edx, %edx, 4), %eax 我将第一行读为:edx = [epb + 12] ,第二行为:eax = edx
对我来说,这似乎只是一部时髦的 MOV。它的用途是什么?我应该何时使用它? 最佳答案 正如其他人指出的那样,LEA(加载有效地址)经常被用作进行某些计算的“技巧”,但这不是它的主要目的。 x86 指令
This question说LEA指令可以用来做算术。 据我了解,而不是: inc eax mov ecx, 5 mul ecx mov ebx, eax 我可以简单地写 lea ebx, [(eax
这个问题已经有答案了: What's the purpose of the LEA instruction? (17 个回答) 已关闭 5 年前。 我不完全理解前两行的含义以及后两行的区别.. LDS
我试图理解这条线是如何工作的: lea (%eax, %eax, 4), %eax 所以它看起来基本上是这样说的: %eax = 5* %eax 但是 LEA 是将其视为已签名还是未签名? 最佳答案
你好,我有一个关于 lea 指令和数组的问题,这很好用: char *msg = new char[6]; msg = "hello"; _asm{ push 10h p
我被这个问题弄糊涂了:执行指令“LEA R0,A”后寄存器0中存储的值是多少?为什么答案是x370C?我估计它应该加载A 到 R0 的地址?如果是这样,我们怎么知道地址?有人可以帮忙吗?非常感谢! .
我正在处理性能至关重要的应用程序的一个非常低级别的部分。 在调查生成的程序集时,我注意到以下说明: lea eax,[edx*8+8] 在使用内存引用(例如 [edx+4])时,我习惯于看到加法,但这
这个问题在这里已经有了答案: What's the purpose of the LEA instruction? (17 个回答) 7年前关闭。 我正在学习 x86 汇编,并且在使用 lea 指令时
这个问题在这里已经有了答案: What's the purpose of the LEA instruction? (17 个答案) 关闭 7 年前。 我在摆弄 gcc 的优化选项,发现这些行: i
我正在将 32 位 Delphi BASM 代码移植到 64 位 FPC(Win64 目标操作系统),并想知道为什么下一条指令不能在 64 位 FPC 中编译: {$IFDEF FPC} {$AS
LEA指令支持负位移吗? mov rax, 1 lea rsi, [rsp - rax] 当我在 asm 文件中使用上述代码时,出现错误: $ nasm -f macho64 test.asm $ e
我再次在寻找最基本问题的答案时遇到问题。这次我正在为类作业研究二元炸弹的第二阶段。我将在下面发布反汇编代码。 我很难理解 线上发生的事情。据我所知,到目前为止,它试图将 ((4 * %edx) +
我遇到这种错误: beroset-p-637-invalid effective address 这是一个包含错误行的示例代码块: mov eax, 3 mov ebx, 0 lea ecx, [re
我从下面的链接看到haswell的微架构提到有些管道可以进行快速LEA,有些可以运行慢速LEA,这里的快速LEA和慢速LEA是什么意思?与 LEA 指令相关?搜索结果通常偏向于 LEA 指令,不会导致
我在通过GDB查看一些文件的时候发现,很频繁,函数开头有这三行代码 0x08048548 : lea ecx,[esp+0x4] 0x0804854c : and
我正在使用 libdis ,来自 the bastard 的 x86 反汇编程序库,我试图找出哪些指令访问内存。 引用这两条指令: mov eax, [ebx + 10] lea eax, [ebx
我是一名优秀的程序员,十分优秀!