gpt4 book ai didi

assembly - 为什么 dbra 在 Motorola 68k 中对于非常大的循环计数如此之快?

转载 作者:行者123 更新时间:2023-12-03 21:52:14 27 4
gpt4 key购买 nike

我正在学习摩托罗拉 68k 汇编,我写了以下浪费时间的循环:

    move.l #0x0fffffff,%d0
bsr timewaster
rts

timewaster:
dbra %d0,timewaster
rts
这个浪费时间的循环几乎立即完成。我在调试器中逐步检查代码以确保它实际上减去了 d0降至 0(确实如此)。然而,这个浪费时间的循环需要永远完成:
    move.l #0x0fffffff,%d0
bsr timewaster
rts

timewaster:
sub.l #1,%d0
bne timewaster
rts
那么为什么代码使用 dbra这么快?
我在 TI-89 模拟器中运行了这些。

最佳答案

虽然由于在真实处理器上的获取较少,所以会有一些改进,但时间上存在如此大差异的原因是两种方法使用不同的大小。
来自程序员引用手册,在 DBcc 的页面上:

If the termination condition is not true, the low-order 16 bits of the counter data register decrement by one. If the result is -1, execution continues with the next instruction. If the result is not equal to -1,execution continues at the location indicated by the current value of the program counter plus the sign-extended 16-bit displacement.


所以, DBcc指令仅操作和检查循环计数寄存器的低位字。 SUBBcc因此,版本将比 DBcc 花费大约 4000 倍的时间一。如果您使用 SUB.W而不是 SUB.L我希望您获得更多相似的运行时间。 DBcc指令将执行 0x10000 次,而 BNE指令将执行 0xFFFFFFF 次。
请注意,循环计数器的高位字如果不受 DBcc 的影响,所以你的循环应该在 D0 中以 0x0FFFFFFF 退出。 SUB.L/ BNE版本应以 D0 中的 0 退出。

这与问题没有特别的关系,但是通过阅读手册,似乎在某些地方对 DBcc 的确切行为存在轻微分歧。操作说明。具体来说,当条件为真时循环计数器为 0 时的行为。两者都导致不采用分支,但他们对循环计数寄存器中的最终结果存在分歧。
Programmer's Reference Manual, Revision 1 (M68000PM/AD, REV. 1) 指出条件为真优先,循环计数器的递减值不回存,在寄存器中留下 0。以下内容来自手册:
If Condition False
Then (Dn - 1 -> Dn; If Dn != -1 Then PC + d_n -> PC)
M68000 微处理器用户手册,第九版 (MC68000UM),附录 A(MC68010 循环模式操作)说,减一结果优先,结果为 -1 导致结果被存储回,留下 -1在注册表中。以下是根据手册中的描述构造的:
If Dn - 1 == -1
Then Dn - 1 -> Dn
Else
If Condition False
Then (Dn - 1 -> Dn; PC + d_n -> PC)
通常,计数导致的退出将保留 -1,而条件退出将保留不同的值(假设计数器未从 0xFFFF 开始)。当两者都为真时,两个来源就寄存器中的值存在分歧。
我假设 PRM 是正确的,它是行为的权威来源,并且因为它与 UM 中前面的描述相匹配,但 UM 可能暗示指令是如何实现的,至少在 MC68010 上是这样。

关于assembly - 为什么 dbra 在 Motorola 68k 中对于非常大的循环计数如此之快?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62568944/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com