- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在考虑如何取反 mips32 中的有符号整数。我的直觉是使用 2 的补码定义,例如:(假设 $s0
是要取反的数字)
nor $t0, $s0, $s0 ; 1's complement
addiu $t0, $t0, 1 ; 2's = 1's + 1
然后我意识到可以这样做:
sub $t0, $zero, $s0
所以...有什么区别?哪个更快? IIRC sub 将尝试检测溢出,但这会使速度变慢吗?最后,还有其他方法吗?
最佳答案
subu $t0, $zero, $s0
是最好的方式,也是编译器所做的。
在任何给定的 MIPS 实现中,大多数简单的 ALU 指令(add/sub/and/nor)具有相同的性能。用 1 条简单指令而不是 2 条简单指令完成相同的工作是代码大小、延迟和吞吐量的胜利。
指令越少并不总是越好,但作为经典 RISC ISA 的 MIPS 除了 mult/div/rem 之外没有很多“慢”指令。
如果你想要-x-1
,然后您将其优化为单个 nor $t0, $zero, $s0
使用 a 2's complement identity .
sub
而不是 subu
会在 -INT_MIN
上引发异常,你避免使用 addiu
在 nor/add 版本中。您应该始终使用 u
sub
的版本和 add
说明,除非您特别想要签名溢出以引发异常。 C 编译器总是使用 u
版本。 (在 C 中,有符号溢出是未定义的行为1。)
int neg(int x) { return -x; }
On the Godbolt compiler explorer , MIPS gcc11.2 -O3 -fno-delayed-branch
完全按照我们的预期编译它:
neg(int):
subu $2,$0,$4
jr $31
nop # filling the branch delay slot for
询问编译器通常是找到在 asm 中做事的有效方法的好方法。 (GCC 始终使 asm 与真正的 MIPS CPU 兼容,而 GAS 不同于 MARS/SPIM 经典 MIPS 汇编器。另请参见 Tweak mips-gcc output to work with MARS)
IIRC sub will try to detect overflow, but would this make is slower?
没有。在无一异常(exception)的情况下,sub
具有与 subu
相同的性能,据我所知在所有 MIPS CPU 上。
CPU 针对常见情况进行了大量优化。在正常代码中很少发生异常(exception)情况,因此异常(exception)情况需要相当多的周期。因此,CPU 内核只需在将任何不良结果写回寄存器文件或存储到缓存/内存之前检测到异常。在任何 MIPS 流水线的执行和回写之间至少有几个流水线阶段。
在有符号溢出的情况下,ALU 可以在与结果相同的周期内产生溢出信号。带有被大多数指令更新的“标志”寄存器的 ISA 作为 add
的正常操作的一部分一直这样做。指令:如果软件想在 x86 或 ARM 上对有符号溢出做一些特殊的事情,他们会在溢出标志上使用条件分支(x86 上为 OF,ARM 上为 V)。 MIPS 的特殊之处在于,除了对有符号溢出采取异常之外,很难做任何事情。
脚注 1: 未定义行为意味着它可以出错,但不是必须出错,而且通常人们希望它没有。编译器希望能够优化和引入创建 C 抽象机中永远不存在的临时值的转换,因此他们必须避免在这样做时出错。始终使用 subu
是一个很好的方法,因此它不需要跟踪操作和输入值是否是 C 抽象机中会发生的值。但在这种情况下,使用 sub
是合法的.
UB 的另一个含义是允许编译器假定 -x
结果没有溢出到INT_MIN
因此 x
之前和之后不可能是INT_MIN
.
因此,如果您将此作为查找绝对值的一部分,则需要使用 0U - x
来避免这种情况。转换 x
在进行无符号减法之前变为无符号,产生无符号结果。在像 MIPS 这样的 2 的补码机器上,将 signed int 强制转换为相同宽度的 unsigned 是免费的,只需使用不变的位模式即可。 return x<0 ? 0U - x : x;
为此,2 的补码比特黑客很有用,GCC 将其与-march=mips32r3
一起使用。然后。 (IDK 为什么它认为分支在像 -march=r14000
这样的 CPU 上更好,一个 4-wide out-of-order exec CPU。)
uabs(int):
sra $3,$4,31 # broadcast the sign bit
xor $2,$4,$3 # ~x or x
subu $2,$2,$3 # ~x-(-1) or x
jr $31
nop
关于assembly - 关于否定 mips 中的符号整数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53568440/
我被告知“汇编”是您在文件中编写的内容,让您的“汇编程序”将其转换为二进制代码。 但我看到这两个术语在各种作品中混合搭配。我什至听说你编写了“汇编器”,然后“汇编器”使其可执行。 正确的用词是什么?
我在正确终止用 Assembly 编写的 16 位 DOS 程序时遇到问题。这是部分代码: .386P .model flat stack_s segment stack 'stack'
我需要多少档才能正确执行以下指令。我对我所做的事情有些困惑,所以我在这里看到专家的答案。 lw $1,0($2); beq $1,$2,Label; 请注意,检查是否会发生分支将在解码阶段完成。但是在
我正在尝试在汇编中进行简单的乘法运算,但是由于某些原因,当标记了MUL函数时,我看不到寄存器会发生变化。 mov bx, 5 mov cx, 10 mul cx 最佳答案 这些称为指令,它们指定
我正在尝试在 Assembly 中实现递归斐波那契程序。但是,我的程序崩溃了,出现了未处理的异常,我似乎无法找出问题所在。我不怀疑这涉及我对堆栈的不当使用,但我似乎无法指出哪里...... .386
我编写了以下代码: .386 .model small .stack 100h .data text db "Paper",0 .code start : lea dx ,
我有一个用汇编语言编写的裸机 ARM 的启动代码,我正在尝试了解它是如何工作的。该二进制文件被写入一些外部闪存中,并在启动时将其自身的一部分复制到 RAM 中。尽管我读过这篇文章wikipedia e
我在数据部分定义了一个二维数组和两个一维数组(一个用于列总和,一个用于行总和),并且我编写了一个函数,将二维数组求和到一维数组中。我使用 eax 和 ebx 作为二维数组的索引,但是当 eax 或 e
我正在开始组装,我正在使用 nasm 来组装代码,我正在尝试处理驻留在内存中的字符串并更改它,我想检查一个字节是否在某个范围内(ascii),这样我就可以决定如何处理它,我似乎不知道如何检查一个值是否
虽然您通常不希望将一个整体程序集用于小型项目以外的任何事情,但可能会将事物分离得太多。 组装分离过多的迹象/气味是什么? 最佳答案 第一个(明显的)是:在一个有很多项目的解决方案中,其中只有少数(比如
我正在尝试编写斐波那契的汇编代码版本,它给出第 n 个斐波那契数并返回它。 出于某种原因,它在存储斐波那契数的返回值和添加它们时遇到问题。 我希望它打印第 n 个斐波那契数。 我对我的代码做了一些修改
我有一个最小的、可重现的示例有两个问题,该示例具有三个针对 .NET Core 3.1 的项目。但我也想以 .NET Standard 2.0 为目标。 该示例适用于需要在运行时加载程序集并使用提供的
: 运算符在汇编中做什么?代码如下:DS:DX我还没有找到该运算符(operator)的任何文档。(我正在使用 NASM) 最佳答案 那实际上只是一个寄存器分隔符,而不是运算符。这意味着使用 DX 寄
我在哪里可以找到为 gmp-5.0.0 编写的程序的汇编代码我正在使用 UBUNTU 和 G++ 编译器..编译代码的命令是“g++ test.cc -o outp -lgmp” 实际上我想知道在 1
我是组装新手,我有一个关于如何表示负数的问题 我有三个 DWORDS 变量,比如说: result DWORD 0 i DWORD 3 j DWORD 5 我想计算这个公式:result = i -
我想编写我的第一个汇编程序。我在论文上做了一些程序,但这是我第一次使用编译器。我正在使用 ideone .我的程序很简单, 翻译 A = 5 - A到 assembly NEG A ADD A, 5
程序集,masm 嘿,我写了宏来打印存储在 dane1 段中的 1 字节值。 我将值除以 16,然后将提醒推送到堆栈,直到值==0。然后我弹出提醒将它们转换为 ASCII 码,并打印它们。 有人可以看
我正在研究 nasm 的一个大学项目。唯一的问题是我无法生成 162 和 278 之间的偶数随机数。我尝试了很多算法,但似乎无法限制范围内的数字。 是否有一个小技巧或调整来获得所需的范围内的数字?目的
终于在无数次错误的漫长 session 之后,希望这是最后一个。 没有编译或运行时错误,只是一个逻辑错误。 编辑:(固定伪代码) 我的伪代码: first = 1; second = 1; thir
我知道在程序集r0中调用函数时,包含第一个参数,直到r3是第四个。我知道,当它超过四个时,将使用堆栈指针,但是我不太确定具体细节。 r0-r3仍然保持前四个,其余的进入堆栈吗?我正在看下面的程序集,试
我是一名优秀的程序员,十分优秀!