- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
x86 汇编中是否有模运算符或指令之类的东西?
最佳答案
如果您的模数/除数是一个已知常数,并且您关心性能,请参阅 this和 this .对于直到运行时才知道的循环不变值,乘法逆甚至是可能的,例如见 https://libdivide.com/ (但如果没有 JIT 代码生成,这比仅硬编码一个常量所需的步骤效率低。)
从不使用 div
对于 2 的已知幂:它比 and
慢得多求余数,或右移除法。查看 C 编译器输出以获取无符号或有符号除以 2 的幂的示例,例如on the Godbolt compiler explorer .如果您知道运行时输入是 2 的幂,请使用 lea eax, [esi-1]
; and eax, edi
或类似的事情x & (y-1)
. Modulo 256 更高效:movzx eax, cl
在最近的 Intel CPU ( mov-elimination ) 上具有零延迟,只要这两个寄存器是分开的。
在简单/一般情况下:运行时未知值
DIV
instruction (及其对应的 IDIV
对于有符号数)给出商和余数。对于无符号,余数和模数是一回事。已签名 idiv
,它给你 the remainder (not modulus)可以是负数:
例如-5 / 2 = -2 rem -1
. x86 除法语义完全匹配 C99 的 %
运算符(operator)。DIV r32
在 EDX:EAX
中对 64 位数字进行除法通过 32 位操作数(在任何寄存器或内存中)并将商存储在 EAX
中余数在 EDX
.它在商溢出时出错。
无符号 32 位示例 (适用于任何模式)
mov eax, 1234 ; dividend low half
mov edx, 0 ; dividend high half = 0. prefer xor edx,edx
mov ebx, 10 ; divisor can be any register or memory
div ebx ; Divides 1234 by 10.
; EDX = 4 = 1234 % 10 remainder
; EAX = 123 = 1234 / 10 quotient
在 16 位汇编中你可以做
div bx
在
DX:AX
中划分 32 位操作数来自
BX
.参见英特尔的
Architectures Software Developer’s Manuals想要查询更多的信息。
xor edx,edx
未签名前 div
将 EAX 零扩展到 EDX:EAX。
这就是“普通”32 位/32 位=> 32 位除法的方式。
cdq
之前 idiv
将 EAX 符号扩展为 EDX:EAX。另见
Why should EDX be 0 before using the DIV instruction? .对于其他操作数大小,使用
cbw
(AL->AX),
cwd
(AX->DX:AX),
cdq
(EAX->EDX:EAX),或
cqo
(RAX->RDX:RAX) 将上半部分设置为
0
或
-1
根据低半部分的符号位。
div
/
idiv
可用于 8、16、32 和(在 64 位模式下)64 位的操作数大小。在当前的 Intel CPU 上,64 位操作数大小比 32 位或更小的操作数要慢得多,但 AMD CPU 只关心数字的实际大小,而不管操作数大小。
mov rax, 0x8000000000000000 ; INT64_MIN = -9223372036854775808
mov ecx, 10 ; implicit zero-extension is fine for positive numbers
cqo ; sign-extend into RDX, in this case = -1 = 0xFF...FF
idiv rcx
; quotient = RAX = -922337203685477580 = 0xf333333333333334
; remainder = RDX = -8 = 0xfffffffffffffff8
div dword 10
不可编码 转换为机器代码(因此您的汇编程序将报告有关无效操作数的错误)。
mul
不同/
imul
(您通常应该使用更快的 2 操作数
imul r32, r/m32
或 3 操作数
imul r32, r/m32, imm8/32
而不是浪费时间编写高半结果),没有更新的操作码用于除以立即数或 32 位/32 位 => 32 位除法或余数,没有高半被除数输入。
INT_MIN / -1
是 C 未定义的行为:它溢出 2 的补码系统(如 x86)上的有符号商。见
Why does integer division by -1 (negative one) result in FPE?以 x86 与 ARM 的示例为例。 x86
idiv
在这种情况下确实是错误的。
#DE
- 除法异常。在 Unix/Linux 系统上,内核向导致 #DE 异常的进程提供 SIGFPE 算术异常信号。 (
On which platforms does integer divide by zero trigger a floating point exception? )
div
,使用
high_half < divisor
的红利是安全的。例如
0x11:23 / 0x12
小于
0xff
所以它适合 8 位商。
关于汇编语言 - 如何做模?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8021772/
是否有更快的算法来计算 (n! modulo m)。在每个乘法步骤都比减少更快。并且有没有比左右二元法更快的算法来计算 (a^p modulo m)。 这是我的代码:n!模数m ans=1 for(i
我有非常简单的代码循环遍历数组中的元素并检查是否index % 2 == 0。如果是这样,它应该改变颜色。 var e = document.getElementById("list").childN
让我简短一点。我正在计算 alert((Math.pow(7,35))%71) 但它给了我 61,而结果必须是 70。怎么了? 最佳答案 正如其他人之前提到的关于使用 Math.pow(7,35) 的
我试图弄清楚如何在汇编中计算模 10,所以我在 gcc 中编译了以下 c 代码,看看它想出了什么。 unsigned int i=999; unsigned int j=i%10; 令我惊讶的是我得到
例如使用以下输入: int num = -100 int divisor = 10 => -100 mod 10 = 0 (Edge-case: negative numbers as inpu
这个问题在这里已经有了答案: Random float number generation (14 个答案) 关闭 9 年前。 在 C++ 中,我希望得到一个随机 float 。据我所知,典型的随机
我试图找到潜在阶乘素数的除数(n!+-1 形式的数),因为我最近购买了 Skylake-X 工作站,我认为我可以使用 AVX512 指令提高一些速度。 算法简单,主要步骤是对同一个除数重复取模。主要是
我有一个保存角度(以度为单位)的变量,该角度可以是正值也可以是负值。我现在需要确保该数字仅在 0 到 360 之间。该数字是 double 。 执行此操作的好算法是什么?简单地执行角度 % 360 是
我有一个 UInt8 数组,我想计算 CheckSum8 模 256。如果字节总和小于 255,checkSum 函数返回正确的值。 例如 let bytes1 : [UInt8] = [1, 0xa
使用海湾合作委员会: printf("%i \n", -1 % (int)4); printf("%u \n", -1 % (unsigned int)4); 输出: -1 3 我可以跨平台依赖这种行
我无法理解代码中几行的含义。我最近开始学习 C++,并阅读了 Bjarne Stroustrup 的“编程:使用 C++ 的原理和实践”。第四章有个问题让我很困惑,所以我在网上搜索了一个解决方案以供引
我试图解决一个涉及大阶乘模质数的问题,并在另一个人的解决方案中发现了以下算法: long long factMod (long long n, long long p) { long long
我正在尝试计算 𝐹𝑛 模 𝑚,其中 𝑛 可能非常大:高达 10^18,𝐹𝑛 是第 n 个斐波那契数这是我的代码,它适用于小数字,但对于大数字,它会抛出 OutOfMemoryError 或
我有两个以 16 为模的循环整数,因此它们的值介于 0 和 15 之间。 我需要比较两个数字以确定 n_1 是否大于 n_0 n_1 > n_0 很明显,这个没有准确定义,所以我定义n_1如果小于前面
我一直在尝试使用 Java 处理一些更大的值,但遇到了一些我不理解的问题。出于某种原因,Java 似乎喜欢给我垃圾数据(尽管,我更可能告诉它给我垃圾数据) 这是一个片段,为清楚起见进行了编辑:
好吧,我今天做了一个小函数,它应该会生成一个随机字符串。 std::string randString(size_t length) { std::string randStr; fo
Ruby 的负数取模规则不明确。在 IRB 中: -7 % 3 == 2 应该是1!为什么? 最佳答案 因为 -7/3 在 Ruby 的整数除法语义下是 -3。 3*-3 是 -9,所以会留下 2
这个问题在这里已经有了答案: Calculating pow(a,b) mod n (14 个答案) 关闭 6 年前。 在 Javascript 中是否有获取大数模数的技巧。我用 modulo(7,
此代码使用公式 (a^x) % 101 检查值 a 是否唯一映射到值 1 到 100 local function f(a) found = {} bijective = true
在《Core Java Volume1》一书中有一条警告: CAUTION: The right-hand side argument of the shift operators is reduce
我是一名优秀的程序员,十分优秀!