assembly - 这个 sqrt 近似内联汇编函数如何工作？-6ren

assembly - 这个 sqrt 近似内联汇编函数如何工作？

转载作者：行者123 更新时间：2023-12-02 17:16:25

24

4

通读3D游戏编程大师的技巧，我发现了这个用内联汇编编写的排序函数:

inline float FastSqrt(float Value)
{
    float Result;

    _asm
    {
        mov eax, Value
        sub eax, 0x3F800000
        sar eax, 1
        add eax, 0x3F800000
        mov Result, eax
    }

    return(Result);
}

它是实际平方根的近似值，但精度足以满足我的需要。

这实际上是如何运作的？这个神奇的 0x3F800000 值是什么？我们如何通过减法、旋转和加法求平方根？

这是它在 C/C++ 代码中的样子:

inline float FastSqrt_C(float Value)
{
    float Result;

    long Magic = *((long *)&Value);
    Magic -= 0x3F800000;
    Magic >>= 1;
    Magic += 0x3F800000;
    Result = *((float *)&Magic);

    return(Result);
}

最佳答案

很多人指出0x3f800000是 1.0 的表示。虽然这是事实，但它与计算方式无关。要理解它，您需要知道非负 float 是如何存储的。 f = (1+m)*2^x ，与 0 <= m < 1和m作为尾数，x指数。另请注意 x是带有偏差存储的，所以二进制文件中的实际内容是 x+127 。 32 位值由符号位(在我们的例子中为零)和随后存储 x+127 的 8 位指数组成。最后是 23 位尾数，m 。 (请参阅wikipedia article)。

应用一些基本数学，

sqrt(f) = sqrt((1+m)*2^x)
        = sqrt(1+m)*sqrt(2^x)
        = sqrt(1+m)*2^(x/2)

因此，作为一个粗略的近似，我们需要将指数减半，但由于偏差，我们不能仅仅这样做 x/2我们需要(x-127)/2 + 127 。这个127移位到适当的位位置就是神奇的 0x3f800000 .

除以 2 是通过右移一位来实现的。由于这对整个 float 进行操作，因此它也会对尾数产生副作用。

首先，假设原始指数是偶数。那么移出的最低有效位为零。因此，尾数也减半，所以我们最终得到的是:sqrt(f) = (1+m/2)*2^(x/2) 。我们得到的指数是正确的，但尾数是 (1+m/2)而不是sqrt(1+m) 。最大相对误差为 (1.5 - sqrt(2))/sqrt(2) ~ 6%如果 m 就会发生这种情况差不多1含义f接近，但小于 2 的奇次幂。以f=7.99为例。该公式为我们提供了大约 2.998而不是2.827确实有错误 6% .

现在，如果指数是奇数，则最低有效位将为 1当移入尾数时，会导致增加一半。因此，我们得到sqrt(f) = (1.5+m/2)*2^((x-1)/2) 。最大错误实际上是当 m=0 时，这将是 (1.5/sqrt(2)-sqrt(1))/sqrt(1)这又是在 6% 附近。对于上面接近 2 的奇数次方的数字，会发生这种情况。

这两种情况相结合意味着，如果输入值恰好接近 2 的奇数次方，最差的误差约为 6%。对于 2 的偶次幂，结果是准确的。

关于assembly - 这个 sqrt 近似内联汇编函数如何工作？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41785416/

24

4

0

文章推荐： logback - Logback 中的条件功能如何工作？

文章推荐： javascript - 存储日期和此日期 - 使用 d3.js 3 天

文章推荐： javascript - POST 请求未返回更新的数据

文章推荐： mxgraph - 限制mxGraph中顶点之间的边数

汇编 - 在图形模式下打印一个字符
我试图在图形模式下打印一个字符。通常当我打印我正在做的一个字符时: mov ah,14 ; ah=14 mov al,'x' int 10h ; print the character 这
汇编 - 试图将字节移动到内存不起作用
我试图通过更改其中的一个字节来修改存储在内存中的字符串。我为此使用了 movb，但由于某种原因，给定内存位置的字节没有改变。在 gdb 调试器上: 14 movb %al, (%r10) # nex
汇编-x86调用指令和内存地址？
我一直在阅读一些汇编代码，并且开始发现调用指令实际上是与程序计数器相关的。但是，每当我使用 Visual Studio 或 Windbg 进行调试时，它总是显示 call 0xFFFFFF ...这
汇编、栈上局部变量的算术运算
我最近一直在使用 Visual C++ 中的内联汇编，我想知道是否可以直接向堆栈上的局部变量添加值，例如: push 5 add [esp], 7 这样做可以吗？我问这个问题是因为我在执行此操作时随机
汇编-进位标志VS溢出标志
我有下一个代码: mov al, -5 add al, 132 add al, 1 据我检查，溢出标志和进位标志将在第一个操作中设置，而在第二个操作中，仅设置溢出。但我不明白为什么: 在无符号数中，
汇编，将单个字节从寄存器写入内存会覆盖其他字节
在 64 位 x86 汇编 nasm 中，如何将单个字节从寄存器移动到 .data 节中定义的内存位置？我知道这有效 global _main section .data quotient db 0
汇编、打印ascii码
我的汇编代码有问题。我想打印存储在寄存器 cx 中的数字，但是当我尝试打印它时，它打印的是 ascii 字符而不是 ascii 数字，所以我决定编写一个程序将 ascii char 转换为 ascii
汇编——机器码中的跳转指令
为什么第 1B 行的跳转指令(例如)变成了 EBBD？我知道“jmp”= EB但是BD是怎么计算的呢？最佳答案短跳转使用一个带符号的偏移量添加到 JMP 之后的指令地址。例如，第一个 JMP
汇编:add指令和操作符add的区别
以下两者有什么区别: mov eax, [eax+4] 和 add eax, 4 mov eax, [eax] 如果不是，那么汇编器是否会选择哪个来进行某种优化？最佳答案这
汇编/反汇编指令操作数
看《The Shellcoder's Handbook》中的一些汇编和反汇编代码，发现一条指令的序列操作数是不一样的。例如，在 assembly 上: mov ebx,0 并且，在反汇编时: mov
汇编，检测溢出寄存器
我有这个非常简单的汇编代码: start: add ax, 100 ; if ax overflow add to bx 1 jmp start 但我不知道如何检测 ax 寄存器溢出，有人可以帮
汇编，将单个字节从寄存器写入内存会覆盖其他字节
在 64 位 x86 汇编 nasm 中，如何将单个字节从寄存器移动到 .data 节中定义的内存位置？我知道这有效 global _main section .data quotient db 0
汇编、打印ascii码
我的汇编代码有问题。我想打印存储在寄存器 cx 中的数字，但是当我尝试打印它时，它打印的是 ascii 字符而不是 ascii 数字，所以我决定编写一个程序将 ascii char 转换为 ascii
汇编 << 运算符
我正在学习一些关于操作系统开发的教程，我发现了一篇关于多重引导 header 。这些是您必须定义的一些“神奇”值才能使用GRUB2。这些是命令: # Declare constants used f
汇编——机器码中的跳转指令
为什么第 1B 行的跳转指令(例如)变成了 EBBD？我知道“jmp”= EB但是BD是怎么计算的呢？最佳答案短跳转使用一个带符号的偏移量添加到 JMP 之后的指令地址。例如，第一个 JMP
从内存地址复制字辅助(汇编)
我正在尝试从内存中复制一些单词并使用汇编将其保存到另一个内存地址。我正在尝试为其编写代码，但我不确定其中的某些部分。我将简要描述我想要做什么。源地址、目标地址和要复制的字数是函数的输入参数。最佳答
汇编 MOV 指令操作数
当我们想要像这样创建一个初始化变量时: name db 'zara ali' 我们创建了一个字节大小变量，但我们在其中存储了一个字符串这怎么可能？？当我们使用这条指令时: MOV ecx, nam
汇编:16 位除法
我还是汇编的新手，我还不知道汇编中的许多命令代码。我想在 16 位寄存器中进行除法。我想打印它的内容。我知道我需要将寄存器的内容转换为 ASCII 进行打印，但同样，我的问题是除法。请帮我。比如cx
assembly - 汇编/机器代码中相等的分支
使用有什么区别: c.eq.s $1, $2 bc1t L2 并使用: beq $1, $2, L2 如果他们做同样的事情，为什么有两种分支方式？如果它们不同，那么它们各自的好处是什么
c - 汇编:在调用函数之前加载有效地址的目的？
源代码: int main() { int i; for(i=0, i : push rbp 2. 0x000055555555463b :

首页

博学

6Ren·AI

商城

assembly - 这个 sqrt 近似内联汇编函数如何工作？