gpt4 book ai didi

algorithm - sqrt 和 div 指令以相同的速度运行

转载 作者:塔克拉玛干 更新时间:2023-11-03 03:29:49 27 4
gpt4 key购买 nike

我正在随意阅读英特尔架构引用手册,http://www.cs.princeton.edu/courses/archive/spr12/cos217/reading/ia32opt.pdf ,当我阅读指令延迟和吞吐量附录时,我发现延迟(执行核心所需的时钟周期数完成构成一条指令的所有 μop 的执行。)因为 sqrt 指令与除法(第 C-28 页)指令的延迟完全相同——至少对于某些微体系结构而言。对于单精度、 double 和扩展精度,数字分别为 30、40 和 44 个时钟周期。

我的问题是 sqrt 指令如何能像 div 指令一样大的处理器接收器?我一直觉得 sqrt 指令在任何语言中都是昂贵的。

最佳答案

这并不为人所知,但有一些计算平方根的算法在移位运算方面与除法一样快。这些不是牛顿近似值。

参见 (Sqrt in) Binary numeral system (base 2) .我第一次看到这个是在 Knuth 的半数值算法一书中,并在 1970 年代初期用它在 16 位小型计算机上以与除法相同的速度对 sqrts 进行编码。循环的核心移出两位,计算平方根位,然后重复。因此,总移位 == 位数,这与经典除法相同。

如果他们确实通过芯片上的移位比较方法进行除法,他们可以很容易地实现平方根。

关于algorithm - sqrt 和 div 指令以相同的速度运行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14907131/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com