- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
所以我一直在研究 O3
的一些魔法。在 GCC 中(实际上我正在使用 Clang 进行编译,但它与 GCC 相同,我猜大部分优化器已从 GCC 转移到 Clang)。
考虑这个 C 程序:
int foo(int n) {
if (n == 0) return 1;
return n * foo(n-1);
}
int main() {
return foo(10);
}
int foo(int)
(一个基本的阶乘函数)编译成一个紧密的循环。这是它的 ARM 程序集:
.globl _foo
.align 2
.code 16
.thumb_func _foo
_foo:
mov r1, r0
movs r0, #1
cbz r1, LBB0_2
LBB0_1:
muls r0, r1, r0
subs r1, #1
bne LBB0_1
LBB0_2:
bx lr
main
:
.globl _main
.align 2
.code 16
.thumb_func _main
_main:
movw r0, #24320
movt r0, #55
bx lr
foo
并返回
3628800
这是
10!
.
foo
优化是一个紧密的循环。 main
只是直接返回结果而不是实际执行 foo
. 最佳答案
如果你用 gcc -O3 -fdump-tree-all
编译,您可以看到递归变成循环的第一个转储是 foo.c.035t.tailr1
.这意味着处理其他尾调用的相同优化也处理这种稍微扩展的情况。 n * foo(...)
形式的递归或 n + foo(...)
手动处理并不难(见下文),而且由于可以准确描述如何,编译器可以自动执行该优化。main
的优化更简单:内联可以把它变成 10 * 9 * 8 * 7 * 6 * 5 * 4 * 3 * 2 * 1 * 1
,并且如果乘法的所有操作数都是常量,则可以在编译时执行乘法。
更新 :以下是如何从 foo
手动删除递归的方法,这可以自动完成。我并不是说这是 GCC 使用的方法,但这是一种现实的可能性。
首先,创建一个辅助函数。它的行为与 foo(n)
完全一样,除了它的结果乘以一个额外的参数 f
.
int foo(int n)
{
return foo_helper(n, 1);
}
int foo_helper(int n, int f)
{
if (n == 0) return f * 1;
return f * n * foo(n-1);
}
foo
进入
foo_helper
的递归调用,并依靠因子参数来摆脱乘法。
int foo(int n)
{
return foo_helper(n, 1);
}
int foo_helper(int n, int f)
{
if (n == 0) return f;
return foo_helper(n-1, f * n);
}
int foo(int n)
{
return foo_helper(n, 1);
}
int foo_helper(int n, int f)
{
restart:
if (n == 0) return f;
{
int newn = n-1;
int newf = f * n;
n = newn;
f = newf;
goto restart;
}
}
foo_helper
:
int foo(int n)
{
int f = 1;
restart:
if (n == 0) return f;
{
int newn = n-1;
int newf = f * n;
n = newn;
f = newf;
goto restart;
}
}
关于gcc - 编译器如何优化这个阶乘函数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8869189/
我正在做一些关于大 O 表示法的练习题,遇到了这个问题。什么是函数 𝑓(𝑛) = 𝑛^2 + 𝑛 log2(𝑛) + log2(𝑛) 的大 O 阶。展示你的作品。 我的答案是 O(n^2)
是2n吗?只是检查。 最佳答案 术语 B 树的顺序在文献中的定义并不一致。 (例如,参见 terminology section of Wikipedia's article on B-Trees )
我想使用 numpy 创建一个 3 列数组,使得该数组类似于一堆 9x9 2 列数组。这些数组中的每一个都将完全填充有 1、2、3 等。 所以,看立方体的一面,我们看到的是 1,而另一面则是 9。然后
我想将这些数据存储到顺序为 3 (10,20,30,40,50,60,70,80,90) 的 B 树中,我的结果是 并且它与我的书的结果不匹配。可以吗?谢谢:) 最佳答案 这取决于你的意思 Is it
我是 numpy 的新手。创建一个新数组并用一定范围内的随机数填充每个元素的最佳方法是什么? 例如,我想要一个 3×3 数组,其中每个元素都是 0 或 1。 最佳答案 尝试类似的东西 np.rando
我正在尝试学习设计 btree。 以下是开发 5 阶 btree 的值。 1,12,8,2,25,6,14,28,17,7,52,16,48,68,3,26,29,53,55,45,67。 当我插入
我有一个 pandas 数据框,其特征值非常小,数量级为 -322。我正在尝试标准化这些功能,但得到了 ValueError: Input contains NaN, infinity or a va
我是一名优秀的程序员,十分优秀!