gpt4 book ai didi

Arm Neon Intrinsics 与手工组装

转载 作者:行者123 更新时间:2023-12-04 13:20:52 27 4
gpt4 key购买 nike

https://web.archive.org/web/20170227190422/http://hilbert-space.de/?p=22

在这个过时的网站上,它表明手写 asm 会比内在函数带来更大的改进。我想知道即使在 2012 年,这是否是当前的事实。

那么使用 gnu 交叉编译器对内部函数的编译优化是否有所改进?

最佳答案

所以这个问题已经有四年了,现在仍然出现在搜索结果中......

2016 年情况要好得多。

我从汇编转录到内在函数的许多简单代码现在被编译器优化得比我更好,因为我懒得做管道工作(现在有多少不同的管道?),而编译器只需要我传右--mtune= .

对于寄存器分配可能变得紧张的复杂代码,GCC 和 Clang 仍然可以比手写代码慢两倍……或三倍(ish)。它主要是关于寄存器溢出,所以你应该从你的代码结构中知道这是否有风险。

但他们有时都会发生令人失望的事故。我会说现在这是值得的风险(尽管我是有偿承担风险的),如果你确实被某些东西击中然后提交一个错误。这样,事情就会不断好转。

关于Arm Neon Intrinsics 与手工组装,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9828567/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com