gpt4 book ai didi

optimization - 英特尔汇编程序优化

转载 作者:行者123 更新时间:2023-12-03 16:56:12 24 4
gpt4 key购买 nike

我目前正在尝试针对自制语言优化从自制编译器发出的代码。

我试用了 Intel VTune 以了解瓶颈所在:http://www.imada.sdu.dk/~sorenh07/misc/vtune-assembly-optimization.png

令我印象深刻的是,在一个运行 30-90 秒的程序中,一条“subl”指令负责超过 38% 的时钟信号!谁能解释一下为什么?

对于非 icc 编译的程序,VTune 中的“优化报告”功能显然不存在。是否存在建议优化汇编代码的程序? (也就是说,不是来自高级语言的代码)。

最佳答案

我的猜测是 idivl 指令实际上占用了 38%...用更长的时间除法比减法 no 更有意义吗?

关于optimization - 英特尔汇编程序优化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2750304/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com