- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
当我在 https://godbolt.org 上使用不同的编译器时,我注意到编译器生成这样的代码是很常见的:
push rax
push rbx
push rcx
call rdx
pop rcx
pop rbx
pop rax
据我了解,每个 push
或 pop
都会做两件事:
因此,在上面的示例中,我假设 CPU 实际上执行 12 次操作(6 次移动、6 次添加/替换),不包括调用
。将添加/替换组合起来不是更有效吗?例如:
sub rsp, 24
mov [rsp-24], rax
mov [rsp-16], rbx
mov [rsp-8], rcx
call rdx
mov rcx, [rsp-8]
mov rbx, [rsp-16]
mov rax, [rsp-24]
add rsp, 24
现在只有 8 个操作(6 个移动,2 个添加/替换),不包括调用
。为什么编译器不使用这种方法?
最佳答案
如果您使用 -mtune=pentium3
或早于 -mtune=pentium-m
的内容进行编译,GCC 将执行代码生成,如下所示你可以想象,因为在那些旧的 CPU 上,push/pop 确实解码为堆栈指针上的单独 ALU 操作以及加载/存储。 (您必须使用 -m32
或 -march=nocona
(64 位 P4 Prescott),因为这些旧 CPU 也不支持 x86-64)。 Why does gcc use movl instead of push to pass function args?
但是 Pentium-M 在前端引入了一个“堆栈引擎”,消除了堆栈操作的堆栈调整部分,例如push/call/ret/pop。它有效地以零延迟重命名堆栈指针。请参阅Agner Fog's microarch guide和 What is the stack engine in the Sandybridge microarchitecture?
作为总体趋势,现有二进制文件中广泛使用的任何指令都会激励 CPU 设计人员提高其速度。例如,Pentium 4 试图让大家停止使用 INC/DEC;那不起作用; current CPUs do partial-flag renaming better than ever 。现代 x86 晶体管和功率预算可以支持这种复杂性,至少对于大核 CPU(不是 Atom/Silvermont)来说是这样。不幸的是,我认为对于 sqrtss
或 cvtsi2ss
等指令的错误依赖(在目标上)没有任何希望。
在像add rsp, 8
这样的指令中显式使用堆栈指针需要Intel CPU中的堆栈引擎插入同步微指令来更新寄存器的乱序后端值。如果内部偏移太大,则相同。
事实上,pop dummy_register
比现代上的 add rsp, 8
或 add esp,4
更高效 CPU,因此编译器通常会使用它来通过默认调整或例如 -march=sandybridge
来弹出一个堆栈槽。 Why does this function push RAX to the stack as the first operation?
另请参阅What C/C++ compiler can use push pop instructions for creating local variables, instead of just increasing esp once?回复:使用 push
初始化堆栈上的局部变量,而不是 sub rsp, n
/mov
。在某些情况下,这可能是一个胜利,特别是对于值较小的代码大小,但编译器不会这样做。
另外,不,GCC/clang 不会生成与您所展示的完全相同的代码。
如果他们需要在函数调用周围保存寄存器,他们通常会使用mov
到内存来做到这一点。或者mov
到他们保存在函数顶部的调用保留寄存器,并将在最后恢复。
除了传递堆栈参数之外,我从未见过 GCC 或 clang 在函数调用之前推送多个被调用破坏的寄存器。并且绝对不会在之后多次弹出以恢复到相同(或不同)寄存器中。函数内部的溢出/重新加载通常使用 mov。这避免了循环内插入/弹出的可能性(除了将堆栈参数传递给调用
),并允许编译器进行分支,而不必担心插入与弹出的匹配。它还降低了堆栈展开元数据的复杂性,该元数据必须为移动 RSP 的每条指令都有一个条目。 (使用 RBP 作为传统帧指针时,指令数与元数据和代码大小之间的有趣权衡。)
类似于您的代码生成的东西可以通过调用保留的寄存器+一些reg-reg在一个小函数中移动来看到,该函数刚刚调用另一个函数,然后返回一个__int128
这是寄存器中的函数arg。因此传入的 RSI:RDI 需要保存,以 RDX:RAX 形式返回。
或者,如果您在非内联函数调用后存储到全局或通过指针,编译器还需要保存函数参数,直到调用之后。
关于assembly - 为什么使用push/pop而不是sub和mov?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60872952/
我的团队正在使用 gerrit 代码审查,本质上这意味着默认的推送行为会绕过标准工作流程,因此我们需要使用 git push origin HEAD:refs/for/feature 来正确推送我们的
我是 assembly 新手,我正在使用 MASM。我看到这些代码行,想知道这之间有什么区别 a) push myVar b) push [myVar] c) push OFFSET myVar 我怎
美好的一天! 将镜像推送到docker hub时遇到一些问题。我的第一个软件版本: vagrant@debian-8-docker:~$ docker version Client version:
我有三个 Controller 一二三 .首先是navigationController的rootViewController。 在 SecondViewController ,我有一个名为 的协议(
我在这个 Google 教程的帮助下实现了一个 Web Push API: https://developers.google.com/web/fundamentals/getting-started
我有两个模式: var optionsSchema = new Schema({ locationname: String, locationnumber : String
我是 git 的新手并对其进行了测试。我已经能够克隆 friend 存储库进行小的本地更改并提交。 我现在想测试将我的本地更改推送到远程存储库,但不幸的是当我尝试进行推送时 $ git push <
我们正在公司讨论 git rebase 之后该做什么。在rebase之后,您需要将更改推送到远程origin,但是当git不允许时我们应该怎么做呢?实际上,我们正在讨论当分支已经被推送时我们最常用的两
我正在使用具有嵌入式 github 支持的新 IDE。在命令行本地,我可以成功地使用 git push orgin master 并更新 github。但是我的 IDE 使用带有 -v 标志的命令,这
我仍在阅读有关 RoR 的一些指南,我被困在 Deploying The Demo App 上 我遵循了说明: With the completion of the Microposts resour
我正在尝试创建一个可以将我的 git 存储库镜像到另一个存储库的脚本。一切正常,但它一直在说 [remote rejected] refs/pull/xx/head -> refs/pull/xx/h
我想了解使用 Tortoise SVN 构建过程的一些过程。主要是 我想知道你是否插入: 主线中继 QA 后的一个分支将其抓取到本地的工作副本中并测试该分支,然后一些构建推送该分支 我遇到的问题是我在
在谈论将消息推送到移动应用程序以触发 WAP 内容的下载时,似乎都使用了 WAP 推送和 SMS 推送这两个术语。 这些术语是指相同的机制还是具有不同的含义? 最佳答案 SMS Push 是告诉终端发
我只是想知道是否有人使用这种技术: 由于推送通知仅随 OS 3.0 一起提供,因此我一直在考虑使用电子邮件推送(Exchange、mobile.me)作为解决方法: 您可以注册一个 URL,例如。 m
我正在 build WP website using DIVI theme .应该被插入 dataLayer 的标签被默认的“未设置”值卡在某个地方。 为了推送我使用脚本的值: functi
我最近删除了xcode 6 beta 3并安装了xcode 6 beta 6 当我在终端输入gitpush时,这发生了 xcrun:错误: Activity 的开发人员路径(“/Application
我即将实现ionic-native Push Notifications .这可以在浏览器中运行吗?还是我需要安装 iOS/Android 模拟器? 最佳答案 除非您使用 Phonegap 推送服务器
Safari 12.1 是否支持服务 worker PWA 推送通知?我试过这个 demo在 iOS 上,但它仍然不适合我。 有机会得到它们吗?谢谢。 最佳答案 目前没有关于此功能的通信...Appl
目前我有很多 chrome 浏览器的推送订阅都是这样的方法, swr.pushManager.subscribe({userVisibleOnly: true}) .then(function
我需要 4 个过渡效果,但我只知道 2 个过渡效果,还有 2 个我不知道。我知道的 2 个过渡动画是: 过渡时下推: 并向下推过渡: 但
我是一名优秀的程序员,十分优秀!