- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
这与 frame pointer omitting ? Any risk? 相关但不同
我正在尝试遵循这篇旧的(但仍然相关的文章)
http://blogs.msdn.com/b/larryosterman/archive/2007/03/12/fpo.aspx
拉里(作者写道)
machines got sufficiently faster since 1995 that the performance improvements that were achieved by FPO weren't sufficient to counter the pain in debugging and analysis that FPO caused
但是,在页面下方的讨论中,一位用户写道
Disabling FPO can have both serious code size and performance impact. Tail call optimizations have to be disabled when a frame pointer is present, leading to much greater stack usage in affected paths. Small functions are also disproportionately affected by prolog/epilog code. Third, although there are still six registers available with a frame pointer on X86, only three of them are nonvolatile with respect to nested calls: EBX, ESI, and EDI. Opening up a fourth register can drop out a bunch of spill code.
我有几个问题。
本文最后
http://www.altdevblogaday.com/2012/05/24/x64-abi-intro-to-the-windows-x64-calling-convention/
作者说
[with repect to Windows x64 calling convention].....
All parameters have space reserved on the stack, even the ones passed in registers. In fact, there’s stack space for 4 parameters even if your function doesn’t have any params. Those parameters are 8 bytes so that’s at least 32 bytes on the stack for every function (every function actually has at least 48 bytes on the stack…I’ll explain that another time). This stack area is called the home space. There are few reasons behind this home space:
- If the registers need to be used for something else, the called function can store the data in the home space without moving the stack pointer.
- It keeps the stack structure easy to determine. That’s very handy for debugging, and perhaps necessary for x64′s stack metadata (another point I’ll come back to another time). ...... The compiler can use it for whatever it wants, and an optimized build will likely make great use of it.
优化的构建不会优化多余的分配吗?
最佳答案
1.Spill code == Register spillage?
差不多了。严格来说,溢出代码是编译器为了实现寄存器溢出而添加的代码。溢出本身就是将生命范围标记为无法放入寄存器的决定。
2.Is the author correct that FPO is generally considered a pain and the gain doe not out-weigh the benefits.
作者可能是正确的,在现代处理器架构中,FPO 将产生显着性能增益的功能类型比过去更小。然而,FPO 的确实使代码更小,从而减少了缓存压力。它们确实减少了套准压力。这些在某些设置中可能很重要。他们确实通过一些指令来加速序言和结尾代码。值得注意的是,如果没有 FP,调试器就无法正常工作。这意味着核心转储对于生产优化代码的事后分析不太有用。除了最终测试之外,您绝不会希望在开发过程中使用 FPO。
3.Is FPO still relevant today in x64 architecture since there are a LOT more registers o play with.
现代处理器是如此多样化和复杂,以至于您在尝试和测量之前几乎永远不知道什么是“相关的”。
4.Do you use FPO? What for (if yes) and does it make a difference to you?
我编写了一个中等大小的 C 库 (20K SLOC),它在 gcc 下的总体运行时间上产生了很小的差异 (~5%)。这是脚本语言的 native 语言扩展,必须在 gcc 和 Visual C 下进行编译。使用它会分割构建路径。我认为 5% 对于扩展所服务的目的来说是不值得的。但如果是通过动态流体模拟来预测天气,那么 5% 可能值(value)数百万美元。决定将会有所不同。
5.Wouldn't an optimized build optimize the excess allocation away?
这完全取决于编译器和优化器设计者。从MS文档看here MS 已将 ABI 定义为所有数据需要主空间,即使它的整个生命周期都花在寄存器中。
关于optimization - 帧指针优化的使用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23528816/
比较代码: const char x = 'a'; std::cout > (0C310B0h) 00C3100B add esp,4 和 const i
您好,我正在使用 Matlab 优化求解器,但程序有问题。我收到此消息 fmincon 已停止,因为目标函数值小于目标函数限制的默认值,并且约束满足在约束容差的默认值范围内。我也收到以下消息。警告:矩
处理Visual Studio optimizations的问题为我节省了大量启动和使用它的时间 当我必须进行 J2EE 开发时,我很难回到 Eclipse。因此,我还想知道人们是否有任何提示或技巧可
情况如下:在我的 Excel 工作表中,有一列包含 1-name 形式的条目。考虑到数字也可以是两位数,我想删除这些数字。这本身不是问题,我让它工作了,只是性能太糟糕了。现在我的程序每个单元格输入大约
这样做有什么区别吗: $(".topHorzNavLink").click(function() { var theHoverContainer = $("#hoverContainer");
这个问题已经有答案了: 已关闭11 年前。 Possible Duplicate: What is the cost of '$(this)'? 我经常在一些开发人员代码中看到$(this)引用同一个
我刚刚结束了一个大型开发项目。我们的时间紧迫,因此很多优化被“推迟”。既然我们已经达到了最后期限,我们将回去尝试优化事情。 我的问题是:优化 jQuery 网站时您要寻找的最重要的东西是什么。或者,我
所以我一直在用 JavaScript 编写游戏(不是网络游戏,而是使用 JavaScript 恰好是脚本语言的游戏引擎)。不幸的是,游戏引擎的 JavaScript 引擎是 SpiderMonkey
这是我在正在构建的页面中使用的 SQL 查询。它目前运行大约 8 秒并返回 12000 条记录,这是正确的,但我想知道您是否可以就如何使其更快提出可能的建议? SELECT DISTINCT Adve
如何优化这个? SELECT e.attr_id, e.sku, a.value FROM product_attr AS e, product_attr_text AS a WHERE e.attr
我正在使用这样的结构来测试是否按下了所需的键: def eventFilter(self, tableView, event): if event.type() == QtCore.QEven
我正在使用 JavaScript 从给定的球员列表中计算出羽毛球 double 比赛的所有组合。每个玩家都与其他人组队。 EG。如果我有以下球员a、b、c、d。它们的组合可以是: a & b V c
我似乎无法弄清楚如何让这个 JS 工作。 scroll function 起作用但不能隐藏。还有没有办法用更少的代码行来做到这一点?我希望 .down-arrow 在 50px 之后 fade out
我的问题是关于用于生产的高级优化级联样式表 (CSS) 文件。 多么最新和最完整(准备在实时元素中使用)的 css 优化器/最小化器,它们不仅提供删除空格和换行符,还提供高级功能,如删除过多的属性、合
我读过这个: 浏览器检索在 中请求的所有资源开始呈现 之前的 HTML 部分.如果您将请求放在 中section 而不是,那么页面呈现和下载资源可以并行发生。您应该从 移动尽可能多的资源请求。
我正在处理一些现有的 C++ 代码,这些代码看起来写得不好,而且调用频率很高。我想知道我是否应该花时间更改它,或者编译器是否已经在优化问题。 我正在使用 Visual Studio 2008。 这是一
我正在尝试使用 OpenGL 渲染 3 个四边形(1 个背景图,2 个 Sprite )。我有以下代码: void GLRenderer::onDrawObjects(long p_dt) {
我确实有以下声明: isEnabled = false; if(foo(arg) && isEnabled) { .... } public boolean foo(arg) { some re
(一)深入浅出理解索引结构 实际上,您可以把索引理解为一种特殊的目录。微软的SQL SERVER提供了两种索引:聚集索引(clustered index,也称聚类索引、簇集索引)和非聚集索引(no
一、写在前面 css的优化方案,之前没有提及,所以接下来进行总结一下。 二、具体优化方案 2.1、加载性能 1、css压缩:将写好的css进行打包,可以减少很多的体积。 2、css单一样式:在需要下边
我是一名优秀的程序员,十分优秀!