- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我总是想知道为什么编译器无法弄清楚人眼显而易见的简单事物。他们做了很多简单的优化,但从来没有做过哪怕一点点复杂的优化。例如,此代码在我的计算机上大约需要 6 秒才能打印值零(使用 java 1.6):
int x = 0;
for (int i = 0; i < 100 * 1000 * 1000 * 1000; ++i) {
x += x + x + x + x + x;
}
System.out.println(x);
很明显,x 永远不会改变,所以无论你多久向其自身添加 0,它都保持为零。因此理论上编译器可以用 System.out.println(0) 替换它。
或者更好,这需要 23 秒:
public int slow() {
String s = "x";
for (int i = 0; i < 100000; ++i) {
s += "x";
}
return 10;
}
首先,编译器可能会注意到我实际上正在创建一个 100000“x” 的字符串 s,因此它可以自动使用 s StringBuilder 来代替,或者甚至更好地直接将其替换为结果字符串,因为它始终是相同的。其次,它无法识别我实际上根本没有使用该字符串,因此整个循环可以被丢弃!
为什么在投入如此多的人力开发快速编译器之后,它们仍然如此相对愚蠢?
编辑:当然,这些都是愚蠢的例子,永远不应该在任何地方使用。但是每当我必须将漂亮且非常可读的代码重写为不可读的代码以便编译器满意并生成快速代码时,我想知道为什么编译器或其他一些自动化工具不能为我完成这项工作。
最佳答案
在我看来,老实说,我不认为编译器的工作就是修复错误的编码。您已经非常明确地告诉编译器您希望执行第一个循环。它等同于:
x = 0
sleep 6 // Let's assume this is defined somewhere.
print x
我不希望编译器仅仅因为我的 sleep
语句什么也没做就删除它。您可能会争辩说 sleep 语句是对延迟的明确请求,而您的示例则不是。但随后您将允许编译器对您的代码应该做什么做出非常高级的决定,我认为这是一件坏事。
代码以及处理它的编译器都是工具,如果你想有效地使用它们,你就需要成为一个工具匠。有多少 12 英寸电锯会拒绝尝试砍伐一棵 30 英寸的树?如果检测到混凝土墙,有多少钻头会自动切换到锤模式?
我怀疑没有,这是因为将其设计到产品中的成本一开始就非常可怕。但更重要的是,如果您不知道自己在做什么,就不应该使用钻头或链锯。例如:如果您不知道什么是反冲(对于新手来说,这是一种非常简单的脱掉 ARM 的方法),请远离电锯,直到您了解为止。
我完全赞成允许编译器提出改进建议,但我宁愿自己维护控制权。编译器不应该单方面决定循环是不必要的。
例如,我在嵌入式系统中完成了定时循环,其中 CPU 的时钟速度是准确已知的,但没有可靠的定时设备可用。在这种情况下,您可以精确计算给定循环将花费多长时间,并使用它来控制事情发生的频率。如果编译器(或在这种情况下的汇编器)认为我的循环无用并优化它使其不存在,那么这将不起作用。
话虽如此,让我给您讲一个 VAX FORTRAN 编译器的老故事,该编译器正在进行性能基准测试,结果发现它比最接近的竞争对手快许多个数量级.
事实证明,编译器注意到基准循环的结果没有在其他地方使用,并将循环优化为遗忘。
关于performance - 为什么编译器这么蠢?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/405770/
关闭。这个问题是opinion-based .它目前不接受答案。 想改善这个问题吗?更新问题,以便可以通过 editing this post 用事实和引文回答问题. 8年前关闭。 Improve t
暂时忘记能力的定义,只关注能力的“检查”(使用“授权!”),我看到 CanCan 添加了大约 400 毫秒,用于简单地检查用户是否具有特定的能力主题/模型。 这是预期的吗(我假设不是)?或者,有没有可
我正在阅读有关 Swift 的教程 ( http://www.raywenderlich.com/74438/swift-tutorial-a-quick-start ),它预定义为不显式设置类型,因
这主要是由于对 SQL 问题的回答。由于性能原因,有意省略了 UDF 和子查询。我没有包括可靠性并不是说它应该被视为理所当然,但代码必须工作。 性能永远是第一位的吗?提供了许多以性能为主要优先事项的答
我已经编写了一个简单的测试平台来测量三种阶乘实现的性能:基于循环的,非尾递归的和尾递归的。 Surprisingly to me the worst performant was the loop o
我已将 ui-performance 插件应用到我的应用程序中。不幸的是,在开发模式下运行应用程序时它似乎不起作用。例如,我的 javascript 导入是用“vnull”版本呈现的。 例如 不会
我有一个我操作的 F# 引用(我在各处添加对象池以回收经常创建和删除的短期对象)。我想运行结果报价;现在我使用了 F# PowerPack,它提供了将引用转换为表达式树和委托(delegate)的方法
我正在尝试在 Spark 服务器上运行 SparklyR 库中的机器学习算法。 1 个簇 8 核 24G内存 Ubuntu 16.04 星火2.2 独立配置 1名师傅/2名 worker 每个执行器的
我有一个数据库(准确地说是在 postgres 上运行),具有以下结构: user1 (schema) | - cars (table) - airplanes (table, again) .
我的应用程序在我的 iPad 上运行。但它的表现非常糟糕——我的速度低于 15fps。谁能帮我优化一下? 它基本上是一个轮子(派生自 UIView),包含 12 个按钮(派生自 UIControl)。
在完成“Scala 中的函数式编程原则”@coursera 类(class)第 3 周的作业时,我发现当我实现视频类(class)中所示的函数联合时: override def union(tha
我正在重构我的一个 Controller 以使其成为一项服务,我想知道不将整个服务容器注入(inject)我的 Controller 是否会对性能产生影响。 这样效率更高吗: innova.path.
我有一个要显示的内容很大的文件。例如在显示用户配置文件时, 中的每个 EL 表达式需要一个 userId 作为 bean 的参数,该参数取自 session 上下文。我在 xhtml 文件中将这个 u
我非常了解 mipmapping。我不明白(在硬件/驱动程序级别)是 mipmapping 如何提高应用程序的性能(至少这是经常声称的)。在执行片段着色器之前,驱动程序不知道要访问哪个 mipmap
这个问题在这里已经有了答案: 10年前关闭。 Possible Duplicate: What's the (hidden) cost of lazy val? (Scala) Scala 允许定义惰
一些文章建议现在 build() 包含在 perform() 本身中,而其他人则建议当要链接多个操作时使用 build().perform()一起。 最佳答案 build() 包含在 perform(
Postgres docs说 For best optimization results, you should label your functions with the strictest vol
阅读Zero-cost abstractions看着 Introduction to rust: a low-level language with high-level abstractions我尝
我想在 MQ 服务器上部署 SSL,但我想知道我当前的 CPU 容量是否支持 SSL。 (我没有预算增加 CPU 内核和 MQ PVU 的数量) 我的规范: Windows 2003 服务器 SP2,
因此,我在 Chrome 开发者工具 的性能 选项卡内的时间 部分成功地监控了我的 React Native 应用程序的性能。 突然在应用程序的特定重新加载时,Timings 标签丢失。 我已尝试重置
我是一名优秀的程序员,十分优秀!