- mongodb - 在 MongoDB mapreduce 中,如何展平值对象?
- javascript - 对象传播与 Object.assign
- html - 输入类型 ="submit"Vs 按钮标签它们可以互换吗?
- sql - 使用 MongoDB 而不是 MS SQL Server 的优缺点
我严重怀疑 C# 或 .NET JIT 编译器是否执行任何有用的优化,更不用说它们是否真的与 C++ 编译器中最基本的竞争。
考虑一下这个极其简单的程序,我很方便地把它做成在 C++ 和 C# 中都有效:
#if __cplusplus
#else
static class Program
{
#endif
static void Rem()
{
for (int i = 0; i < 1 << 30; i++) ;
}
#if __cplusplus
int main()
#else
static void Main()
#endif
{
for (int i = 0; i < 1 << 30; i++)
Rem();
}
#if __cplusplus
#else
}
#endif
当我在最新版本的 C# (VS 2013) 中以 Release模式编译和运行它时,它不会在任何合理的时间内终止。
编辑:这是另一个例子:
static class Program
{
private static void Test2() { }
private static void Test1()
{
#if TEST
Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2();
Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2();
Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2();
Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2();
Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2();
Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2();
Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2();
#else
Test2();
#endif
}
static void Main()
{
for (int i = 0; i < 0x7FFFFFFF; i++)
Test1();
}
}
当我运行这个时,如果 TEST
被定义,它需要 很多 更长的时间,即使一切都是空操作和 Test2
应该内联。
即使是最古老的 C++ 编译器我也能掌握,但是,优化一切,让程序立即返回。
最佳答案
.NET JIT 是一个糟糕的编译器,这是事实。幸运的是,一个新的 JIT (RyuJIT) 和一个似乎基于 VC 编译器的 NGEN 正在开发中(我相信这是 Windows Phone cloud compiler 使用的)。
虽然它是一个非常简单的编译器,但它确实内联小函数并在一定程度上消除了无副作用的循环。这一切都不好,但它确实发生了。
在我们进入详细调查结果之前,请注意 x86 和 x64 JIT 是不同的代码库,执行方式不同并且存在不同的错误。
您在 32 位模式下以 Release模式运行程序。我可以在 .NET 4.5 上以 32 位模式重现您的发现。是的,这很尴尬。
但在 64 位模式下,第一个示例中的 Rem
是内联的,并且两个嵌套循环的最内层被移除:
我已经标记了三个循环指令。外环还在。我认为这在实践中并不重要,因为您很少有两个嵌套的死循环。
注意,循环展开了 4 次,然后展开的迭代被折叠成一个迭代(展开产生 i += 1; i+= 1; i+= 1; i+= 1;
并被折叠为 i += 4;
)。当然,可以优化整个循环,但 JIT 确实执行了实践中最重要的事情:展开循环和简化代码。
我还在 Main
中添加了以下内容,以便于调试:
Console.WriteLine(IntPtr.Size); //verify bitness
Debugger.Break(); //attach debugger
我无法在 32 位或 64 位模式下完全重现您的发现。在所有情况下,Test2
都内联到 Test1
中,使其成为一个非常简单的函数:
Main
在循环中调用 Test1
因为 Test1
太大而无法内联(因为非简化的大小很重要,因为方法是 JIT'单独编辑)。
如果在 Test1
中只有一个 Test2
调用,那么这两个函数都足够小,可以内联。这使 Main
的 JIT 能够发现在该代码中根本没有做任何事情。
最终答案:我希望我能对正在发生的事情有所了解。在这个过程中,我确实发现了一些重要的优化。 JIT 只是不是很彻底和完整。如果相同的优化只是在第二次相同的传递中执行,那么这里可以简化更多。但是大多数程序只需要一次通过所有的简化器。我同意 JIT 团队在这里所做的选择。
那么,为什么 JIT 如此糟糕?一方面是它必须很快,因为 JITing 对延迟敏感。另一部分是它只是一个原始的JIT,需要更多的投资。
关于C# 与 C++ 的性能——为什么 .NET 不执行最基本的优化(如死代码消除)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20394115/
我编写了一些运行速度很慢的 VBA 代码。我的代码中有一系列不同的循环。我知道循环并不总是处理数据的最有效方式,所以我认为它们是问题所在。我需要有关如何更改或消除循环的想法,以便加快代码的运行时间。
我目前有一个网址:http://testsite.local/search/?q=findme一旦有人查询,我的搜索页面。我使用 mod_rewrite 重写了一些页面,想知道是否可以将其变成一个不错
有人可以帮助我执行一个查询,其中查询的重复元素被删除 Select * from table where APPNAME = 'Ap1' or APPNAME= 'Ap2' 使用 DISTINCT 的
我正在尝试在 ubuntu 上使用以下命令在一个文件夹中查找文件并通过 FFmpeg 提供并输出到另一个文件夹。问题是当它处理输出路径和文件名时,它添加了一个 .像这样的路径:/conversions
这个问题在这里已经有了答案: How can I remove all duplicates so that NONE are left in a data frame? (3 个答案) 关闭 1
我想证明以下定理: Theorem Frobenius (A: Set) (q: Prop) (p: A -> Prop) : (q \/ forall x : A, p x) -> (foral
我有一个 PHP 脚本,它只需要一些数据,将其分隔为制表符分隔格式,将其保存为 .xls 文件,然后为用户提供下载链接。 大多数情况下运行良好,但有些人正在获取导出的 .xls 文件的缓存版本。 我想
我有一个看起来有点像这个可重现代码的数据框,我想删除每列的异常值(在我们的例子中,数据点低于或高于平均值 2.5 个标准偏差)而不删除整个主题/行。 Subj mn + sd * 2.5) | (x
我正在尝试编写一个实现 fmap 的演示。在 Haskell 中与 continuation ,我的代码如下所示: #include #include template using Callba
在此 HighCharts例如,如何消除 xaxis 开始位置与 Jan 的刻度位置之间的差距。 http://jsfiddle.net/gh/get/jquery/1.7.2/highslide-s
重现步骤: 将TPanel添加到新的VCL表单并设置Align = alClient。 将 TSpeedButton 添加到面板,并将一些 bmp 图像分配给 Glyph 属性。 (可选,但更清晰:F
我得到一个 JavaScript 数组,其中包含一定数量(未指定)的各种元素(字符串、数字、 bool 值)。我需要消除字符串和 bool 值。我应该如何处理它?我应该使用typeof吗? 最佳答案
我正在寻找一个公式,可以消除字符串中空格后的空格和无用字符。 我的第一 react 是执行以下操作:=LEFT(A1,FIND("",A1)) 它适用于所有有空格的情况 但是如果单元格中没有空格,我的
我有以下问题:我正在尝试编写一个 Javascript 游戏,并且 Angular 色由箭头键控制。 问题是,当一个人按住按键时,在触发第一个按键和重复的按键之间存在短暂的延迟。 另外,当按下“向右箭
让我们考虑一个集合的集合,以及需要在管道内对内部集合的每个元素执行的操作。 为了简单起见,让它成为一个数组数组,操作简单的打印到屏幕上。为了表达我的问题,让我们还有一个元素不是集合的数组: $Arra
跟进this question关于包含源文件。我包括一个 Chapel 模块,其中包含一个名为 classes.chpl 的文件。 ,但我当前的项目也有一个 classes.chpl 。正确的消歧模式
我想知道如何在英特尔语法中的某些指令中区分标签名称和寄存器名称。例如,call rdx通常意味着间接跳转,但是如果我们在同一个汇编文件中有一个标签rdx怎么办?我相信它可以被解释为直接跳转到 rdx
据我了解,Chrome 会异步运行整个程序,这会导致我的扩展程序在单击后大约 2 秒后打开。有没有办法强制扩展程序显示带有“正在加载”消息的 html 页面,然后完成加载 javascript 并用内
我正在将 CSV 加载到 sqlite 数据库,如下所示: sqlite3 /path/to/output.db /dev/null 或者,您可以自己生成 SQL 命令,以便可以使用 INSERT 或
我的 .cabal 文件的许多节中经常有类似的属性。例如 Library x ... ghc-options: -O2 -Wall -fno-warn-missing-s
我是一名优秀的程序员,十分优秀!