C＃与C ++性能 – 为什么.NET不执行最基本的优化（如死代码消除）？

我非常怀疑C＃或.NET JIT编译器是否执行任何有用的优化，更不用说如果它们实际上与C ++编译器中最基本的编译器竞争。

考虑这个非常简单的程序，我方便地在C ++和C＃中都有效：

#if __cplusplus #else static class Program { #endif static void Rem() { for (int i = 0; i < 1 << 30; i++) ; } #if __cplusplus int main() #else static void Main() #endif { for (int i = 0; i < 1 << 30; i++) Rem(); } #if __cplusplus #else } #endif

当我在发布模式下在最新版本的C＃（VS 2013）中编译并运行它时，它不会在任何合理的时间内终止。

编辑：这是另一个例子：

 static class Program { private static void Test2() { } private static void Test1() { #if TEST Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); Test2(); #else Test2(); #endif } static void Main() { for (int i = 0; i < 0x7FFFFFFF; i++) Test1(); } }

当我运行这个时，如果定义了TEST ，则需要更长的时间，即使所有内容都是无操作且应该内联Test2 。

然而，即使是我能掌握的最古老的C ++编译器 ，也可以优化所有内容，使程序立即返回。

什么阻止.NET JIT优化器能够进行这样简单的优化？为什么？

.NET JIT是一个糟糕的编译器，这是事实。幸运的是，一个新的JIT（ RyuJIT ）和一个似乎基于VC编译器的NGEN正在开发中（我相信这是Windows Phone云编译器使用的）。

虽然它是一个非常简单的编译器，它可以内联小函数并在一定程度上消除无副作用的循环。它并不是很好，但它发生了。

在我们进入详细的调查结果之前，请注意x86和x64 JIT是不同的代码库，执行方式不同并且有不同的错误。

测试1：

您以32位模式在发布模式下运行程序。我可以使用32位模式在.NET 4.5上重现您的发现。是的，这很尴尬。

但是在64位模式下，第一个示例中的Rem是内联的，并且删除了两个嵌套循环的最里面：

在此处输入图像描述

我已经标记了三个循环指令。外环仍在那里。我认为这在实践中并不重要，因为你很少有两个嵌套的死循环。

注意，循环展开4次，然后展开的迭代折叠成单次迭代（展开生成i += 1; i+= 1; i+= 1; i+= 1;并且折叠为i += 4; ）。当然，整个循环可以被优化掉，但JIT确实执行了实践中最重要的事情：展开循环和简化代码。

我还在Main添加了以下内容，以便于调试：

  Console.WriteLine(IntPtr.Size); //verify bitness Debugger.Break(); //attach debugger

测试2：

我无法在32位或64位模式下完全重现您的发现。在所有情况下， Test2都内联到Test1使其成为一个非常简单的function：

在此处输入图像描述

Main在循环中调用Test1 ，因为Test1太大而不能内联（因为非简化的大小很重要，因为方法是单独JIT的）。

当你在Test1只有一个Test2调用时，这两个函数都足够小，无法内联。这使得JIT for Main能够发现该代码中根本没有进行任何操作。

最后的答案：我希望我能够了解正在发生的事情。在这个过程中，我确实发现了一些重要的优化。 JIT不是很彻底和完整。如果在第二次智能传递中仅执行相同的优化，则可以在此处简化更多优化。但是大多数程序只需要通过所有简化器。我同意JIT团队在这里做出的选择。

那么为什么JIT如此糟糕？一部分是它必须快速，因为JITing对延迟敏感。另一部分是它只是一个原始的JIT，需要更多的投资。

C＃与C ++性能 – 为什么.NET不执行最基本的优化（如死代码消除）？

什么阻止.NET JIT优化器能够进行这样简单的优化？为什么？

如果我可以定义一个GetEnumerator，为什么要实现IEnumerable（T）？

自托管WCF服务的多个实例

协变对象初始化器？

如何为列添加值并更新数据库

异步编程APM与EAP

用于字母和空格的.NET RegEx

Windows 7风格的Dropshadow采用无边框forms

File.WriteAllText不保留换行符

‘ServiceCollection’不包含’AddSingleton’的定义

有没有办法将app / web.config分成2个文件？

C＃与C ++性能 – 为什么.NET不执行最基本的优化（如死代码消除）？

什么阻止.NET JIT优化器能够进行这样简单的优化？ 为什么？

如果我可以定义一个GetEnumerator，为什么要实现IEnumerable（T）？

自托管WCF服务的多个实例

协变对象初始化器？

如何为列添加值并更新数据库

异步编程APM与EAP

用于字母和空格的.NET RegEx

Windows 7风格的Dropshadow采用无边框forms

File.WriteAllText不保留换行符

‘ServiceCollection’不包含’AddSingleton’的定义

有没有办法将app / web.config分成2个文件？

什么阻止.NET JIT优化器能够进行这样简单的优化？为什么？