为什么String.GetHashCode()在32位和64位版本的CLR中实现不同?

string.GetHashCode()的32位和64位版本之间的差异背后的技术原因是什么?

更重要的是,为什么64位版本在遇到NUL字符时似乎终止了它的算法? 例如,在64位CLR下运行时,以下表达式都返回true。

"\0123456789".GetHashCode() == "\0987654321".GetHashCode() "\0AAAAAAAAA".GetHashCode() == "\0BBBBBBBBB".GetHashCode() "\0The".GetHashCode() == "\0Game".GetHashCode() 

当我们将这样的字符串用作Dictionary中的键时,这种行为(bug?)表现为性能问题。

这看起来像微软无法解决的已知问题:

正如你所提到的那样,对于某些程序来说这将是一个重大变化(即使它们不应该真的依赖于此),这种风险被认为太高而无法在当前版本中解决这个问题。

我同意这将导致在默认的Dictionary 中导致的冲突率由此膨胀。 如果这会对您的应用程序性能产生负面影响,我建议尝试使用一个带有IEqualityComparer的Dictionary构造函数来解决它,以便您可以提供更合适的GetHashCode实现。 我知道这不是理想的,并希望在未来的.NET Framework版本中修复此问题。

源: Microsoft Connect – String.GetHashCode忽略x64运行时中第一个空字节之外的字符串中的任何字符

Eric lippert 在String的这个Curious属性中有一个很棒的博客

透露好奇的财产