在Int32或UInt32中使用散列位的好方法是什么?

我有一个伪随机数发生器的实现,特别是George Marsaglia的XOR-Shift RNG。 我的实现在这里:

FastRandom.cs

事实certificate,第一个随机样本与种子密切相关,如果你看一下Reinitialise(int seed)方法,这是相当明显的。 这是不好的。 我建议的解决方案是混合种子的位如下:

_x = (uint)( (seed * 2147483647) ^ ((seed <> 48) * 28111) ^ ((seed <> 32) * 69001) ^ ((seed <> 16) * 45083)); 

因此,我通过将种子的位乘以四个素数并将XORing重新形成_x来显着削弱任何相关性。 我还在乘法之前旋转种子的位,以确保不同幅度的位在32位值的整个值范围内混合。

四向旋转似乎在无所事事和每次可能的旋转之间取得了很好的平衡(32)。 素数是“手指在空中” – 足够的幅度和位结构可以使位混乱并将它们“扩展”到整个32位,而不管起始种子如何。

我应该使用更大的素数吗? 是否有一个标准的方法来解决这个问题,或许有更正式的基础? 我试图以最小的CPU开销来做到这一点。

谢谢

===更新===

我决定使用一些质数,其中设置位更好地分布在所有32位上。 结果是我可以省略移位,因为乘法实现了相同的效果(在整个32位范围内的散列位),所以我只需添加四个产品来给出最终的种子……

 _x = (uint)( (seed * 1431655781) + (seed * 1183186591) + (seed * 622729787) + (seed * 338294347)); 

我可能会减少素数/倍数。 两个似乎太少了(我仍然可以在第一个样本中看到模式),三个看起来很好,所以为了安全边缘我做了四个。

===更新2 ===

仅供参考,以上减少到function相当:

 _x = seed * 3575866506U; 

我最初没有发现这一点,当我这样做时,我想知道在计算的不同阶段溢出是否会导致不同的结果。 我相信答案是否定的 – 两个计算总是给出相同的答案。

根据一些研究人员的说法, CrapWow , Crap8和Murmur3是当今最好的非加密哈希算法,它们既快速,简单又具有统计学上的优点。

有关更多信息,请访问Non-Cryptographic Hash Function Zoo 。