我理解MT的方式是它在2 ^ 32种不同的种子上运行.令我困惑的是Random.new(种子)接受任意大数字,例如Random.new(2 ** 100).
但是,我无法找到(逻辑)碰撞:
Random.new(1).rand(10**5) == Random.new(2**32-1).rand(10**5) => false Random.new(1).rand(10**5) == Random.new(2**32).rand(10**5) => false Random.new(1).rand(10**5) == Random.new(2**32+1).rand(10**5) => false
鉴于我们希望利用MT的最大种子范围,我们希望尽可能多地使用不同的种子,同时仍避免与两种不同的种子发生碰撞,种子范围是如何实现的?
我尝试了解Ruby随机实现中发生的事情,但没有太过分. https://github.com/ruby/ruby/blob/c5e08b764eb342538884b383f0e6428b6faf214b/random.c#L370
解决方法
最容易找到的重复似乎是每2 **(624 * 32),并且可以显示为这样工作:
repeat_every = 2 ** ( 624 * 32 ) start_value = 5024214421 # Try any value r1 = Random.new( start_value ) r2 = Random.new( start_value + repeat_every ) r17 = Random.new( start_value + 17 * repeat_every ) r23 = Random.new( start_value + 23 * repeat_every ) r1.rand == r2.rand # true r17.rand == r23.rand # true
或试试这个:
repeat_every = 2 ** ( 624 * 32 ) start_value = 5024214421 # Try any value r1 = Random.new( start_value ) r2 = Random.new( start_value + repeat_every ) Array.new(10) { r1.rand(100) } # => [84,86,8,58,5,21,79,10,17,50] Array.new(10) { r2.rand(100) } # => [84,50]
重复值与Mersenne Twister的工作原理有关. MT的内部状态是一个由624个32位无符号整数组成的数组.您链接的Ruby源代码将Ruby Fixnum打包成一个数组 – 神奇的命令是
rb_integer_pack( seed,buf,len,sizeof(uint32_t),INTEGER_PACK_LSWORD_FIRST|INTEGER_PACK_NATIVE_BYTE_ORDER );
但是,这不是一件容易理解的事情,它在internal.h中定义,因此只有在使用Ruby解释器本身时才能真正访问它.您无法在普通的C扩展中访问此功能.
然后通过函数init_by_array将打包的整数加载到MT的内部状态.这是一个非常复杂的函数 – 打包的种子值不是字面上写入状态,而是逐项生成状态,添加提供的数组值,使用各种xors,添加和交叉引用之前的值(此处的Ruby源也添加了打包数组的索引位置,注释为“非线性”,我认为这是对标准MT的引用修改之一)
请注意,MT序列的大小小于2 **(624 * 32) – 我在此处显示的repeat_every值一次跳过2个序列,但它最容易找到重复的种子值,因为它很容易看看它如何设置内部状态完全相同(因为种子的数组表示中的前624个项是相同的,这就是以后使用的所有项).其他种子值也将产生相同的内部状态,但该关系是一个复杂的映射,它将19938位空间中的每个整数与另一个整数配对,从而为MT创建相同的状态.