让PRNG同意跨软件

Question

让PRNG同意跨软件

我正在调查是否有可能让两组软件就生成的伪随机数序列达成一致.我有兴趣了解所有可能的分歧点,因为我实际上找到了让他们同意的方法.

为什么？我在数据商店工作,使用许多不同的软件包(Stata,R,Python,SAS,可能还有其他软件包).最近通过复制另一种语言的过程对QCing输出感兴趣.对于涉及随机数的任何过程,如果我们可以提供一系列允许两个包同意的步骤("设置此选项"等)将会很有帮助.如果这不可行,我希望能够清楚地说明失败点在哪里.

一个简单的例子:

R和Python的默认随机数生成器都是Mersenne-Twister.我将它们设置为相同的种子并尝试从中进行采样,并查看PRNG的"状态".两个价值都没有达成一致.

R(3.2.3,64位):

set.seed(20160201)
.Random.seed
sample(c(1, 2, 3, 4, 5))

Run Code Online (Sandbox Code Playgroud)

Python(3.5.1,64位):

import random

random.seed(20160201)
random.getstate()
random.sample([1, 2, 3, 4, 5], 5)

Run Code Online (Sandbox Code Playgroud)

Answer 1

Ral*_*ner 1

老问题，但可能对未来的读者有用：正如评论中提到的，您最好的选择是自己实现它并为不同的环境提供接口，以便对于给定的种子返回相同的结果。为什么有必要？您使用“采样”作为示例。涉及几个步骤。

播种是一个不平凡的过程。例如，R 甚至进一步打乱所提供的种子。因此，除非您的用户工具使用相同的方法，否则即使用户提供相同的值，它们最终也会得到不同的种子。
实际的 RNG：即使在这两种情况下都可能使用 Mersenne-Twister，但它真的是相同的版本吗？R 使用 32 位 MT。也许 Python 使用 64 位版本？
大多数 RNG 为您提供无符号整数（现在通常为 32 或 64 位）。但是您将需要一些随机数的分布，例如，为了采样，您需要给定范围内的随机整数。有很多方法可以将 RNG 生成的整数转换为采样所需的整数。对于 R，您甚至无法访问 RNG 的输出值。最基本的函数是R_unif返回 [0, 1) 中的双精度值。同样，如何生成这样的双精度数并没有得到普遍同意。如果您需要其他分布函数（正态、指数等），您会发现很多不同的算法。

总体而言，在很多地方都可能出现（微妙的）差异。

归档时间：	9 年，9 月前
查看次数：	89 次
最近记录：	7 年，2 月前