我想要一个可以生成伪随机值序列的函数,但是每次运行时该序列都是可重复的.我想要的数据必须在给定范围内相当好地随机分布,它不一定是完美的.
我想编写一些基于随机数据运行性能测试的代码.我希望每台机器上的每次测试运行的数据都是相同的,但我不希望出于存储原因而将测试随机数据发送出去(最终可能会导致很多兆字节).
该random模块的库似乎并不表示相同的种子将始终在任何计算机上提供相同的序列.
编辑:如果您打算建议我播种数据(如上所述),请提供说明该方法有效的文档,并将适用于一系列机器/实现.
编辑:Mac OS X上的CPython 2.7.1和PyPy 1.7以及CPython 2.7.1和CPython 2.52 = .2 Ubuntu似乎给出了相同的结果.尽管如此,还没有任何文件以黑白方式规定这一点.
有任何想法吗?
是否有任何内置的方法来获得scikit-学习执行混乱的分层k-fold交叉验证?这是最常见的CV方法之一,我很惊讶我找不到这样做的内置方法.
我看到它cross_validation.KFold()有一个拖曳的旗帜,但它没有分层.不幸的cross_validation.StratifiedKFold()是没有这样的选择,并且cross_validation.StratifiedShuffleSplit()不会产生不相交的折叠.
我错过了什么吗?这是计划好的吗?
(显然我可以自己实现)