在sklearn.utils.shuffle中使用'random_state'参数？

Question

在sklearn.utils.shuffle中使用'random_state'参数？

in shuffle中的random_state参数是sklearn.utils什么？任何人都可以用一些样本解释random_state吗？

Answer 1

该shuffle用于随机混合的基质.以编程方式,使用种子编号生成随机序列.如果使用相同的种子,则保证具有相同的随机序列.该random_state参数允许您将此随机种子提供给sklearn方法.这很有用,因为它允许您为开发和测试目的重现随机性.因此,在该shuffle方法中,如果我random_state对相同的数据集使用相同的,那么我总是保证具有相同的shuffle.请考虑以下示例:

X = np.array([[1., 0.], [2., 1.], [0., 0.]])
X = shuffle(X, random_state=20)

Run Code Online (Sandbox Code Playgroud)

如果这给了我以下输出,

array([[ 0.,  0.],
      [ 2.,  1.],
      [ 1.,  0.]])

Run Code Online (Sandbox Code Playgroud)

现在,我总是保证如果我使用它random_state = 20,我将始终得到完全相同的改组.这对于单元测试尤其有用,您可以在其中获得可重复的结果来断言您正在测试的条件.

希望有所帮助!

归档时间：	9 年，5 月前
查看次数：	5067 次
最近记录：	7 年，6 月前