在sklearn.utils.shuffle中使用'random_state'参数?

Tav*_*oli 2 python shuffle scikit-learn

in shuffle中的random_state参数是sklearn.utils什么?任何人都可以用一些样本解释random_state吗?

小智 7

shuffle用于随机混合的基质.以编程方式,使用种子编号生成随机序列.如果使用相同的种子,则保证具有相同的随机序列.该random_state参数允许您将此随机种子提供给sklearn方法.这很有用,因为它允许您为开发和测试目的重现随机性.因此,在该shuffle方法中,如果我random_state对相同的数据集使用相同的,那么我总是保证具有相同的shuffle.请考虑以下示例:

X = np.array([[1., 0.], [2., 1.], [0., 0.]])
X = shuffle(X, random_state=20)
Run Code Online (Sandbox Code Playgroud)

如果这给了我以下输出,

array([[ 0.,  0.],
      [ 2.,  1.],
      [ 1.,  0.]])
Run Code Online (Sandbox Code Playgroud)

现在,我总是保证如果我使用它random_state = 20,我将始终得到完全相同的改组.这对于单元测试尤其有用,您可以在其中获得可重复的结果来断言您正在测试的条件.

希望有所帮助!