我正在做一个sklearn家庭作业,我不明白为什么要用训练平均值和sd标准化和标准化测试数据.我怎样才能在Python中实现它?这是我对列车数据的实施:
digits = sklearn.datasets.load_digits()
X= digits.data
Y= digits.target
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.3,train_size=0.7)
std_scale = preprocessing.StandardScaler().fit(X_train)
X_train_std = std_scale.transform(X_train)
#X_test_std=??
Run Code Online (Sandbox Code Playgroud)
对于火车我认为这是正确的,但对于测试?