当期望1d阵列时,传递列向量y

Kla*_*sos 78 python numpy pandas scikit-learn

我需要适应RandomForestRegressorsklearn.ensemble.

forest = ensemble.RandomForestRegressor(**RF_tuned_parameters)
model = forest.fit(train_fold, train_y)
yhat = model.predict(test_fold)
Run Code Online (Sandbox Code Playgroud)

这段代码一直有效,直到我对data(train_y)进行了一些预处理.错误消息说:

DataConversionWarning:当期望1d数组时传递列向量y.请将y的形状更改为(n_samples,),例如使用ravel().

model = forest.fit(train_fold,train_y)

以前train_y是一个系列,现在它是numpy数组(它是一个列向量).如果我应用train_y.ravel(),那么它变成行向量并且没有出现错误消息,通过预测步骤需要很长时间(实际上它永远不会完成......).

RandomForestRegressor我发现的文档中train_y应该定义为y : array-like, shape = [n_samples] or [n_samples, n_outputs] 任何想法如何解决这个问题?

小智 124

改变这一行:

model = forest.fit(train_fold, train_y)
Run Code Online (Sandbox Code Playgroud)

至:

model = forest.fit(train_fold, train_y.values.ravel())
Run Code Online (Sandbox Code Playgroud)

  • 有人可能会解释它实际发生的变化. (29认同)
  • @ rahulParashar`ravel()`的作用是:当你有`y.shape ==(10,1)`时,使用`y.ravel().shape ==(10,)`.用语言来说......它会使数组变平. (11认同)
  • AttributeError: 'numpy.ndarray' 对象没有属性 'values' (8认同)
  • 如果你有一个numpy.ndarray,那么请改用train_y.ravel(). (6认同)
  • 这甚至是一个有用的警告吗? (6认同)

小智 16

当我试图训练一个KNN分类器时,我也遇到过这种情况.但似乎在我改变后警告消失了:
knn.fit(X_train,y_train)

knn.fit(X_train, np.ravel(y_train,order='C'))

在我使用的这条线之前import numpy as np.


Cor*_*ral 9

使用下面的代码:

model = forest.fit(train_fold, train_y.ravel())
Run Code Online (Sandbox Code Playgroud)

如果你仍然因为错误而得到以下相同的打击?

Unknown label type: %r" % y
Run Code Online (Sandbox Code Playgroud)

使用此代码:

y = train_y.ravel()
train_y = np.array(y).astype(int)
model = forest.fit(train_fold, train_y)
Run Code Online (Sandbox Code Playgroud)


moh*_*mlo 9

我有同样的问题。问题在于标签是按列格式的,而它却希望连续显示。使用np.ravel()

knn.score(training_set, np.ravel(training_labels))
Run Code Online (Sandbox Code Playgroud)

希望这能解决。


小智 5

Y = y.values[:,0]

Y - formated_train_y

y - train_y
Run Code Online (Sandbox Code Playgroud)