小编Gir*_*ngh的帖子

通过在一个热编码数据上训练的模型预测新值

这可能看起来像一个微不足道的问题。但我在预测模型结果时陷入困境。我的问题是这样的:

我有一个形状为 1000 x 19(目标特征除外)的数据集,但经过一次热编码后它变成了 1000 x 141。由于我在形状为 1000 x 141 的数据上训练了模型,所以我需要形状为 1 x 141 的数据(至少)用于预测。我也知道在 python 中,我可以使用

model.predict(data)
Run Code Online (Sandbox Code Playgroud)

但是,由于我是通过 1 x 19 形状的门户网站从最终用户那里获取数据。现在我很困惑我应该如何进一步根据用户数据进行预测。

如何将形状为 1 x 19 的数据转换为 1 x 141,因为我必须保持与训练/测试数据相同的顺序,这意味着列的顺序不应不同?在这个方向上的任何帮助将不胜感激。

python machine-learning prediction random-forest scikit-learn

2
推荐指数
1
解决办法
1754
查看次数