训练模型(例如线性回归)时,我们可以像火车上的MinMaxScaler一样对测试数据集进行归一化处理。
得到训练有素的模型并使用它进行预测之后,将预测缩减为原始表示。
在python中,有“ inverse_transform”方法。例如:
from sklearn.preprocessing import MinMaxScaler
scalerModel.inverse_transform
from sklearn.preprocessing import MinMaxScaler
data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]]
scaler = MinMaxScaler()
MinMaxScaler(copy=True, feature_range=(0, 1))
print(data)
dataScaled = scaler.fit(data).transform(data)
print(dataScaled)
scaler.inverse_transform(dataScaled)
Run Code Online (Sandbox Code Playgroud)
在火花中有类似的方法吗?
我在Google上搜索了很多,但没有找到答案。谁能给我一些建议?非常感谢你!
machine-learning normalization apache-spark apache-spark-mllib inverse-transform
apache-spark ×1