我通过不同情景下的线性回归的一些实例工作,使用比较结果Normalizer和StandardScaler,结果是令人费解.
我正在使用波士顿住房数据集,并以这种方式准备:
import numpy as np
import pandas as pd
from sklearn.datasets import load_boston
from sklearn.preprocessing import Normalizer
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LinearRegression
#load the data
df = pd.DataFrame(boston.data)
df.columns = boston.feature_names
df['PRICE'] = boston.target
Run Code Online (Sandbox Code Playgroud)
我目前正试图推断我从以下场景得到的结果:
normalize=Truevs using 初始化线性回归Normalizerfit_intercept = False带有和不带标准化的参数初始化线性回归.总的来说,我发现结果令人困惑.
这是我如何设置一切:
# Prep the data
X = df.iloc[:, :-1]
y = df.iloc[:, -1:]
normal_X = Normalizer().fit_transform(X)
scaled_X = StandardScaler().fit_transform(X)
#now prepare some of the models …Run Code Online (Sandbox Code Playgroud)