在获得 Lambda 的最佳值后,我正在尝试套索回归,现在问题是,我想获得系数(权重向量),因为我想将它们与岭回归的权重进行比较。
lasso = Lasso(alpha=optimal_lmbda, fit_intercept=True, random_state=1142, max_iter=5000)
lasso.fit(X_train, y_train)
y_pred_lasso = lasso.predict(X_test)
Run Code Online (Sandbox Code Playgroud)
在Sklearn中的python中拟合套索回归后如何获得系数(权重向量)?
python regression machine-learning linear-regression scikit-learn
我在数据框中有一个带有 DatetimeIndex 的时间序列,如下所示:
import pandas as pd
dates= ["2015-10-01 00:00:00",
"2015-10-01 01:00:00",
"2015-10-01 02:00:00",
"2015-10-01 03:00:00",
"2015-10-01 04:00:00"]
df = pd.DataFrame(index=pd.DatetimeIndex(dates))
df["values"] = range(0,5)
Out[]:
values
2015-10-01 00:00:00 0
2015-10-01 01:00:00 1
2015-10-01 02:00:00 2
2015-10-01 03:00:00 3
2015-10-01 04:00:00 4
Run Code Online (Sandbox Code Playgroud)
我想尽可能简单地清理选择看起来像这样的行,基于日期作为关键,例如“2015-10-01 02:00:00”:
Out[]:
values
2015-10-01 02:00:00 2
Run Code Online (Sandbox Code Playgroud)
简单地使用索引会导致一个关键错误:
df["2015-10-01 02:00:00"]
Out[]:
KeyError: '2015-10-01 02:00:00'
Run Code Online (Sandbox Code Playgroud)
同样这个:
df.loc[["2015-10-01 02:00:00"]]
Out[]:
KeyError: "None of [['2015-10-01 02:00:00']] are in the [index]"
Run Code Online (Sandbox Code Playgroud)
这些令人惊讶的(?)结果是相同的系列,如下所示:
df.loc["2015-10-01 02:00:00"]
Out[]:
values 2
Name: 2015-10-01 02:00:00, dtype: int32
df.loc["2015-10-01 …Run Code Online (Sandbox Code Playgroud)