如何将极坐标数据框与 scikit-learn 一起使用?

Reg*_*Guy 9 python machine-learning scikit-learn python-polars

我无法将极坐标数据帧与 scikitlearn 一起使用进行机器学习训练。

目前,我正在极坐标中进行所有数据帧预处理,并且在模型训练期间,我将其转换为 pandas 数据帧,以便它能够工作。

有没有什么方法可以直接使用 Polars 数据帧进行 ML 训练而不将其更改为 pandas?

rit*_*e46 7

to_numpy您必须在将 a 传递给 sklearn 时调用DataFrame。虽然有时sklearn可以在极坐标上工作,Series但转换为主机库期望的类型仍然是良好的类型卫生。

import polars as pl
from sklearn.linear_model import LinearRegression

data = pl.DataFrame(
    np.random.randn(100, 5)
)

x = data.select([
    pl.all().exclude("column_0"),
])

y = data.select(pl.col("column_0").alias("y"))


x_train = x[:80]
y_train = y[:80]

x_test = x[80:]
y_test = y[80:]


m = LinearRegression()

m.fit(X=x_train.to_numpy(), y=y_train.to_numpy())
m.predict(x_test.to_numpy())
Run Code Online (Sandbox Code Playgroud)