小编web*_*ebb的帖子

sklearn 分类器管道所需的“列的有效规范”是什么?

目标:使用 sklearn 基于 int 和基于对象的特征预测结果。

我正在使用来自 Kaggle 的以下数据集:Soccer Dataset

这是我的笔记本:Kaggle Notebook

图书馆

  • scikit-learn == 0.22.1

我创建了一个几乎可以工作的管道:

import pandas as pd
import numpy as np

from sklearn.model_selection import train_test_split
from sklearn.compose import ColumnTransformer
from sklearn.pipeline import Pipeline
from sklearn.impute import SimpleImputer
from sklearn.preprocessing import OneHotEncoder, StandardScaler
from sklearn.ensemble import RandomForestClassifier

# Read the data
df = total_df.copy()

# Remove rows with missing target
df.dropna(axis=0, subset=['result'], inplace=True)

# Separate target from predictors
y = df.result         
X = df.drop(['result'], axis=1) …
Run Code Online (Sandbox Code Playgroud)

python machine-learning python-3.x pandas scikit-learn

2
推荐指数
1
解决办法
1234
查看次数