如何在不拆分数据帧的情况下传递不同的数据集进行训练和测试。(Python)?

Viv*_*Viv 5 python linear-regression training-data scikit-learn data-science

我已经解决了多个问题,这些问题有助于将数据帧分为训练和测试,使用 scikit 或不使用 scikit 等。

但我的问题是我有 2 个不同的 csv(来自不同年份的 2 个不同的数据帧)。我想用一个作为火车,另一个作为测试?

对于线性回归/任何模型如何做到这一点?

ski*_*ler 4

  • 单独加载数据集。
  • 确保它们的行和列(功能)格式相同。
  • train集合用于fit模型。
  • 训练后使用该test集合作为predict输出。
# Load the data
train = pd.read_csv('train.csv')
test = pd.read_csv('test.csv')

# Split features and value
# when trying to predict column "target" 
X_train, y_train = train.drop("target"), train["target"]
X_test, y_test = test.drop("target"), test["target"]

# Fit (i.e. train) model
reg = LinearRegression()
reg.fit(X_train, y_train)

# Predict
pred = reg.predict(X_test)

# Score
accuracy = reg.score(X_test, y_test)
Run Code Online (Sandbox Code Playgroud)