小编Shu*_*ras的帖子

如何根据mlr3中的指标列和批量训练预测对任务进行子集化?

背景

我正在使用 R 中的 mlr3 包进行建模和预测。我正在处理一个包含测试集和训练集的大数据集。测试集和训练集由指示符列指示(在代码中:test_or_train)。

目标

  1. 使用数据集中的 train_or_test 列指示的训练行对所有学习器进行批量训练。
  2. 使用相应的训练学习器批量预测 test_or_train 列中由“test”指定的行。

代码

  1. 占位符数据集与测试火车指标列。(在实际数据中 train-test split 不是人为的)
  2. 两个任务(在实际代码中任务是不同的,而且还有更多。)
library(readr)
library(mlr3)
library(mlr3learners)
library(mlr3pipelines)
library(reprex)
library(caret)

# Data
urlfile = 'https://raw.githubusercontent.com/shudras/office_data/master/office_data.csv'
data = read_csv(url(urlfile))[-1]

## Create artificial partition to test and train sets
art_part = createDataPartition(data$imdb_rating, list=FALSE)
train = data[art_part,]
test = data[-art_part,]

## Add test-train indicators
train$test_or_train = 'train'
test$test_or_train = 'test'

## Data set that I want to work / am working with
data = rbind(test, train)

# Create …
Run Code Online (Sandbox Code Playgroud)

r machine-learning batch-processing mlr3

2
推荐指数
1
解决办法
161
查看次数

标签 统计

batch-processing ×1

machine-learning ×1

mlr3 ×1

r ×1