小编dav*_*olo的帖子

R 的随机森林无法分配大小为 7.5 Gb 的向量

我有一个数据集(df),包含 10000 条推文和 2 个观察结果(正文和标签);前 4000 条推文带有标签(正面或负面),我想将其用作训练集,以根据文本正文预测其余推文的标签,进行测试。我想使用随机森林算法来预测(插入符包)和交叉验证以确定准确性。我用了这个脚本:

training <- subset(df[1:4000,])
testing  <- subset(df[4001:10000,])

fitControl1 <- trainControl(method = "repeatedcv",
                       number = 10,
                       repeats = 10)

rfFit <- train(training$label~ training$body, data = training, 
             method = "rf", 
             trControl = fitControl,
             verbose = FALSE)
Run Code Online (Sandbox Code Playgroud)

但这是控制台的错误

Error: cannot allocate vector of size 7.5 Gb
Run Code Online (Sandbox Code Playgroud)

我该如何修复它?提前致谢

r machine-learning random-forest

2
推荐指数
1
解决办法
9963
查看次数

标签 统计

machine-learning ×1

r ×1

random-forest ×1