如何在数据集上使用RWeka包?

Sak*_*ora 2 id3 r rweka c4.5

因此,我在线生成了一个随机数据集,我需要对其应用C4.5算法。
我安装了RWeka软件包及其所有依赖项,但我不知道如何执行它。
有人可以帮我链接到教程吗?除了RWeka文档。还是R中的示例C4.5代码了解其工作原理?
谢谢

Dun*_*ief 5

我认为您值得花时间检查一下caret包裹。它标准化了R中大多数机器学习包的语法,包括RWeka

他们的网站上,它还具有大量非常有用的帮助程序功能和出色的教程

这是使用RWeka带有类似C4.5的树的软件包在虹膜数据集上预测物种的语法:

library(caret)
train_rows <- createDataPartition(iris$Species, list=FALSE)
train_set <- iris[train_rows, ]
test_set <- iris[-train_rows, ]

fit.rweka <- train(Species ~ ., data=train_set, method='J48')
pred <- predict(fit.rweka, newdata=test_set)
Run Code Online (Sandbox Code Playgroud)

然后,如果您想尝试梯度提升机或其他算法,只需更改为 method='gbm'