这是我的问题的一个例子
library(RWeka)
iris <- read.arff("iris.arff")
Run Code Online (Sandbox Code Playgroud)
执行nfolds以获得分类器的正确准确度.
m<-J48(class~., data=iris)
e<-evaluate_Weka_classifier(m,numFolds = 5)
summary(e)
Run Code Online (Sandbox Code Playgroud)
这里提供的结果是通过使用部分数据集构建模型并使用另一部分进行测试获得的,因此可以提供准确的精度
现在我执行AdaBoost来优化分类器的参数
m2 <- AdaBoostM1(class ~. , data = temp ,control = Weka_control(W = list(J48, M = 30)))
summary(m2)
Run Code Online (Sandbox Code Playgroud)
这里提供的结果是通过使用相同的数据集来构建模型以及用于评估模型的相同数据集获得的,因此精度不能代表我们使用模型评估其他实例的实际精度.然而,此过程有助于优化构建的模型.
主要问题是我无法优化构建的模型,同时使用未用于构建模型的数据对其进行测试,或者仅使用nfold验证方法来获得正确的精度.
在R或python中是否存在通用/自动方式来解析具有其节点和属性的xml文件,自动生成用于存储该信息的mysql表,然后填充这些表.