R - 与神经网络的整体?

Beg*_*ons 5 r neural-network

这是我的data.frame的一个小样本

    naiveBayesPrediction knnPred5 knnPred10 dectreePrediction logressionPrediction correctClass
1                non-bob        2         2           non-bob    0.687969711847463            1
2                non-bob        2         2           non-bob     0.85851872253358            1
3                non-bob        1         1           non-bob    0.500470892627383            1
4                non-bob        1         1           non-bob     0.77762739066215            1
5                non-bob        1         2           non-bob    0.556431439357365            1
6                non-bob        1         2           non-bob    0.604868385598237            1
7                non-bob        2         2           non-bob    0.554624186182919            1
Run Code Online (Sandbox Code Playgroud)

我考虑了一切

   'data.frame':    505 obs. of  6 variables:
     $ naiveBayesPrediction: Factor w/ 2 levels "bob","non-bob": 2 2 2 2 2 2 2 2 2 2 ...
     $ knnPred5            : Factor w/ 2 levels "1","2": 2 2 1 1 1 1 2 1 2 1 ...
     $ knnPred10           : Factor w/ 2 levels "1","2": 2 2 1 1 2 2 2 1 2 2 ...
     $ dectreePrediction   : Factor w/ 1 level "non-bob": 1 1 1 1 1 1 1 1 1 1 ...
     $ logressionPrediction: Factor w/ 505 levels "0.205412826873861",..: 251 415 48 354 92 145 90 123 28 491 ...
     $ correctClass        : Factor w/ 2 levels "1","2": 1 1 1 1 1 1 1 1 1 1 ...
Run Code Online (Sandbox Code Playgroud)

然后我尝试使用神经网络进行整合

ensembleModel <- neuralnet(correctClass ~ naiveBayesPrediction + knnPred5 + knnPred10 + dectreePrediction + logressionPrediction, data=allClassifiers[ensembleTrainSample,])
Run Code Online (Sandbox Code Playgroud)

神经元[[i]]%*%权重[[i]]中的错误:需要数字/复杂矩阵/向量参数

然后我试着放入一个矩阵

m <- model.matrix( correctClass ~ naiveBayesPrediction + knnPred5 + knnPred10 + dectreePrediction + logressionPrediction, data = allClassifiers )
Run Code Online (Sandbox Code Playgroud)

误差在contrasts<-(*tmp*,值= contr.funs [1 + ISOF [NN]]):
对比度可以只应用于因素有2倍或更多的水平

我认为它必须与一个功能"decistreePrediction"只有一个级别有关,但它只找到2个可能结果中的一个级别(bob或非bob)所以我不知道从那里去哪里.

cde*_*man 3

neuralnet函数要求“变量”为numericcomplex值,因为它正在执行需要numericcomplex参数的矩阵乘法。返回的错误中这一点非常清楚:

Error in neurons[[i]] %*% weights[[i]] : 
  requires numeric/complex matrix/vector arguments
Run Code Online (Sandbox Code Playgroud)

下面的小例子也反映了这一点。

mat <- matrix(sample(c(1,0), 9, replace=TRUE), 3)
fmat <- mat
mode(fmat) <- "character"

# no error
mat %*% mat

# error
fmat %*% fmat
Error in fmat %*% fmat : requires numeric/complex matrix/vector arguments
Run Code Online (Sandbox Code Playgroud)

作为实际功能的快速演示,我将使用infert在包中用作演示的数据集。

library(neuralnet)
data(infert)

# error
net.infert <- neuralnet(case~as.factor(parity)+induced+spontaneous, infert)
Error in neurons[[i]] %*% weights[[i]] : 
  requires numeric/complex matrix/vector arguments

# no error
net.infert <- neuralnet(case~parity+induced+spontaneous, infert)
Run Code Online (Sandbox Code Playgroud)

您可以保留correctClass为 a factor,因为无论如何它都会转换为虚拟数值变量,但最好也将其转换为相应的二进制表示形式。

我给你的建议是:

  1. 将您的因子转换为相应的二进制表示形式(即 0 和 1)
  2. 保留logressionPrediction为数字
  3. 省略只有 1 值的变量。包含这些变量是完全多余的,因为用它们无法完成学习。