在插入符号中使用glmnet时出现错误
下面的示例加载库
library(dplyr)
library(caret)
library(C50)
Run Code Online (Sandbox Code Playgroud)
从库C50加载流失数据集
data(churn)
Run Code Online (Sandbox Code Playgroud)
创建x和y变量
churn_x <- subset(churnTest, select= -churn)
churn_y <- churnTest[[20]]
Run Code Online (Sandbox Code Playgroud)
使用createFolds()在churn_y(目标变量)上创建5个CV折叠
myFolds <- createFolds(churn_y, k = 5)
Run Code Online (Sandbox Code Playgroud)
创建trainControl对象:myControl
myControl <- trainControl(
summaryFunction = twoClassSummary,
classProbs = TRUE, # IMPORTANT!
verboseIter = TRUE,
savePredictions = TRUE,
index = myFolds
)
Run Code Online (Sandbox Code Playgroud)
适合glmnet模型:model_glmnet
model_glmnet <- train(
x = churn_x, y = churn_y,
metric = "ROC",
method = "glmnet",
trControl = myControl
)
Run Code Online (Sandbox Code Playgroud)
我收到以下错误
lognet(x,is.sparse,ix,jx,y,权重,偏移量,alpha,nobs,错误::NA / NaN / Inf在外部函数调用中(arg 5)另外:警告消息:在lognet(x,is .sparse,ix,jx,y,权重,偏移量,alpha,nobs:NAS由强制性引入
我已经检查过,并且churn_x变量中没有缺失值
sum(is.na(churn_x))
Run Code Online (Sandbox Code Playgroud)
有人知道答案吗?
我有一个数据框,其中一些列缺少值.有没有办法(使用dplyr)有效地计算缺失的每列的百分比,即NA.想要像colSum等价物.所以我不必单独计算每个列的百分比?