我在Amazon EC2上使用RStudio 0.97.320(R 2.15.3).我的数据框有200k行和12列.
我试图用大约1500个参数拟合逻辑回归.
R使用7%的CPU并且具有60 + GB内存并且仍然需要很长时间.
这是代码:
glm.1.2 <- glm(formula = Y ~ factor(X1) * log(X2) * (X3 + X4 * (X5 + I(X5^2)) * (X8 + I(X8^2)) + ((X6 + I(X6^2)) * factor(X7))),
family = binomial(logit), data = df[1:150000,])
Run Code Online (Sandbox Code Playgroud)
有什么建议可以加快这一速度吗?