我已经阅读了几个关于R中内存问题的线程,我似乎无法找到解决问题的方法.
我在一个大数据集的几个子集上运行一种LASSO回归.对于某些子集,它运行良好,对于一些较大的子集,它不起作用,类型"无法分配大小为1.6Gb的向量"的错误.错误发生在代码的这一行:
example <- cv.glmnet(x=bigmatrix, y=price, nfolds=3)
Run Code Online (Sandbox Code Playgroud)
它还取决于"bigmatrix"中包含的变量数量.
我试用了R和R64用于Mac和R用于PC但最近在Linux上使用了更快的虚拟机,以为我会避免任何内存问题.它更好但仍有一些限制,即使memory.limit表示"Inf".
无论如何要做这项工作还是我必须在矩阵中删除一些变量或者采用较小的数据子集?
我已经读过R正在寻找一些连续的内存,也许我应该预先分配矩阵?任何的想法 ?