我试图将几个文件连接成一个主文件.有5个文件具有相同的结构,我可以将每个文件单独读入数据框中,没有任何问题.我甚至手动设置200+变量的列类,而不是让R决定,因为我认为这导致了问题.但是,将任意两个文件附加在一起会导致内存不足.
警告消息:1:在rbind(deparse.level,...)中:达到4043Mb的总分配:请参阅help(memory.size)
所以我做了一些实验:我加入了两个不同的文件1块.这样可行.我加入了一大块文件2到一大块文件1.这很有效.我加入了一大块文件2到原始文件1.这是有效的.
这些文件中的每一个都在200MB以下,所以我不确定我是否应该耗尽内存.如果有人感兴趣,数据来自hearstchallenge.com.竞争已经结束,我们只是将数据用于分析实验(而不是编程!).
有关如何解决此问题的任何建议?
我是R的新手,但我知道它在"大"文件上窒息.我正在尝试读取200MB的数据文件.我已经尝试过csv格式并将其转换为制表符分隔的txt,但在这两种情况下我都会在文件加载之前耗尽我的4GB RAM.
R会使用4GB或内存加载200MB文件是否正常,或者文件是否有问题导致R除了数据之外还会继续读取一堆虚无?