我正在使用R进行一些数据分析.系统规格:i5 + 4GB RAM.出于某种原因,我的R会话占用了比我的数据大得多的RAM,这让我只有很少的空间用于其他操作.
我读了一个550MB的csv文件,R占用的内存:1.3 - 1.5GB 我把csv保存为.RData文件.文件大小:183MB.在R中加载文件,R占用的内存:780MB.知道为什么会发生这种情况以及如何解决这个问题?
编辑:该文件有123列和1190387行.变量是类型num和int.
我必须找到2个变量组合的明显计数.我使用以下2个查询来查找计数:
select count(*) from
( select V1, V2
from table1
group by 1,2
) a
Run Code Online (Sandbox Code Playgroud)
select count(distinct catx('-', V1, V2))
from table1
Run Code Online (Sandbox Code Playgroud)
从逻辑上讲,上述两个查询都应该给出相同的计数,但我得到的计数不同.注意
知道为什么我会得到不同的输出吗?哪个是查找2列或更多列的不同组合计数的最佳方法?
谢谢.