小编Mac*_*ook的帖子

在R中加载/读取数据会占用太多内存

我正在使用R进行一些数据分析.系统规格:i5 + 4GB RAM.出于某种原因,我的R会话占用了比我的数据大得多的RAM,这让我只有很少的空间用于其他操作.

我读了一个550MB的csv文件,R占用的内存:1.3 - 1.5GB 我把csv保存为.RData文件.文件大小:183MB.在R中加载文件,R占用的内存:780MB.知道为什么会发生这种情况以及如何解决这个问题?

编辑:该文件有123列和1190387行.变量是类型numint.

r

5
推荐指数
2
解决办法
9791
查看次数

GROUP BY和catx计算2列,给出不同的输出

我必须找到2个变量组合的明显计数.我使用以下2个查询来查找计数:

select count(*) from 
(   select V1, V2 
    from table1
    group by 1,2
) a
Run Code Online (Sandbox Code Playgroud)

select count(distinct catx('-', V1, V2)) 
from table1
Run Code Online (Sandbox Code Playgroud)

从逻辑上讲,上述两个查询都应该给出相同的计数,但我得到的计数不同.注意

  • V1和V2都是整数
  • 两个变量都可以有空值,但我的表中没有空值
  • 没有负面价值

知道为什么我会得到不同的输出吗?哪个是查找2列或更多列的不同组合计数的最佳方法?

谢谢.

sql sas

3
推荐指数
1
解决办法
2175
查看次数

标签 统计

r ×1

sas ×1

sql ×1